Свързани публикации 'exploratory-data-analysis'
Прогнозиране на времеви серии на стойностите на консумацията на енергия с помощта на машинно обучение
Цел на този проект е да предскаже стойностите на потреблението на енергия в град Тетуан в Мароко
Тетуан е град, разположен в Северно централно Мароко, недалеч от Средиземно море (7 мили). Събрах набора от данни от https://archive.ics.uci.edu/ml/datasets/Power+consumption+of+Tetouan+city и се опитах да предскажа стойностите на консумацията на енергия на определена зона за период от време с помощта на различни алгоритми за машинно обучение . Тук използвах базирани на регресия..
Проучвателен анализ на данни (EDA): Техники и най-добри практики | Картек Маханкали
Въведение
Проучвателният анализ на данни (EDA) е решаваща стъпка в процеса на анализ на данни, която ни помага да придобием прозрения, да открием модели и да разберем основната структура на нашите данни. Независимо дали сте учен по данни, анализатор или бизнес професионалист, EDA играе ключова роля при вземането на информирани решения и извличането на ценна информация от вашите набори от данни. В тази статия ще разгледаме основните техники и най-добрите практики на EDA, като я запазим..
Пълно ръководство за машинно обучение с проекти в Python | EDA към алгоритми
Въведение
Полето на машинното обучение се разширява бързо и има потенциала напълно да промени начина, по който подхождаме към решаването на проблеми в различни индустрии. Въпреки това, предвид количеството достъпен материал по темата, може да е предизвикателство да знаете откъде да започнете или как да отидете, за да придобиете познания в тази област. За да разгледаме всички тези теми, включително проучвателен анализ на данни (EDA), инженерство на функции, статистическо моделиране и..
Визуализирайте, за да реализирате: Използване на EDA за ефективно машинно обучение
Изграждане на многовариантна регресия от нулата с PyTorch и визуализиране на прогноза в 3D с PCA
Готови ли сте за дълбоко гмуркане във вълнуващото царство на интерпретацията на данни? 📊 Днес многовариантната регресия е в менюто. Звучи сложно? Е, докато приключим, ще се чувстваме като разходка в парка 🌳🚶♂️
Ще разгледаме как да обучим модел на многовариантна линейна регресия, като демистифицираме тези сложни математически уравнения и ги трансформираме в прости, разбираеми концепции...
Sweetviz: EDA в 2 реда код на Python
Преглед и внедряване на библиотеката Sweetviz
Проучвателният анализ на данни ( EDA ) е подход за анализиране на данните и обобщаване на основните им характеристики, често с визуални методи. Специалистът по данни прекарва по-голямата част от времето в разбиране на данни и получаване на прозрения. EDA е важна и отнемаща време стъпка в тръбопровода за машинно обучение от край до край.
EDA включва много стъпки, включително някои статистически тестове, количествени тестове, визуализация..
Ръководство за работа с липсващи стойности в Data Science
Тайните на науката за данните
Ръководство за работа с липсващи стойности в Data Science
Кога да използвате импутация и интерполация
Липсващите стойности са ахилесовата пета за специалиста по данни. Ако не се третира правилно, целият анализ ще бъде безполезен и ще предостави подвеждащи резултати, които потенциално биха могли да навредят на заинтересованите страни в бизнеса.
Типове липсващи данни:
D.B Rubin ( 1976 ) класифицира проблемите с липсващи данни в три категории. В..
Wine Review PT6— EDA — ML
Въведение
Приложихме NLP към сомелиерското описание за всяко вино в част 5 .
Сега можем да разберем честотата на думите за вино, за грозде и във всички описания. Тук ще визуализираме честотата на думите.
Набор от данни
Kaggle
Ще използваме winemag-data-130k-v2.csv набор от данни за машинно обучение.
Програмен код
Код в google colab
Задача
Честота на думите за вино Честота на думите за грозде Честота на думите
wordcloud
Модулът wordcloud ни позволява..