Свързани публикации 'eda'


Проучвателен анализ на данни: ръководство; използване на библиотеки на Python
Разбирането на данните е ключово, когато сте в сферата на света на данните, независимо дали сте инженер по данни, анализатор на данни, инженер по ML/AI или учен по данни. В тази статия ще разкажа как проучвам, анализирам и визуализирам набора от данни за имоти от Ню Йорк, това е малък набор от данни. Тази статия е насочена към начинаещи, които търсят идеи как да разберат набор от данни. Файловете с код и данни са тук в GitHub. Да започнем с разбирането; Какво е проучвателен..

Кой ще спечели IPL 2023??
IPL, едно от най-известните събития по крикет в света с над 400 милиона зрители по целия свят, се доказа като едно от мега-събитията. IPL 2023 е в разгара си в средата на лигата, таблицата с точки е изравнена и отборите се стремят към първите 4 места. Станахме свидетели на някои изнервящи завършвания през този сезон. Имайки 40 завършени мача и още 30, докато пиша това, въпросът в ума на всички сега е „Кой ще спечели IPL 2023?“ Възнамерявах да използвам машинно обучение, за да..

Спрете да си губите времето с EDA
Работете по-интелигентно с dataprep.ai и стигнете до обучението по-бързо Моля, спрете да изпълнявате вашия проучвателен анализ на данни (EDA)…една…тетрадка…клетка…по…еднократно. Губите времето си, когато са налични изчерпателни инструменти. dataprep.ai е един от тези инструменти. През изминалата седмица успях да премина през множество трансформации на набори от данни и да прегледам промените...

По-задълбочено гмуркане в набора от данни NSL-KDD
Чудили ли сте се някога как вашият компютър/мрежа може да избегне заразяване със зловреден софтуер и лош трафик от интернет? Причината, поради която може да го открие толкова добре, е, че има системи за защита на вашата ценна информация, съхранявана във вашия компютър или мрежи. Тези системи, които откриват въвеждане на злонамерен трафик, се наричат ​​системи за откриване на проникване (IDS) и се обучават на данни от запис на интернет трафик. Най-често срещаният набор от данни е NSL-KDD и..

Какво е машинно обучение?
С прости думи машинното обучение е подполе на изкуствения интелект, което се дефинира като способността на машината да копира интелигентното човешко поведение. AI се използва за изпълнение на сложни задачи по подобен начин, както хората решават проблемите. Машинното обучение се използва и при прогнози, анализи и решаване на сложни проблеми с помощта на различни алгоритми. Има много вградени модели (алгоритми) в ML (машинно обучение). Как да научите машинно обучение? За да научите..

Ръководство за работа с липсващи стойности в Data Science
Тайните на науката за данните Ръководство за работа с липсващи стойности в Data Science Кога да използвате импутация и интерполация Липсващите стойности са ахилесовата пета за специалиста по данни. Ако не се третира правилно, целият анализ ще бъде безполезен и ще предостави подвеждащи резултати, които потенциално биха могли да навредят на заинтересованите страни в бизнеса. Типове липсващи данни: D.B Rubin ( 1976 ) класифицира проблемите с липсващи данни в три категории. В..

Регресия с помощта на sklearn върху KC Housing Dataset
Мотивация За да предвидя цените на жилищата в окръг Кинг, избрах набора от данни за цените на жилищата, получен от Kaggle. Този набор от данни съдържа продажни цени на жилища за окръг Кинг, който включва Сиатъл. Той включва жилища, продадени между май 2014 г. и май 2015 г. Той има много характеристики на обучение и наборът от данни може да бъде изтеглен от тук . Въведение Цялостната идея на регресията е да се изследват две неща: (1) дали набор от предикторни променливи върши..