Публикации по теме 'eda'


Исследовательский анализ данных: пошаговое руководство; использование библиотек Python
Понимание данных имеет ключевое значение, когда вы находитесь в сфере мира данных, независимо от того, являетесь ли вы инженером данных, аналитиком данных, инженером ML/AI или специалистом по данным. В этой статье я расскажу, как я изучаю, анализирую и визуализирую набор данных о недвижимости из Нью-Йорка, это небольшой набор данных. Эта статья предназначена для новичков, которые ищут идеи о том, как понять набор данных. Файлы с кодом и данными находятся здесь , на GitHub...

Кто выиграет IPL 2023??
IPL, одно из самых известных событий по крикету в мире, которое собирает более 400 миллионов зрителей по всему миру, оказалось одним из мега-событий. IPL 2023 находится в самом разгаре на середине этапа лиги, таблица очков сбалансирована, и команды стремятся к 4 лучшим местам. В этом сезоне мы были свидетелями некоторых нервных финишей. Когда я пишу это, у меня уже 40 завершенных матчей и еще 30, и сейчас у всех на уме вопрос: «Кто выиграет IPL 2023?» Я собирался использовать..

Хватит тратить время с EDA
Работайте эффективнее с dataprep.ai и быстрее приступайте к обучению Пожалуйста, прекратите проводить Исследовательский анализ данных (EDA)…одна…блокнотная…ячейка…в…время. Вы тратите свое время, когда доступны комплексные инструменты. dataprep.ai — один из таких инструментов. На прошлой неделе я смог повторить несколько преобразований наборов данных и просмотреть изменения…

Более глубокое погружение в набор данных NSL-KDD
Вы когда-нибудь задумывались, как ваш компьютер / сеть может избежать заражения вредоносным ПО и плохого трафика из Интернета? Причина, по которой он может его так хорошо обнаруживать, заключается в том, что существуют системы для защиты вашей ценной информации, хранящейся на вашем компьютере или в сетях. Эти системы, которые обнаруживают входящие вредоносные данные трафика, называются системами обнаружения вторжений (IDS) и обучаются на данных записи интернет-трафика. Наиболее..

Что такое машинное обучение ?
Проще говоря, машинное обучение — это область искусственного интеллекта, которая определяется как способность машины копировать интеллектуальное поведение человека. ИИ используется для выполнения сложных задач так же, как люди решают проблемы. Машинное обучение также используется в прогнозировании, анализе и решении сложных задач с помощью различных алгоритмов. В ML (машинном обучении) есть много встроенных моделей (алгоритмов). Как научиться машинному обучению? Чтобы изучить..

Руководство по обработке отсутствующих значений в науке о данных
Секреты науки о данных Руководство по обработке отсутствующих значений в науке о данных Когда использовать вменение и интерполяцию Недостающие значения - это ахиллесова пята для специалиста по данным. При неправильной обработке весь анализ будет бесполезным и даст вводящие в заблуждение результаты, которые потенциально могут нанести вред заинтересованным сторонам бизнеса. Типы отсутствующих данных: Д.Б. Рубин ( 1976 ) разделил проблемы с недостающими данными на три категории...

Регрессия с использованием sklearn на наборе данных KC Housing
Мотивация Чтобы спрогнозировать цены на жилье в округе Кинг, я выбрал набор данных о ценах на жилье, полученный от Kaggle. Этот набор данных содержит цены продажи домов для округа Кинг, включая Сиэтл. Он включает в себя дома, проданные в период с мая 2014 г. по май 2015 г. Он обладает многими характеристиками обучения, и набор данных можно скачать здесь . Вступление Общая идея регрессии состоит в том, чтобы исследовать две вещи: (1) хорошо ли справляется набор..