Публикации по теме 'random-forest'


Работа с многоклассовыми данными
Прогноз типа лесного покрова Вы когда-нибудь задумывались о том, что делать, когда сталкиваетесь с проблемой классификации, состоящей из более чем трех классов? Как вы работали с многоклассовыми данными и как вы оценивали свою модель? Было ли переоснащение проблемой - и если да, то как вы ее преодолели? Читайте дальше, чтобы узнать, как я справился с этими вопросами в своем последнем проекте - анализе типов лесного покрова из набора данных, предоставленного Лесной службой США и..

(Не) приключения в использовании машинного обучения для прогнозирования акций
Меры по предотвращению утечки данных в многопериодных прогнозах вперед Предисловие Как начинающий специалист по данным, я недавно построил модель машинного обучения, чтобы прогнозировать и выбирать портфель акций с лучшими показателями в рамках индекса CSI 300 (300 крупнейших акций по рыночной капитализации для фондовых бирж Шанхая и Шэньчжэня). Результаты были многообещающими, но недостаточно хорошими. Моя модель смогла выбрать портфель акций, который постоянно превосходил эталонный..

Распознавание рукописных цифр с использованием машинного обучения и глубокого обучения на Python
MNIST («Модифицированный национальный институт стандартов и технологий») - это фактический набор данных компьютерного зрения «привет, мир», и этот набор данных из рукописных изображений, используемых в качестве основы для алгоритмов классификации тестов. В этом руководстве мы будем использовать набор данных Kaggle, чтобы продемонстрировать различные подходы к решению проблемы распознавания изображений. Скачать набор данных отсюда О наборе данных Каждое изображение представляет..

Настройка гиперпараметров в случайном лесу
Алгоритм случайного леса оказался одним из самых востребованных алгоритмов в области машинного обучения. Это произошло в первую очередь из-за того, что он всесторонне решает проблему, вызванную его родительским алгоритмом Decision Tree, переобучением. Деревья решений обвиняются в низком смещении и высокой дисперсии, поскольку они оценивают каждый узел в дереве и часто в конечном итоге следуют одному и тому же шаблону, а не обобщают полученные знания. Случайный лес, с другой стороны,..

Случайный лес от построения моделей до настройки гиперпараметров в Python
Всем привет👏. Сегодня мы рассмотрим один из методов упаковки под названием «Случайный лес», чтобы предсказать один из загрязнителей воздуха в Китае. Модель называется «лесной», потому что она построена с несколькими деревьями решений, и «случайной», поскольку она выбирает подмножество строк (не функций) для каждого дерева и использует подмножество функций (столбцов) в каждый узел разделен. Я предполагаю, что читатели знают, что такое пакетирование и деревья решений, в противном..

Выбор функций с помощью случайного леса
Давайте посмотрим, как использовать случайный лес для выбора функций Выбор функций всегда был большой проблемой в машинном обучении. По своему опыту могу сказать, что это самая важная часть проекта по науке о данных, потому что она помогает нам уменьшить размеры набора данных и удалить бесполезные переменные. К счастью, есть несколько моделей, которые помогают нам рассчитать важность функций, что помогает нам игнорировать менее полезные. Случайный лес - одна из таких моделей. Что..

СЛУЧАЙНЫЙ ЛЕС В ПАРЛАМЕНТЕ!
Классификатор случайного леса — один из наиболее часто используемых и обсуждаемых алгоритмов в науке о данных и машинном обучении, и это справедливо! Во-первых, этот алгоритм настолько интуитивно понятен, что пользователи и даже неспециалисты (не технические специалисты или заинтересованные стороны) очень легко понимают, как он работает. Это так, потому что компоненты случайного леса, которые по сути являются деревьями решений, очень точно отражают технику принятия решений людьми —..