Публикации по теме 'clustering'


Группировка данных в науке о данных
Простой обзор методов, лежащих в основе известных алгоритмов кластеризации «Рыбак рыбака слетается в стаю» Это известная пословица, которую мы все слышали с детства. Это говорит о том, что люди одного типа или с похожими чертами, как правило, ближе друг к другу. В науке о данных это естественное явление называется кластеризацией и используется для поиска групп данных путем обнаружения нескольких групп, в которых объекты существенно похожи на объекты в той же группе по сравнению..

Объяснение самоорганизующихся карт
Самоорганизующиеся карты (SOM), также известные как карты Кохонена, представляют собой тип искусственной нейронной сети, которые используются для кластеризации, уменьшения размерности и многого другого. В первой части я привожу обзор SOM. Во второй части я объясню, как они учатся. Наконец, в последней части я покажу, как обучить SOM на наборе данных радужной оболочки глаза. Не стесняйтесь переходить к последнему разделу, если хотите. TL;DR: SOM отображают многомерные входные..

Отчет о сегментации клиентов
Обзор проекта На высококонкурентном рынке привлечения и удержания клиентов компании постоянно стремятся лучше понять свою клиентскую базу. Анализ демографических характеристик и моделей поведения существующих клиентов может дать ценную информацию о потенциальных целевых группах и помочь адаптировать маркетинговые стратегии для максимального увеличения привлечения и удержания клиентов. Этот проект направлен на анализ демографических данных для компании, занимающейся торговлей по почте, с..

K означает алгоритм кластеризации
Оглавление Интуиция кластеризации K-средних Реальные ситуации кластеризации Выбор значения K Метод локтя Код для алгоритма кластеризации K-средних и точки локтя. Алгоритмы машинного обучения делятся на три основные категории. Обучение с учителем Обучение без учителя Обучение с подкреплением В контролируемом обучении в данном наборе данных у нас есть метка класса или целевая переменная. В неконтролируемом обучении все, что вы знаете, — это набор функций, и вы ничего не..

Машинное обучение: кластеризация набора данных FIFA 20
Неконтролируемый алгоритм Kmeans в наборе данных FIFA 20 Каждый год Electronic Arts выпускает свою флагманскую игру FIFA. Как геймер, одной из захватывающих особенностей новой версии является поиск общего рейтинга игроков моего любимого футбольного клуба Ливерпуль . Недавно я обнаружил на Kaggle набор данных, содержащий всю информацию об игроках FIFA 20. Объедините этот набор данных с моим интересом к машинному обучению и быстро приближающимся сроком выполнения классного проекта,..

Данные о мобильности, разработка функций и иерархическая кластеризация
Соединенные Штаты имеют один из крупнейших автомобильных рынков мира, уступающий только Китаю. По состоянию на 2017 год на дорогах Америки было зарегистрировано 270,4 миллиона автомобилей, и каждый год происходят миллионы аварий. По данным Национальной службы безопасности дорожного движения, в 2016 году в США было зарегистрировано около 7 миллионов дорожно-транспортных происшествий, о которых полиция сообщила. Это привело к убыткам в результате столкновений в 2016 году на сумму около..

Ваше руководство по неконтролируемому машинному обучению — Кластеризация
Построение интуиции и логики для кластеризации вместе с визуализацией алгоритма K-средних в наборе данных Введение В предыдущих блогах ( Знакомство с миром машинного обучения ) мы узнали о неконтролируемом машинном обучении. В отличие от машинного обучения с учителем, здесь мы идентифицируем точки данных по отношению к другим точкам данных, потому что этот тип алгоритма машинного обучения не использует помеченные данные, как в машинном обучении с учителем. Если вам нужны..