Публикации по темата clustering

Свързани публикации 'clustering'

Разширени K-средни стойности: Контролиране на размерите на групите и избор на функции

Няколко полезни настройки за K-Means Когато използваме K-средства, можем да се сблъскаме с два проблема: В крайна сметка получаваме групи с много различни размери , някои съдържащи хиляди наблюдения, а други само няколко Нашият набор от данни има твърде много променливи и алгоритъмът K-Means се бори да идентифицира оптимален набор от клъстери Ограничени K-средни: контролиране на размера на групата Алгоритъмът се основава на статия от Bradley et al. и е внедрено от Joshua..

„Алгоритми за групиране, казвате? Трябва да закъснея за партито.

Обяснение на алгоритми за частично и базирано на плътност групиране Групирането е процес на групиране на подобни точки от данни чрез намиране на прилики и определяне на модели в немаркирани и невидими данни. Алгоритмите за групиране се използват широко в пазарното сегментиране, търсачките, системите за препоръки и диагностичните системи. Може би, ако срещнете набор от данни без етикетирана целева променлива, има начин да получите известна представа за него, без да се налага да го..

Въпрос за интервю: Как определяте броя на клъстерите в алгоритъм за клъстериране?

Клъстерите обикновено се определят като колекции или групи от елементи с подобни или различни характеристики. В машинното обучение примерите често се групират като първа стъпка за разбиране на набора от данни. Групирането на немаркирани проби се нарича групиране, което е обучение без надзор в машинното обучение.

Бележки относно спектралното групиране

Досега изследвах спектралното групиране и това може да е последната публикация за тази тема. Накратко казано, спектралното групиране е алгоритъм за класифициране на данни в групи, като се вземе предвид структурата на графиката, за да се представи свързаността. След изграждането на матрица на Лаплас за графиката се изчисляват собствените стойности и собствените вектори за матрицата на Лаплас. След това се прилага групиране на K-средни стойности за получените собствени вектори. Въпреки че..

Групиране на самолетни катастрофи с помощта на GSDMM модел

Клъстерирането, целта на някои алгоритми за неконтролирано обучение в машинното обучение, се използва често за откриване на тенденции в документи, които може да са скрити или трудни за намиране. Моделът на латентно разпределение на Дирихле (LDA) е най-често срещаният метод за групиране, предназначен да обработва текстове, които са по-дълги от петдесет думи. Въпреки това моделът Gibbs Sampling Dirichlet Multinomial Mixture (GSDMM), въведен в статия през 2014 г. от Jianhua Yin и Jianyong..

Клъстерен анализ: Създавайте, визуализирайте и интерпретирайте клиентски сегменти

сегментиране на клиентите Клъстерен анализ: Създавайте, визуализирайте и интерпретирайте клиентски сегменти Проучване на методи за клъстерен анализ, визуализиране на клъстери чрез намаляване на размерността и тълкуване на клъстери чрез изследване на въздействащи характеристики. Въпреки че сме свидетели на голям приток на контролирани техники за машинно обучение, които се използват в организации, тези методи обикновено страдат от един голям проблем; нужда от етикетирани данни. За..

Хибриден подход към клиентското сегментиране

Защо клиентско сегментиране „Сегментирането на клиентите“ се отнася до процеса на разделяне на клиенти на подгрупи със сходни навици и нужди на покупка. Помага на бизнеса да разбира по-добре клиентите си, така че да могат по-ефективно да продават съществуващи продукти и дори да разработват нови продукти, за да отговорят на изискванията на клиентите. Подходи за сегментиране Базиран на правила Най-добрите клиентски сегментации са лесно интерпретируеми. Те разказват истории за..