Публикации по темата k-means

Свързани публикации 'k-means'

Най-изчерпателното ръководство за клъстериране на K-Means, от което някога ще имате нужда

Обичам да работя върху „двигатели за препоръки“. Всеки път, когато попадна на някакъв механизъм за препоръки на уебсайт, нямам търпение да го разбия и да разбера как работи отдолу. Това е едно от многото страхотни неща да си учен по данни! Това, което наистина ме очарова в тези системи, е как можем да групираме подобни елементи, продукти и потребители заедно. Това групиране или сегментиране работи в различни индустрии. И това прави концепцията за клъстериране толкова важна в науката за..

Как да използвате K-Means клъстериране за решаване на проблеми от реалния свят

Как да използвате K-Means клъстериране за решаване на проблеми от реалния свят K-означава групирането е един от най-простите и най-широко използваните алгоритми за машинно обучение без надзор. Основната цел е да се раздели набор от точки в различни групи въз основа на техните характеристики. Представете си, че сте градостроител, който се опитва да разбере кварталите, или специалист по маркетинг, сегментиращ клиенти; K-средствата могат да бъдат вашият инструмент. Как действа..

Клъстерен анализ: теория и реализация на неконтролирани алгоритми

Включително плюсовете и минусите на k-средните, йерархичния и DBSCAN С прости думи, клъстерирането не е нищо друго освен разделяне на наблюдения въз основа на определени свойства. В по-технически термин групирането е неконтролиран алгоритъм за машинно обучение, процес, чрез който наблюденията (данните) се групират по начин, по който подобни наблюдения се поставят по-близо едно до друго. Това е „неконтролиран“ алгоритъм, тъй като за разлика от контролираните алгоритми (напр. произволна..

ML-K-означава групиране

Учене без надзор Без надзор и групиране? Данните не винаги са етикетирани в реалния живот. Методите, които използваме, за да намерим модели в тези данни, се наричат „Учене без надзор“. Клъстерирането е добре познат метод за обучение без надзор. Той групира подобни данни, за да можем да намерим модела/структурата на данните. К-означава? „K“ е броят на клъстерите, в които искаме да групираме данните. „Средно“ е средното разстояние между примерите (точките с данни) и центъра на..

Разширени K-средни стойности: Контролиране на размерите на групите и избор на функции

Няколко полезни настройки за K-Means Когато използваме K-средства, можем да се сблъскаме с два проблема: В крайна сметка получаваме групи с много различни размери , някои съдържащи хиляди наблюдения, а други само няколко Нашият набор от данни има твърде много променливи и алгоритъмът K-Means се бори да идентифицира оптимален набор от клъстери Ограничени K-средни: контролиране на размера на групата Алгоритъмът се основава на статия от Bradley et al. и е внедрено от Joshua..

„Алгоритми за групиране, казвате? Трябва да закъснея за партито.

Обяснение на алгоритми за частично и базирано на плътност групиране Групирането е процес на групиране на подобни точки от данни чрез намиране на прилики и определяне на модели в немаркирани и невидими данни. Алгоритмите за групиране се използват широко в пазарното сегментиране, търсачките, системите за препоръки и диагностичните системи. Може би, ако срещнете набор от данни без етикетирана целева променлива, има начин да получите известна представа за него, без да се налага да го..

Компресирането на изображения с K означава групиране

Първата реакция към K означава: „Това е? Това е много по-просто, отколкото очаквах!“ В основата си това са две стъпки. Присвояване на точки от данни към най-близкия център Преместете центроида в средата на точките с данни. И повторете. Елегантно семпло! Материалите на курса (Станфорд/Coursera Machine Learning) ни карат да прилагаме K Means като метод за компресиране на изображения. По-конкретно, за групиране на цветове в K групи (което води до изображение, използващо само K..