Свързани публикации 'k-means'
Най-изчерпателното ръководство за клъстериране на K-Means, от което някога ще имате нужда
Обичам да работя върху „двигатели за препоръки“. Всеки път, когато попадна на някакъв механизъм за препоръки на уебсайт, нямам търпение да го разбия и да разбера как работи отдолу. Това е едно от многото страхотни неща да си учен по данни!
Това, което наистина ме очарова в тези системи, е как можем да групираме подобни елементи, продукти и потребители заедно. Това групиране или сегментиране работи в различни индустрии. И това прави концепцията за клъстериране толкова важна в науката за..
Как да използвате K-Means клъстериране за решаване на проблеми от реалния свят
Как да използвате K-Means клъстериране за решаване на проблеми от реалния свят
K-означава групирането е един от най-простите и най-широко използваните алгоритми за машинно обучение без надзор. Основната цел е да се раздели набор от точки в различни групи въз основа на техните характеристики. Представете си, че сте градостроител, който се опитва да разбере кварталите, или специалист по маркетинг, сегментиращ клиенти; K-средствата могат да бъдат вашият инструмент.
Как действа..
Клъстерен анализ: теория и реализация на неконтролирани алгоритми
Включително плюсовете и минусите на k-средните, йерархичния и DBSCAN
С прости думи, клъстерирането не е нищо друго освен разделяне на наблюдения въз основа на определени свойства. В по-технически термин групирането е неконтролиран алгоритъм за машинно обучение, процес, чрез който наблюденията (данните) се групират по начин, по който подобни наблюдения се поставят по-близо едно до друго. Това е „неконтролиран“ алгоритъм, тъй като за разлика от контролираните алгоритми (напр. произволна..
ML-K-означава групиране
Учене без надзор
Без надзор и групиране?
Данните не винаги са етикетирани в реалния живот. Методите, които използваме, за да намерим модели в тези данни, се наричат „Учене без надзор“. Клъстерирането е добре познат метод за обучение без надзор. Той групира подобни данни, за да можем да намерим модела/структурата на данните.
К-означава?
„K“ е броят на клъстерите, в които искаме да групираме данните. „Средно“ е средното разстояние между примерите (точките с данни) и центъра на..
Разширени K-средни стойности: Контролиране на размерите на групите и избор на функции
Няколко полезни настройки за K-Means
Когато използваме K-средства, можем да се сблъскаме с два проблема:
В крайна сметка получаваме групи с много различни размери , някои съдържащи хиляди наблюдения, а други само няколко Нашият набор от данни има твърде много променливи и алгоритъмът K-Means се бори да идентифицира оптимален набор от клъстери
Ограничени K-средни: контролиране на размера на групата
Алгоритъмът се основава на статия от Bradley et al. и е внедрено от Joshua..
„Алгоритми за групиране, казвате? Трябва да закъснея за партито.
Обяснение на алгоритми за частично и базирано на плътност групиране
Групирането е процес на групиране на подобни точки от данни чрез намиране на прилики и определяне на модели в немаркирани и невидими данни. Алгоритмите за групиране се използват широко в пазарното сегментиране, търсачките, системите за препоръки и диагностичните системи.
Може би, ако срещнете набор от данни без етикетирана целева променлива, има начин да получите известна представа за него, без да се налага да го..
Компресирането на изображения с K означава групиране
Първата реакция към K означава: „Това е? Това е много по-просто, отколкото очаквах!“
В основата си това са две стъпки.
Присвояване на точки от данни към най-близкия център Преместете центроида в средата на точките с данни.
И повторете. Елегантно семпло!
Материалите на курса (Станфорд/Coursera Machine Learning) ни карат да прилагаме K Means като метод за компресиране на изображения. По-конкретно, за групиране на цветове в K групи (което води до изображение, използващо само K..