Свързани публикации 'cluster-analysis'


Клъстерен анализ
Клъстерният анализ е неконтролиран учебен проблем, при който са събрани хомогенни клъстери от записи, за да се получи представа за данните. С други думи, ние разделяме всички данни на множество групи въз основа на моделите в набора от данни. При клъстерирането не е нужно да предвиждаме целта. Свойства на клъстерите - 1. Всички точки от данни в клъстер трябва да са подобни. 2. Точките от данни от клъстерите трябва да са възможно най-различни. Приложения — Клъстерният анализ..

K-означава групиране и неговия случай на използване в домейна на сигурността
K-означава клъстерирането е един от най-простите и популярни алгоритми за машинно обучение без надзор. Учене без надзор Неконтролираното обучение е техника за машинно обучение, при която няма етикети за данните за обучение. Алгоритъмът за машинно обучение се опитва да научи основните модели или разпределения, които управляват данните. Клъстеризиране Групирането е една от най-разпространените техники за проучвателен анализ на данни, използвани за получаване на..

Свързани въпроси 'cluster-analysis'

йерархично групиране с Gower distance - hclust() и philentropy::distance()
Имам смесен набор от данни (категорични и непрекъснати променливи) и бих искал да направя йерархично групиране с помощта на разстоянието на Gower. Базирам кода си на пример от https://www.r-bloggers.com/hierarchical-clustering-in-r-2/ , който...
3352 изгледи
schedule 19.09.2022

Защо алгоритмите за групиране на лица не използват матрици на разстояние, а не алгоритми за групиране?
Четох кода за клъстериране на лица на dlib и забелязах, че процесът е така: Преобразувайте лица във вектор с помощта на обучена мрежа Използвайте алгоритъм за клъстериране на китайски шепот, за да изчислите групи въз основа на разстояние...
540 изгледи

Групиране по групи
Как мога да извърша групиране по групи? Например вземете този набор от данни за Pokemon на Kaggle. Извадка от този набор от данни изглежда така (промених някои полета, за да имитират моите данни): Name Type I Type II...
748 изгледи
schedule 23.09.2022

присвояване на същия номер на подобни редове в матрица
Имам квадратна матрица с размерност N. Искам да дефинирам вектор с размер N, който има като първи компонент: всички индекси на редовете на матрицата, които са същите като първия ред. и като втори компонент: всички индекси на редове на редовете на...
21 изгледи
schedule 24.09.2022

Групиране на данни въз основа на дати на случаи
Имам набор от данни от 20 000 отделни случая, всеки с начална дата на заболяването („дата на начало“). Всеки случай живее в групов дом и искам да групирам случаите въз основа на началната дата на заболяването в дома. Затова искам да идентифицирам...
44 изгледи
schedule 01.10.2022

Групиране на същите lat/lng gmaps v3
На моя уебсайт имам формуляр, който позволява на потребителите да се регистрират. Той изисква от потребителите да предоставят своя град, щат и държава. Имам и карта, която пуска маркер за всеки потребител въз основа на ширина/дължина, която е...
1248 изгледи

Извикване на R в java-Rcaller
Опитвам се да внедря групиране с помощта на R в java, като използвам R caller. Опитвам се да стартирам примерен код за валидиране на клъстери и получавам тази често срещана грешка, с която се сблъскват повечето потребители: Преждевременен край на...
3521 изгледи
schedule 14.10.2022

Получаване на наблюденията във всеки клъстер
Възможно ли е да се получат действителните наблюдения във всеки клъстер след извършване на k-средни стойности в R? Например, след моя анализ имам 2 клъстера и искам да намеря точните наблюдения във всеки клъстер, възможно ли е?
1153 изгледи
schedule 30.11.2022

Записва корелация/групиране с помощта на Hadoop
Нашият Hadoop клъстер поглъща няколко терабайта уеб регистрационни файлове дневно. Всеки регистрационен запис съдържа информация като потребителски IP адрес, идентификатор на бисквитка и т.н. Въпреки това различни IP адреси и идентификатори на...
884 изгледи

Mahout k-означава команда за клъстериране: изправена пред проблеми с пространството на купчина
Опитвам се да извърша клъстериране на k-средства, използвайки mahout върху набор от данни от 300 MB, съдържащ само числови стойности. Но ми изчерпва паметта в командата k-means след втората итерация. Защо размерът се увеличава след всяка итерация?...
168 изгледи

Математика: Това k-средно групиране ли е?
Здравейте! Имам няколко точки на една линия. Тези точки нямат измерение Y, а само измерение X. Поставих ги само в измерение Y, защото исках да мога да поставя множество точки на едно и също място. Бих искал да намеря n центроида (петна с...
256 изгледи
schedule 29.11.2023

Структури от данни за прилагане на йерархично групиране
Ако трябваше да внедря алгоритъм за йерархично клъстериране, да речем в C/C++ или Java - предвид функциите за изчисляване на разстояние между& в клъстери - 1 . какъв би бил моят избор (заедно с други опции) за прилагане на структурите от данни...
1203 изгледи

Последователно клъстериране с Carrot2?
възможно е да се направи "последователно клъстериране" с carrot2. Това, което имам предвид с последователно клъстериране е, да кажем, че имам набор от документи, които клъстерирам, и след известно време пристигат нови документи за клъстериране,...
76 изгледи
schedule 03.11.2023

Функция за групиране R Hclust Loop и разработване на таблица
Работя по проект за копаене на текст/клъстериране и се опитвам да създам таблица, която съдържа брой клъстери като редове и 6 колони, представляващи следните 6 показателя: макс.диаметър, мин.разделяне, средно.в рамките,средно.между, ср.silwidth,dunn....
704 изгледи
schedule 06.12.2023

Създайте многовариантна графика на подобие
Опитвам се да науча и внедря спектрално клъстериране върху многовариантен набор от данни в R . Имам 9 независими променливи и 1 зависима променлива, която е двоична. Като първа стъпка към спектралното групиране, от мен се изисква да създам...
302 изгледи
schedule 29.11.2023

Превод на проблема с групирането на езика на теорията на графите
Имам правоъгълна равнинна мрежа, като на всяка клетка е присвоено някакво цяло число. Търся алгоритъм за идентифициране на клъстери от 3 до 6 съседни клетки с по-високо от средното тегло. Тези петна трябва да имат приблизително кръгла форма. За...
577 изгледи
schedule 11.12.2023

Подходяща мярка за сходство за групиране
Имам проблеми с намирането на подходяща мярка за сходство за групиране. Имам около 3000 масива от набори, където всеки набор съдържа характеристики на определен домейн (напр. число, цвят, дни, азбуки и т.н.). Ще обясня проблема си с пример. Да...
483 изгледи

Клъстериране на дървовидни структурирани данни
Да предположим, че са ни дадени данни в полуструктуриран формат като дърво. Като пример, дървото може да се формира като валиден XML документ или като валиден JSON документ. Можете да си представите, че това е S-израз, подобен на lisp, или...
2218 изгледи

Как можем да кажем, че мярката за качество на клъстерирането е добра?
Има няколко добре известни мерки като ширина на силуета (SW), индекс на Davies-Bouldin (DB), индекс Calinski-Harabasz (CH) и индекс на Dunn. Как можем да кажем, че мярката за качество на клъстерирането е добра? Има ли някаква метрика, за да бъде...
595 изгледи

Облак от точки, клъстер, откриване на петна
Имам двоично изображение, пълно с шумове. Открих обектите, оградени в червено, използвайки медианен филтър B = medfilt2(A, [m n]) (Matlab) или medianBlur(src, dst, ksize) (openCV). Бихте ли предложили други методи за откриване на тези обекти по...
1839 изгледи