Публикации по темата cluster-analysis

Свързани публикации 'cluster-analysis'

Клъстерен анализ

Клъстерният анализ е неконтролиран учебен проблем, при който са събрани хомогенни клъстери от записи, за да се получи представа за данните. С други думи, ние разделяме всички данни на множество групи въз основа на моделите в набора от данни. При клъстерирането не е нужно да предвиждаме целта. Свойства на клъстерите - 1. Всички точки от данни в клъстер трябва да са подобни. 2. Точките от данни от клъстерите трябва да са възможно най-различни. Приложения — Клъстерният анализ..

K-означава групиране и неговия случай на използване в домейна на сигурността

K-означава клъстерирането е един от най-простите и популярни алгоритми за машинно обучение без надзор. Учене без надзор Неконтролираното обучение е техника за машинно обучение, при която няма етикети за данните за обучение. Алгоритъмът за машинно обучение се опитва да научи основните модели или разпределения, които управляват данните. Клъстеризиране Групирането е една от най-разпространените техники за проучвателен анализ на данни, използвани за получаване на..

Свързани въпроси 'cluster-analysis'

йерархично групиране с Gower distance - hclust() и philentropy::distance()

Имам смесен набор от данни (категорични и непрекъснати променливи) и бих искал да направя йерархично групиране с помощта на разстоянието на Gower. Базирам кода си на пример от https://www.r-bloggers.com/hierarchical-clustering-in-r-2/ , който...

3352 изгледи

r cluster-analysis

19.09.2022

Защо алгоритмите за групиране на лица не използват матрици на разстояние, а не алгоритми за групиране?

Четох кода за клъстериране на лица на dlib и забелязах, че процесът е така: Преобразувайте лица във вектор с помощта на обучена мрежа Използвайте алгоритъм за клъстериране на китайски шепот, за да изчислите групи въз основа на разстояние...

540 изгледи

python face-recognition cluster-analysis algorithm dlib

16.09.2022

Групиране по групи

Как мога да извърша групиране по групи? Например вземете този набор от данни за Pokemon на Kaggle. Извадка от този набор от данни изглежда така (промених някои полета, за да имитират моите данни): Name Type I Type II...

748 изгледи

r cluster-analysis

23.09.2022

присвояване на същия номер на подобни редове в матрица

Имам квадратна матрица с размерност N. Искам да дефинирам вектор с размер N, който има като първи компонент: всички индекси на редовете на матрицата, които са същите като първия ред. и като втори компонент: всички индекси на редове на редовете на...

21 изгледи

r cluster-analysis matrix

24.09.2022

Групиране на данни въз основа на дати на случаи

Имам набор от данни от 20 000 отделни случая, всеки с начална дата на заболяването („дата на начало“). Всеки случай живее в групов дом и искам да групирам случаите въз основа на началната дата на заболяването в дома. Затова искам да идентифицирам...

44 изгледи

r date cluster-analysis dplyr mutate

01.10.2022

Групиране на същите lat/lng gmaps v3

На моя уебсайт имам формуляр, който позволява на потребителите да се регистрират. Той изисква от потребителите да предоставят своя град, щат и държава. Имам и карта, която пуска маркер за всеки потребител въз основа на ширина/дължина, която е...

1248 изгледи

php sql google-maps-api-3 cluster-analysis

12.10.2022

Извикване на R в java-Rcaller

Опитвам се да внедря групиране с помощта на R в java, като използвам R caller. Опитвам се да стартирам примерен код за валидиране на клъстери и получавам тази често срещана грешка, с която се сблъскват повечето потребители: Преждевременен край на...

3521 изгледи

r java cluster-analysis rcaller

14.10.2022

Получаване на наблюденията във всеки клъстер

Възможно ли е да се получат действителните наблюдения във всеки клъстер след извършване на k-средни стойности в R? Например, след моя анализ имам 2 клъстера и искам да намеря точните наблюдения във всеки клъстер, възможно ли е?

1153 изгледи

r cluster-analysis k-means

30.11.2022

Записва корелация/групиране с помощта на Hadoop

Нашият Hadoop клъстер поглъща няколко терабайта уеб регистрационни файлове дневно. Всеки регистрационен запис съдържа информация като потребителски IP адрес, идентификатор на бисквитка и т.н. Въпреки това различни IP адреси и идентификатори на...

884 изгледи

machine-learning hadoop cluster-analysis algorithm data-mining

02.11.2022

Mahout k-означава команда за клъстериране: изправена пред проблеми с пространството на купчина

Опитвам се да извърша клъстериране на k-средства, използвайки mahout върху набор от данни от 300 MB, съдържащ само числови стойности. Но ми изчерпва паметта в командата k-means след втората итерация. Защо размерът се увеличава след всяка итерация?...

168 изгледи

cluster-analysis k-means heap-memory mahout

14.10.2022

Математика: Това k-средно групиране ли е?

Здравейте! Имам няколко точки на една линия. Тези точки нямат измерение Y, а само измерение X. Поставих ги само в измерение Y, защото исках да мога да поставя множество точки на едно и също място. Бих искал да намеря n центроида (петна с...

256 изгледи

cluster-analysis math

29.11.2023

Структури от данни за прилагане на йерархично групиране

Ако трябваше да внедря алгоритъм за йерархично клъстериране, да речем в C/C++ или Java - предвид функциите за изчисляване на разстояние между& в клъстери - 1 . какъв би бил моят избор (заедно с други опции) за прилагане на структурите от данни...

1203 изгледи

machine-learning cluster-analysis memory-management hierarchical-clustering data-structures

30.11.2022

Последователно клъстериране с Carrot2?

възможно е да се направи "последователно клъстериране" с carrot2. Това, което имам предвид с последователно клъстериране е, да кажем, че имам набор от документи, които клъстерирам, и след известно време пристигат нови документи за клъстериране,...

76 изгледи

cluster-analysis carrot2

03.11.2023

Функция за групиране R Hclust Loop и разработване на таблица

Работя по проект за копаене на текст/клъстериране и се опитвам да създам таблица, която съдържа брой клъстери като редове и 6 колони, представляващи следните 6 показателя: макс.диаметър, мин.разделяне, средно.в рамките,средно.между, ср.silwidth,dunn....

704 изгледи

r cluster-analysis

06.12.2023

Създайте многовариантна графика на подобие

Опитвам се да науча и внедря спектрално клъстериране върху многовариантен набор от данни в R . Имам 9 независими променливи и 1 зависима променлива, която е двоична. Като първа стъпка към спектралното групиране, от мен се изисква да създам...

302 изгледи

r graph cluster-analysis knn spectral

29.11.2023

Превод на проблема с групирането на езика на теорията на графите

Имам правоъгълна равнинна мрежа, като на всяка клетка е присвоено някакво цяло число. Търся алгоритъм за идентифициране на клъстери от 3 до 6 съседни клетки с по-високо от средното тегло. Тези петна трябва да имат приблизително кръгла форма. За...

577 изгледи

graph cluster-analysis

11.12.2023

Подходяща мярка за сходство за групиране

Имам проблеми с намирането на подходяща мярка за сходство за групиране. Имам около 3000 масива от набори, където всеки набор съдържа характеристики на определен домейн (напр. число, цвят, дни, азбуки и т.н.). Ще обясня проблема си с пример. Да...

483 изгледи

cluster-analysis distance math euclidean-distance similarity

16.12.2023

Клъстериране на дървовидни структурирани данни

Да предположим, че са ни дадени данни в полуструктуриран формат като дърво. Като пример, дървото може да се формира като валиден XML документ или като валиден JSON документ. Можете да си представите, че това е S-израз, подобен на lisp, или...

2218 изгледи

artificial-intelligence cluster-analysis algorithm language-agnostic

26.12.2023

Как можем да кажем, че мярката за качество на клъстерирането е добра?

Има няколко добре известни мерки като ширина на силуета (SW), индекс на Davies-Bouldin (DB), индекс Calinski-Harabasz (CH) и индекс на Dunn. Как можем да кажем, че мярката за качество на клъстерирането е добра? Има ли някаква метрика, за да бъде...

595 изгледи

machine-learning cluster-analysis measurement

18.10.2022

Облак от точки, клъстер, откриване на петна

Имам двоично изображение, пълно с шумове. Открих обектите, оградени в червено, използвайки медианен филтър B = medfilt2(A, [m n]) (Matlab) или medianBlur(src, dst, ksize) (openCV). Бихте ли предложили други методи за откриване на тези обекти по...

1839 изгледи

opencv matlab cluster-analysis point-clouds

26.11.2023

Свързани публикации 'cluster-analysis'

Клъстерен анализ

K-означава групиране и неговия случай на използване в домейна на сигурността

Свързани въпроси 'cluster-analysis'

Подобни въпроси