Публикации по теме 'cluster-analysis'
Кластерный анализ
Кластерный анализ — это неконтролируемая задача обучения, в которой собираются однородные кластеры записей, чтобы получить представление о данных. Другими словами, мы делим все данные на несколько групп на основе шаблонов в наборе данных. При кластеризации нам не нужно предсказывать цель.
Свойства кластеров –
1. Все точки данных в кластере должны быть одинаковыми.
2. Точки данных из кластеров должны максимально различаться.
Приложения . Кластерный анализ можно использовать в..
Кластеризация K-средних и ее вариант использования в домене безопасности
Кластеризация методом K-средних — один из самых простых и популярных алгоритмов машинного обучения без учителя.
Неконтролируемое обучение
Обучение без учителя – это метод машинного обучения, в котором для обучающих данных нет меток. Алгоритм машинного обучения пытается изучить основные шаблоны или распределения, управляющие данными.
Кластеризация
Кластеризация — один из наиболее распространенных методов исследовательского анализа данных, используемых для получения..
HDSC Stage G OSP: анализ фильмов
Определение жанра фильма на основе рабочих ролей съемочной группы с использованием обработки естественного языка и изучение факторов, которые приводят к успеху фильма.
Веб-сайт проекта : Веб-сайт анализа фильмов
Введение
Фильмы - это, пожалуй, высшая форма искусства. Эти медиа-творения обычно оставляют следы вопросов и воображения в умах зрителей, которые сознательно или бессознательно пытаются понять все, что происходит «под капотом» и «за пределами большого экрана»...
Вопросы по теме 'cluster-analysis'
Перевод задачи кластеризации на язык теории графов
У меня есть прямоугольная плоская сетка, в которой каждой ячейке присвоен некоторый целочисленный вес. Я ищу алгоритм для идентификации кластеров от 3 до 6 соседних ячеек с весом выше среднего. Эти капли должны иметь примерно круглую форму.
Для...
577 просмотров
schedule
11.12.2023
Алгоритм кластеризации [оценки] с матрицей расстояний в качестве входных данных
Может ли кто-нибудь предложить алгоритм кластеризации, который может работать с матрицей расстояний в качестве входных данных? Или алгоритм, который может оценить «качество» кластеризации также на основе матрицы расстояний?
В данный момент я...
2662 просмотров
schedule
30.01.2024
Кластер одинаковой широты/долготы gmaps v3
На моем веб-сайте у меня есть форма, которая позволяет пользователям регистрироваться. Он просит пользователей указать свой город, штат и страну. У меня также есть карта, которая отбрасывает маркер для каждого пользователя на основе широты и...
1248 просмотров
schedule
12.10.2022
Ключевые соображения/подводные камни для веб-приложения Java, которое должно работать в кластерной среде?
У нас есть веб-приложение Java, использующее Spring и Hibernate и имеющее довольно стандартную архитектуру. В настоящее время приложение поддерживает клиентов на основе SOAP в дополнение к клиенту Flex GUI, который взаимодействует через AFM/HTTP с...
365 просмотров
schedule
04.02.2024
Кластеризация древовидных данных
Предположим, нам даны данные в полуструктурированном формате в виде дерева. Например, дерево может быть сформировано как действительный документ XML или как действительный документ JSON. Вы можете представить, что это S-выражение, похожее на...
2218 просмотров
schedule
26.12.2023
Как указать метрику расстояния для kmeans в R?
Я делаю кластеризацию kmeans в R с двумя требованиями:
Мне нужно указать свою собственную функцию расстояния, теперь это коэффициент Пирсона.
Я хочу выполнить кластеризацию, в которой в качестве центроидов используется среднее значение...
10964 просмотров
schedule
06.03.2024
Надлежащая мера подобия для кластеризации
У меня проблемы с поиском правильной меры сходства для кластеризации. У меня есть около 3000 массивов наборов, где каждый набор содержит функции определенного домена (например, число, цвет, дни, алфавиты и т. д.). Я объясню свою проблему на примере....
483 просмотров
schedule
16.12.2023
Многомерная кластеризация логических значений
Вот мой сценарий проблемы:
У меня есть несколько тысяч объектов. Каждый объект имеет 256 логических измерений (истинных или ложных). Я хочу найти такие кластеры, что
Каждый кластер имеет минимальное количество истинных измерений (размерность...
188 просмотров
schedule
04.03.2024
Сортировка вектора на основе уникальной частоты значений
Я группирую строки матрицы NxM , используя kmeans .
clustIdx = kmeans(data, N_CLUST, 'EmptyAction', 'drop');
Затем я перестраиваю строки моей матрицы так, чтобы соседние строки находились в одном кластере.
dataClustered =...
543 просмотров
schedule
31.05.2024
Геопространственная кластеризация (MongoDB)
У меня сотни тысяч объектов на карте. И выбирать из базы почти все из них (в пределах прямоугольника контейнера карты в мелком масштабе) - очень плохая практика. Нужна кластеризация внутри БД. В реляционной базе данных часто используется...
3981 просмотров
schedule
25.02.2024
Вызов R в java-Rcaller
Я пытаюсь реализовать кластеризацию с использованием R в java, используя R caller. Я пытаюсь запустить пример кода для проверки кластеризации и получаю распространенную ошибку, с которой сталкивается большинство пользователей: Преждевременный конец...
3521 просмотров
schedule
14.10.2022
Внедрение ELKI COPAC
Я попытался запустить реализацию COPAC ELKI на примере набора данных, представленного на официальном сайте (mouse.csv), но я получаю исключение NullPointerException, которое заставляет меня думать, что есть некоторые детали, которые я опускаю (позор...
312 просмотров
schedule
22.04.2024
Понимание кластеризации дендограмм тепловой карты в R
Буду признателен за любой информационный материал о дендограммах (Colv, Rowv) функции тепловой карты R. Например, как работает кластеризация (это евклидово расстояние?). Вам не нужно публиковать длинные объяснения, я уже был бы рад некоторым...
9905 просмотров
schedule
10.03.2024
Получение наблюдений внутри каждого кластера
Можно ли получить фактические наблюдения в каждом кластере после выполнения k-средних в R?
Например, после моего анализа у меня есть 2 кластера, и я хочу найти точные наблюдения в каждом кластере, возможно ли это?
1153 просмотров
schedule
30.11.2022
Python - Кластеризация с помощью K-средних. Некоторые столбцы с нулевой дисперсией
У меня есть набор данных, состоящий из ~ 200 массивов частот 99x20, где сумма каждого столбца равна единице. Я построил их с помощью тепловых карт, например . Каждый массив довольно разрежен, только около 1-7 / 20 значений на 99 позиций отличны от...
1652 просмотров
schedule
27.01.2024
Получить значения в каждом кластере в R
Я успешно запустил алгоритм DBSCAN (вот урезанная команда):
results <- dbscan(data,MinPts=15, eps=0.01)
и построил мои кластеры:
plot(results, data)
results$cluster возвращает список с числовыми значениями. Значение в каждом...
517 просмотров
schedule
23.03.2024
Работа с кластерами при поиске точек на карте с помощью mysql
Я нашел различные вопросы с решениями, аналогичными этой проблеме, но пока ничего не стоит. Очень благодарен за любую помощь.
У меня есть база данных mysql (v.5.6.10) с одной таблицей с именем POSTS, в которой хранятся миллионы и миллионы строк...
835 просмотров
schedule
27.01.2024
Записывает корреляцию/кластеризацию с использованием Hadoop
Наш кластер Hadoop ежедневно обрабатывает несколько терабайт веб-журналов. Каждая запись журнала содержит такую информацию, как IP-адрес пользователя, идентификатор файла cookie и т. д. Однако одному физическому пользователю (домашнему/рабочему...
884 просмотров
schedule
02.11.2022
Как я могу использовать индексные структуры в ELKI?
Это цитаты из http://elki.dbs.ifi.lmu.de/ :
«По сути, мы привязываем абстрактный запрос расстояния к базе данных, а затем получаем поиск ближайшего соседа для этого расстояния. В этот момент ELKI автоматически выберет наиболее подходящий класс...
634 просмотров
schedule
26.02.2024
Математика: это кластеризация k-средних?
Привет! У меня есть несколько точек на линии. Эти точки не имеют измерения Y, только измерение X. Я разместил их только в измерении Y, потому что это хотело иметь возможность размещать несколько точек в одном и том же месте.
Я хотел бы...
256 просмотров
schedule
29.11.2023