Публикации по теме 'cluster-analysis'


Кластерный анализ
Кластерный анализ — это неконтролируемая задача обучения, в которой собираются однородные кластеры записей, чтобы получить представление о данных. Другими словами, мы делим все данные на несколько групп на основе шаблонов в наборе данных. При кластеризации нам не нужно предсказывать цель. Свойства кластеров – 1. Все точки данных в кластере должны быть одинаковыми. 2. Точки данных из кластеров должны максимально различаться. Приложения . Кластерный анализ можно использовать в..

Кластеризация K-средних и ее вариант использования в домене безопасности
Кластеризация методом K-средних — один из самых простых и популярных алгоритмов машинного обучения без учителя. Неконтролируемое обучение Обучение без учителя – это метод машинного обучения, в котором для обучающих данных нет меток. Алгоритм машинного обучения пытается изучить основные шаблоны или распределения, управляющие данными. Кластеризация Кластеризация — один из наиболее распространенных методов исследовательского анализа данных, используемых для получения..

HDSC Stage G OSP: анализ фильмов
Определение жанра фильма на основе рабочих ролей съемочной группы с использованием обработки естественного языка и изучение факторов, которые приводят к успеху фильма. Веб-сайт проекта : Веб-сайт анализа фильмов Введение Фильмы - это, пожалуй, высшая форма искусства. Эти медиа-творения обычно оставляют следы вопросов и воображения в умах зрителей, которые сознательно или бессознательно пытаются понять все, что происходит «под капотом» и «за пределами большого экрана»...

Вопросы по теме 'cluster-analysis'

Перевод задачи кластеризации на язык теории графов
У меня есть прямоугольная плоская сетка, в которой каждой ячейке присвоен некоторый целочисленный вес. Я ищу алгоритм для идентификации кластеров от 3 до 6 соседних ячеек с весом выше среднего. Эти капли должны иметь примерно круглую форму. Для...
577 просмотров
schedule 11.12.2023

Алгоритм кластеризации [оценки] с матрицей расстояний в качестве входных данных
Может ли кто-нибудь предложить алгоритм кластеризации, который может работать с матрицей расстояний в качестве входных данных? Или алгоритм, который может оценить «качество» кластеризации также на основе матрицы расстояний? В данный момент я...
2662 просмотров
schedule 30.01.2024

Кластер одинаковой широты/долготы gmaps v3
На моем веб-сайте у меня есть форма, которая позволяет пользователям регистрироваться. Он просит пользователей указать свой город, штат и страну. У меня также есть карта, которая отбрасывает маркер для каждого пользователя на основе широты и...
1248 просмотров

Ключевые соображения/подводные камни для веб-приложения Java, которое должно работать в кластерной среде?
У нас есть веб-приложение Java, использующее Spring и Hibernate и имеющее довольно стандартную архитектуру. В настоящее время приложение поддерживает клиентов на основе SOAP в дополнение к клиенту Flex GUI, который взаимодействует через AFM/HTTP с...
365 просмотров

Кластеризация древовидных данных
Предположим, нам даны данные в полуструктурированном формате в виде дерева. Например, дерево может быть сформировано как действительный документ XML или как действительный документ JSON. Вы можете представить, что это S-выражение, похожее на...
2218 просмотров

Как указать метрику расстояния для kmeans в R?
Я делаю кластеризацию kmeans в R с двумя требованиями: Мне нужно указать свою собственную функцию расстояния, теперь это коэффициент Пирсона. Я хочу выполнить кластеризацию, в которой в качестве центроидов используется среднее значение...
10964 просмотров
schedule 06.03.2024

Надлежащая мера подобия для кластеризации
У меня проблемы с поиском правильной меры сходства для кластеризации. У меня есть около 3000 массивов наборов, где каждый набор содержит функции определенного домена (например, число, цвет, дни, алфавиты и т. д.). Я объясню свою проблему на примере....
483 просмотров

Многомерная кластеризация логических значений
Вот мой сценарий проблемы: У меня есть несколько тысяч объектов. Каждый объект имеет 256 логических измерений (истинных или ложных). Я хочу найти такие кластеры, что Каждый кластер имеет минимальное количество истинных измерений (размерность...
188 просмотров

Сортировка вектора на основе уникальной частоты значений
Я группирую строки матрицы NxM , используя kmeans . clustIdx = kmeans(data, N_CLUST, 'EmptyAction', 'drop'); Затем я перестраиваю строки моей матрицы так, чтобы соседние строки находились в одном кластере. dataClustered =...
543 просмотров
schedule 31.05.2024

Геопространственная кластеризация (MongoDB)
У меня сотни тысяч объектов на карте. И выбирать из базы почти все из них (в пределах прямоугольника контейнера карты в мелком масштабе) - очень плохая практика. Нужна кластеризация внутри БД. В реляционной базе данных часто используется...
3981 просмотров

Вызов R в java-Rcaller
Я пытаюсь реализовать кластеризацию с использованием R в java, используя R caller. Я пытаюсь запустить пример кода для проверки кластеризации и получаю распространенную ошибку, с которой сталкивается большинство пользователей: Преждевременный конец...
3521 просмотров
schedule 14.10.2022

Внедрение ELKI COPAC
Я попытался запустить реализацию COPAC ELKI на примере набора данных, представленного на официальном сайте (mouse.csv), но я получаю исключение NullPointerException, которое заставляет меня думать, что есть некоторые детали, которые я опускаю (позор...
312 просмотров

Понимание кластеризации дендограмм тепловой карты в R
Буду признателен за любой информационный материал о дендограммах (Colv, Rowv) функции тепловой карты R. Например, как работает кластеризация (это евклидово расстояние?). Вам не нужно публиковать длинные объяснения, я уже был бы рад некоторым...
9905 просмотров
schedule 10.03.2024

Получение наблюдений внутри каждого кластера
Можно ли получить фактические наблюдения в каждом кластере после выполнения k-средних в R? Например, после моего анализа у меня есть 2 кластера, и я хочу найти точные наблюдения в каждом кластере, возможно ли это?
1153 просмотров
schedule 30.11.2022

Python - Кластеризация с помощью K-средних. Некоторые столбцы с нулевой дисперсией
У меня есть набор данных, состоящий из ~ 200 массивов частот 99x20, где сумма каждого столбца равна единице. Я построил их с помощью тепловых карт, например . Каждый массив довольно разрежен, только около 1-7 / 20 значений на 99 позиций отличны от...
1652 просмотров

Получить значения в каждом кластере в R
Я успешно запустил алгоритм DBSCAN (вот урезанная команда): results <- dbscan(data,MinPts=15, eps=0.01) и построил мои кластеры: plot(results, data) results$cluster возвращает список с числовыми значениями. Значение в каждом...
517 просмотров
schedule 23.03.2024

Работа с кластерами при поиске точек на карте с помощью mysql
Я нашел различные вопросы с решениями, аналогичными этой проблеме, но пока ничего не стоит. Очень благодарен за любую помощь. У меня есть база данных mysql (v.5.6.10) с одной таблицей с именем POSTS, в которой хранятся миллионы и миллионы строк...
835 просмотров

Записывает корреляцию/кластеризацию с использованием Hadoop
Наш кластер Hadoop ежедневно обрабатывает несколько терабайт веб-журналов. Каждая запись журнала содержит такую ​​информацию, как IP-адрес пользователя, идентификатор файла cookie и т. д. Однако одному физическому пользователю (домашнему/рабочему...
884 просмотров

Как я могу использовать индексные структуры в ELKI?
Это цитаты из http://elki.dbs.ifi.lmu.de/ : «По сути, мы привязываем абстрактный запрос расстояния к базе данных, а затем получаем поиск ближайшего соседа для этого расстояния. В этот момент ELKI автоматически выберет наиболее подходящий класс...
634 просмотров

Математика: это кластеризация k-средних?
Привет! У меня есть несколько точек на линии. Эти точки не имеют измерения Y, только измерение X. Я разместил их только в измерении Y, потому что это хотело иметь возможность размещать несколько точек в одном и том же месте. Я хотел бы...
256 просмотров
schedule 29.11.2023