Вопросы по теме 'mahout'

Реализация оценщика Mahout
Я хотел бы взвесить все мои значения PearsonItemSimilarity между двумя предметами по количеству общих оценок, деленных на 50. Или, другими словами, обновите общее сходство Пирсона между двумя элементами (например, элементами a и b) соответствующим...
557 просмотров
schedule 25.05.2024

Разница между Rescorer и UserSimilarity в Mahout
Я реализую рекомендатор на основе пользователя, который должен работать только с категориями элементов, чтобы избежать вычислений с бесполезными данными. Чтобы быть более ясным, если пользователь находится на странице категории, я не хочу вычислять...
425 просмотров
schedule 21.04.2024

Совет по алгоритму Mahout
На самом деле мне нужна лишь подсказка, с чего я могу начать. Я немного знаком с Mahout, по крайней мере, теоретически. Я знаю, как это работает, как настроить и т. д., и я мог бы создать простую систему рекомендаций, основанную на совместной...
318 просмотров
schedule 22.10.2023

Mahout 0.7 Не удалось получить рекомендацию с большими данными с помощью MysqlJdbcDataModel
Я использую Mahout для создания рекомендательного механизма Cf на основе элементов. Я создаю класс MahoutHelper с конструктором: public MahoutHelper(String serverName, String user, String password, String DatabaseName, String...
321 просмотров
schedule 01.12.2022

Наиболее эффективная мера сходства для элементов списка
Мы пытаемся найти сходство между элементами (и более поздними пользователями), где элементы ранжируются пользователями в различных списках (вспомните Роба, Барри и Дика в Высокая точность ). Более низкий индекс в данном списке подразумевает более...
1885 просмотров

Mahout LDA: какой самый большой размер словаря, который можно практически использовать?
Я запускаю LDA Mahout на EC2 (используя Whirr). Какой самый большой словарный запас вам удалось использовать на практике? Не могли бы вы поделиться некоторыми настройками Hadoop/EC2? В идеале я хотел бы запустить LDA на корпусе из 3 миллионов...
293 просмотров
schedule 27.12.2023

Использование нескольких взвешенных моделей данных для рекомендателя Mahout
У меня есть логический рекомендатель предпочтений, основанный на сходстве пользователей. Мой набор данных по существу содержит отношения, где ItemId — это статьи, которые пользователь решил прочитать. Я хотел бы добавить вторую модель данных,...
1200 просмотров
schedule 11.12.2022

Получить окружение пользователя из дополнительных данных в совместной фильтрации
Я хотел сделать рекомендацию на основе нескольких наборов данных, например, с использованием нескольких, взвешенные модели данных для рекомендателя Mahout Но моя проблема в том, что дополнительные наборы данных плохо переводятся в основные...
338 просмотров

Получение результата пустого кластера с помощью команды vectordump в алгоритме mahout kmeans
я установил и запустил hadoop и выполнил следующие команды mahout seqdirectory -c UTF-8 -i Input_files -o seqfiles mahout seq2sparse -i seqfiles/ -o vectorfiles/ -ow mahout kmeans -i vectorfiles/tf-vectors/ -c initial-clusters -o kmeans-clusters...
242 просмотров
schedule 02.12.2022

Команда Mahout k-means кластеризации: проблемы с пространством в куче
Я пытаюсь выполнить кластеризацию k-средних, используя mahout для набора данных объемом 300 МБ, содержащего только числовые значения. Но у меня заканчивается память в команде k-means после второй итерации. Почему размер увеличивается после каждой...
168 просмотров

Ошибка Mahout с Hadoop2.2
Я пытаюсь выполнить задание mapreduce для синтаксического анализа XML с помощью библиотеки mahout 0.9 в Hadoop 2.2. Но я получаю следующую ошибку: 14/02/24 16:03:02 INFO mapreduce.Job: Task Id : attempt_1393235568433_0004_m_000000_0, Status :...
1179 просмотров
schedule 23.10.2022

Ошибка: java.lang.ClassNotFoundException: org.apache.mahout.common.RandomWrapper
Я создаю программное обеспечение, используя Java 8 с Hadoop и Mahout 0.10.0 с некоторыми пользовательскими изменениями в коде библиотеки Mahout. Я использую Maven для управления зависимостями. Другие зависимости обрабатываются maven, например,...
131 просмотров
schedule 04.06.2024

Как преобразовать Mahout VectorWritable в вектор в Spark
У меня есть VectorWritable ( org.apache.mahout.math.VectorWritable ), который исходит из файла последовательности, сгенерированного Mahout, и я хотел бы преобразовать его в тип Vector ( org.apache.spark.mllib.linalg.Vectors ) Spark. Как я могу...
213 просмотров

отображать название фильма вместо идентификатора фильма в качестве рекомендации от apache mahout
Я разрабатываю простую систему рекомендаций фильмов, используя apache mahout, ссылаясь на короткое видео здесь: https://www.youtube.com/watch?v=yD40rVKUwPI . Код для рекомендателя public class App { public static...
140 просмотров
schedule 11.06.2024