Свързани въпроси 'mahout'

Съвет за алгоритъм на Mahout
Това, от което се нуждая, всъщност е просто намек откъде мога да започна. Донякъде съм запознат с Mahout, поне теоретично. Знам как работи, как да го настроя и т.н. и мога да създам проста система за препоръки, базирана на съвместно филтриране....
318 изгледи
schedule 22.10.2023

Mahout 0.7 Не успя да получи препоръка с големи данни с помощта на MysqlJdbcDataModel
Използвам Mahout, за да изградя базиран на артикули двигател за препоръки Cf. Създавам клас MahoutHelper, който има конструктор: public MahoutHelper(String serverName, String user, String password, String DatabaseName, String...
321 изгледи
schedule 01.12.2022

Използване на множество, претеглени модели на данни за препоръчител на Mahout
Имам булев препоръчител за предпочитания въз основа на приликата на потребителите. Моят набор от данни по същество съдържа релации, където ItemId са статии, които потребителят е решил да прочете. Бих искал да добавя втори модел на данни, съдържащ...
1200 изгледи
schedule 11.12.2022

Вземете потребителски квартал от допълнителни данни в съвместното филтриране
Исках да направя препоръка въз основа на множество набори от данни като в Използване на множество, претеглени модели на данни за препоръчител на Mahout Но моят проблем е, че допълнителните набори от данни не се превръщат добре в първични...
338 изгледи

Получаване на резултат от празен клъстер с команда vectordump в алгоритъма mahout kmeans
инсталирах и стартирах hadoop и изпълнявам командите по-долу mahout seqdirectory -c UTF-8 -i Input_files -o seqfiles mahout seq2sparse -i seqfiles/ -o vectorfiles/ -ow mahout kmeans -i vectorfiles/tf-vectors/ -c initial-clusters -o...
242 изгледи
schedule 02.12.2022

Mahout k-означава команда за клъстериране: изправена пред проблеми с пространството на купчина
Опитвам се да извърша клъстериране на k-средства, използвайки mahout върху набор от данни от 300 MB, съдържащ само числови стойности. Но ми изчерпва паметта в командата k-means след втората итерация. Защо размерът се увеличава след всяка итерация?...
168 изгледи

Mahout грешка с Hadoop2.2
Опитвам се да изпълня задача на mapreduce за анализ на XML, използвайки библиотека mahout 0.9 на Hadoop 2.2. Но получавам следната грешка: 14/02/24 16:03:02 INFO mapreduce.Job: Task Id : attempt_1393235568433_0004_m_000000_0, Status : FAILED...
1179 изгледи
schedule 23.10.2022

Ако паролите са хеширани с 1.2.x, вероятно трябва да добавите grails.plugin.springsecurity.password.hash.iterations=1 към Config.groovy, тъй като новата стойност по подразбиране е 10000.
213 изгледи

Най-ефективната мярка за сходство за класирани в списък елементи
Опитваме се да намерим сходство между елементи (и по-късни потребители), където елементите са класирани в различни списъци от потребители (помислете за Роб, Бари и Дик в Здравей Fidelity ). По-нисък индекс в даден списък предполага по-висок рейтинг....
1885 изгледи

Mahout LDA: кой е най-големият размер на речника, който практически може да се използва?
Пускам LDA на Mahout на EC2 (използвайки Whirr). Кой е най-големият речник, който успяхте да използвате на практика? Бихте ли споделили някои настройки на Hadoop/EC2? В идеалния случай бих искал да стартирам LDA на корпус от 3M документи (1B...
293 изгледи
schedule 27.12.2023

Разлика между Rescorer и UserSimilarity в Mahout
Внедрявам потребителски препоръчител, който трябва да работи само върху категории елементи, за да избегна изчисленията върху безполезни данни. За да бъда по-ясна, ако даден потребител е в страница с категория, не искам да изчислявам предпочитанията...
425 изгледи
schedule 21.04.2024

Как да конвертирате Mahout VectorWritable във Vector в Spark
Имам VectorWritable ( org.apache.mahout.math.VectorWritable ), който идва от файл с последователност, генериран от Mahout, и бих искал да го конвертирам във векторен ( org.apache.spark.mllib.linalg.Vectors ) тип е Spark. Как мога да направя това в...
213 изгледи

Изпълнение на голмайстор на Mahout
Бих искал да претегля всичките си стойности на PearsonItemSimilarity между два елемента по броя корации, които споделят, разделен на 50. Или с други думи актуализирайте общото сходство на Pearson между два артикула (артикули a и b например)...
557 изгледи
schedule 25.05.2024

Грешка: java.lang.ClassNotFoundException: org.apache.mahout.common.RandomWrapper
Създавам софтуер, използвайки Java 8 с Hadoop и Mahout 0.10.0 с някои персонализирани промени в кода на Mahout Library. Използвам Maven за управление на зависимости. Други зависимости се обработват от maven като hadoop common и hdfs и yarn. Имам...
131 изгледи
schedule 04.06.2024