Я просто хочу знать влияние значения альфа в моделях gensim word2vec
и fasttext
встраивания слов? Я знаю, что альфа - это initial learning rate
, а его значение по умолчанию - 0.075
из блога Radim.
Что, если я изменю его на немного большее значение, например 0,5 или 0,75? Каков будет его эффект? Можно ли менять то же самое? Однако я изменил это значение на 0,5 и поэкспериментирую с данными большого размера с D = 200, window = 15, min_count = 5, iter = 10, worker = 4, и результаты в значительной степени значимы для модели word2vec. Однако при использовании модели fasttext результаты разбросаны по битам, что означает менее взаимосвязанные и непредсказуемые оценки сходства с высокими и низкими значениями.
Почему такой неточный результат для одних и тех же данных с двумя популярными моделями с разной точностью? Играет ли значение alpha
столь важную роль при построении модели?
Любое предложение приветствуется.