Просто искам да знам ефекта от стойността на алфа в моделите за вграждане на думи gensim word2vec
и fasttext
? Знам, че алфа е initial learning rate
и стойността му по подразбиране е 0.075
от блога на Radim.
Какво ще стане, ако променя това на малко по-висока стойност, т.е. 0,5 или 0,75? Какъв ще е ефектът му? Разрешено ли е да се променя същото? Въпреки това промених това на 0,5 и експериментирах с данни с голям размер с D = 200, прозорец = 15, min_count = 5, iter = 10, работници = 4 и резултатите са доста значими за модела word2vec. Въпреки това, използвайки модела fasttext, резултатите са малко разпръснати, което означава по-малко свързани и непредсказуеми резултати за сходство с високо-ниско ниво.
Защо този неточен резултат за едни и същи данни с два популярни модела с различна точност? Дали стойността на alpha
играе толкова решаваща роля по време на изграждането на модела?
Всяко предложение се оценява.