Я создал модель word2vec, используя gensim для огромного корпуса, и мне нужно сгруппировать словари, используя кластеризацию k означает, что мне нужно:
- Матрица косинусного расстояния (от слова к слову, поэтому размер матрицы равен number_of_words x number_of_words)
- матрица признаков (от слов к признакам, поэтому размер матрицы равен number_of_words x number_of_features(200))
для матрицы признаков я попытался использовать x=model.wv, и я получил тип объекта как gensim.models.keyedvectors.KeyedVectors, и он намного меньше, чем я ожидал, что матрица признаков будет
есть ли способ использовать этот объект напрямую для создания кластеризации k-средних?