Я работаю над ранней версией Spark (alpha-0.1), чтобы понять, как это началось и как это развивалось. Я также пытаюсь понять, как работает чередование наименьших квадратов.
Я просматриваю пример SparkALS и вижу следующие переменные:
var M = 0 // Number of movies
var U = 0 // Number of users
var F = 0 // Number of features
Источник: https://github.com/apache/spark/blob/alpha-0.1/src/examples/SparkALS.scala#L11-L13
Что представляет собой переменная F (количество признаков)?
Могу ли я интерпретировать это как Количество скрытых факторов? Это также упоминается как rank
в документации Spark Collaborative Filtering страница:
ранг – это количество скрытых факторов в модели.