В SparkALS означает ли «Количество функций» также «Количество факторов»?

Я работаю над ранней версией Spark (alpha-0.1), чтобы понять, как это началось и как это развивалось. Я также пытаюсь понять, как работает чередование наименьших квадратов.

Я просматриваю пример SparkALS и вижу следующие переменные:

  var M = 0 // Number of movies
  var U = 0 // Number of users
  var F = 0 // Number of features

Источник: https://github.com/apache/spark/blob/alpha-0.1/src/examples/SparkALS.scala#L11-L13

Что представляет собой переменная F (количество признаков)?

Могу ли я интерпретировать это как Количество скрытых факторов? Это также упоминается как rank в документации Spark Collaborative Filtering страница:

ранг – это количество скрытых факторов в модели.


person Chris Snow    schedule 16.03.2017    source источник


Ответы (1)


А, В документах Spark API rank указывается как количество функций:

rank – количество используемых функций.

Поэтому я полагаю, что термины количество признаков и количество скрытых факторов взаимозаменяемы.

См. также: https://issues.apache.org/jira/browse/SPARK-20011

person Chris Snow    schedule 16.03.2017