Я пытаюсь получить «важные термины» для подмножества документов в Solr. Это может быть, а может и не быть лучшим способом, но в настоящее время я пытаюсь использовать функциональность Solr TF-IDF, поскольку у нас есть данные, хранящиеся в Solr, и это молниеносно. Я хочу ограничить счетчик "DF" подмножеством моих документов с помощью поиска или фильтра. Я пробовал это, где я ищу «яблоко» в поле имени:
и это, конечно, дает мне только документы, в названии которых есть слово «яблоко», но частота моего документа дает подсчеты из всего набора данных, что не похоже на то, что я хочу. Я бы подумал, что Solr может это сделать, но, может быть, нет. Я открыт для предложений.
Спасибо, Адриан