Я пытаюсь оценить константы для закона кучи. У меня есть следующий набор данных novels_colection
:
Number of novels DistinctWords WordOccurrences
1 1 13575 117795
2 1 34224 947652
3 1 40353 1146953
4 1 55392 1661664
5 1 60656 1968274
Затем я создаю следующую функцию:
# Function for Heaps law
heaps <- function(K, n, B){
K*n^B
}
heaps(2,117795,.7) #Just to test it works
Таким образом, n = Word Occurrences
, K
и B
— это значения, которые должны быть константами, чтобы найти мой прогноз различных слов.
Я пробовал это, но это дает мне ошибку:
fitHeaps <- nls(DistinctWords ~ heaps(K,WordOccurrences,B),
data = novels_collection[,2:3],
start = list(K = .1, B = .1), trace = T)
Ошибка = Error in numericDeriv(form[[3L]], names(ind), env) :
Missing value or an infinity produced when evaluating the model
Любая идея о том, как я могу исправить это или метод, чтобы соответствовать функции и получить значения для K
и B
?