Имам два вектора от тип символ в R.
Искам да мога да сравня референтния списък със списъка със сурови символи с помощта на jarowinkler и да присвоя % резултат за сходство. Така че, например, ако имам 10 референтни елемента и двадесет елемента необработени данни, искам да мога да получа най-добрия резултат за сравнението и това, с което алгоритъмът го е съпоставил (така че 2 вектора от 10). Ако имам необработени данни с референтни елементи с размер 8 и 10, трябва да завърша само с 2 векторен резултат от 8 елемента с най-добро съвпадение и резултат за елемент
артикул, кибрит, съвпадение_с лед, 78, сладолед
По-долу е моят код, който не е много за гледане.
NumItems.Raw = length(words)
NumItems.Ref = length(Ref.Desc)
for (item in words)
{
for (refitem in Ref.Desc)
{
jarowinkler(refitem,item)
# Find Best match Score
# Find Best Item in reference table
# Add both items to vectors
# decrement NumItems.Raw
# Loop
}
}