Я пытаюсь сопоставить таблицы, если строка полностью присутствует в столбце других таблиц. Однако мне удалось частично присоединиться к нему, а затем я применяю расстояние Левенштейна, чтобы получить близкие совпадения. Этот подход имеет ограниченное применение и точность. Подход:
checkg <- check %>%
fuzzy_inner_join(LOCATIONS, by = c("STRING" = "STRING"), match_fun = str_detect) %>%
rowwise() %>%
mutate(DIST = adist(x=STRING, y=LOCATION, ignore.case = TRUE))
есть ли способ отобразить его следующим образом? Столбец STATUS в выходной таблице дан только для того, чтобы было ясно, что частичное совпадение строк не является целью. В выводе не требуется. Спасибо
TABLE 1
**STRING**
BATANGAS
QINGDAO
TABLE2
**STRING**
BATNAGAS LUZON
QINGDAO PT
OUTPUT TABLE checkg
TABLE1.STRING TABLE2.STRING STATUS
BATANGAS BATNAGAS LUZON Accept
QINGDAO QINGDAO PT Accept
BATANGAS TANGA Reject
TANGA
сохраняется как значение в вашем образце? - person AnilGoyal   schedule 29.01.2021