Я пытаюсь извлечь даты из 40 тыс. URL-адресов. URL-адреса такие:
1) ht-p://mashable.com/2014/09/19/shonda-rhimes-new-york-times/
2) http://mashable.com-2014/11/02/friendly-robbers-snl-sketch/
Я использую это:
ymd(as.numeric(gsub("\\D", "", df$URL)))
который отлично работал с 1 или 2 записями, но с 40k записями это дает мне
Предупреждающее сообщение: 4714 не удалось проанализировать. Это дает NA для этих 4714 значений.
Я что-то упускаю?
ymd(as.numeric(gsub(".*/(\\d{4}/\\d{2}/\\d{2})/.*", "\\1", df$URL)))
- person Avinash Raj   schedule 14.08.2016urls = rep(c("ht-p://mashable.com/2014/09/19/shonda-rhimes-new- york-times/", "http://mashable.com-2014/11/02/friendly-robbers-snl-sketch/"), 20000)
dates = ymd(as.numeric(gsub("\\D", "", urls)))
- person Aleksandr   schedule 15.08.2016