Я новичок в R и интеллектуальном анализе текста. Я сделал облако слов из ленты Twitter, относящееся к какому-то термину. Проблема, с которой я столкнулся, заключается в том, что в wordcloud отображается http: ... или htt ... Как мне решить эту проблему Я пробовал использовать метасимвол *, но я все еще сомневаюсь, что применяю его правильно
tw.text = removeWords (tw.text, c (stopwords ("en"), "rt", "http \\ *"))
кто-нибудь занимается поиском текста, пожалуйста, помогите мне с этим.
gsub
для своих исходных данных. Пожалуйста, опубликуйте небольшой фрагмент ваших данных, текст, который нужно удалить, и желаемый результат. - person SabDeM   schedule 29.07.2015head(tweets,10) [1] "@amitkumarpatil2 @bdutt yes.\nhttp://t.co/6v2n4EHeoc" @mihirssharma http://t.co/WHnaJmUNNG" [7] "RT @QLDMackay: Cheap power or clean energy? Modi's $275 billion Indian dilemma http://t.co/YEaaHodO6p ... https://t.co/zfV2XRKwfl"
Итак, они включают URL-адреса страниц новостей и т. Д. - person Amanpreet Singh   schedule 30.07.2015