Что я хочу сделать:
Пользователь загружает текст. Я анализирую его и получаю из него все слова и знаки препинания. Теперь я могу легко отображать текст для других пользователей с быстрым переводом каждого слова или дополнительной информацией об анализируемых словах.
Теперь я пытаюсь использовать treat gem (NLP для ruby), но с ним много проблем.
например в предложении
«Мир состоит не только из солнечного света и радуги».
Он делит не на два слова "ай" и "нет"
Может ли кто-нибудь предложить некоторые библиотеки или драгоценные камни, возможно, которые я могу реализовать с помощью jruby, где я могу без проблем просто отделять текст от слов и знаков препинания.
Или мб я не прав в своих представлениях и есть какие-то другие способы?