Кто-нибудь знает, существует ли он?
Я гуглил это уже несколько месяцев ...
Спасибо
Кто-нибудь знает, существует ли он?
Я гуглил это уже несколько месяцев ...
Спасибо
Обновление
HebMorph
Из любопытства, вызванного вашим вопросом, я связался с Итамаром Син-Хершко, который был активен в списках рассылки Lucene около года назад, когда он работал над анализатором иврита для Lucene. Я спросил его, закончил ли он свой анализатор. Вот некоторые важные моменты из его ответа:
Короче говоря, нет, я этого не делал. Для Lucene не существует достойного бесплатного / открытого анализатора иврита, что я могу сказать точно. Я не уверен, каков ваш опыт в этой теме, но поверьте мне, когда я говорю, что нет простого способа сделать это; возможно, Lucene не создан для поиска на иврите, но я согласен, что решение должно быть найдено. Конечно, самый безопасный способ индексирования и поиска текстов на иврите - использовать специализированный стеммер, а интеграция с Lucene - не самый простой способ даже после того, как вы это сделаете. На рынке есть несколько очень хороших решений для поиска на иврите, и только одно, о котором я знаю, использует Lucene в своем ядре; Я недавно пытался с ними связаться, ответа пока нет ...
Упомянутый коммерческий продукт, основанный на Lucene, называется ATTIVIO и веб-сайтом ATTIVIO утверждает, что поддерживает иврит. В SIGTRS (группа интересов по поиску текста на иврите) были некоторые обсуждение ATTIVIO, в котором утверждается, что он основан на Lucene.
Таким образом, очевидно, что можно создать достойный анализатор иврита для Lucene, но в настоящее время нет доступного бесплатного анализатора.
В dtsearch есть плагин для сокращения корней иврита, который называется "pensim". Похоже, он был разработан wizcomtech.com.