Пиша персонализиран индексатор на Lucene.NET, за да разреша индексирането на документи на MS Word. Индексаторът трябва да може да обработва последните три версии на MS Word: 2010, 2007 и 2003.
Планът е да се използват модули за взаимодействие на VSTO, които са инсталирани като част от VS2010 за извличане на текстово съдържание от документите.
Има ли по-добър начин за внедряване на индексиране на документи на Word? Това означава ли, че ще трябва да инсталирам и трите версии на Word на сървъра? Или само Word 2010?
Инструменти/Среда:
- Lucene.NET 2.3.1.3
- VS2010 / .NET 3.5
- Windows 2008 / IIS 7
Забележка: За подробности как да приложите това вижте Търсене на текст в Sitecore в PDF или Word документи