Примерна база данни за пълнотекстово търсене

Искам да направя сравнителен анализ на индекси за пълнотекстово търсене в PostgreSQL, SQLServer и Lucene.

Някакви идеи къде да намеря добра голяма примерна база данни, към която да извършвам заявки?

Благодаря много предварително.


person Pablo Santa Cruz    schedule 08.09.2010    source източник
comment
Този въпрос също би бил по темата на opendata.stackexchange.com   -  person Nicolas Raoul    schedule 24.07.2015


Отговори (1)


Мисля, че чудесният източник би бил дъмпът на базата данни на wikipedia, тъй като те съдържат наистина голямо количество текст. Те са достъпни тук: http://dumps.wikimedia.org/

Можете също да опитате usenet архив, но там е по-трудно да изберете целеви език и качеството на използвания език също е по-ниско.

person Danubian Sailor    schedule 24.02.2011
comment
Добра точка. Може също да е изхвърлянето на въпроси на STACKOVERFLOW... :-) - person Pablo Santa Cruz; 24.02.2011