Искам да направя сравнителен анализ на индекси за пълнотекстово търсене в PostgreSQL, SQLServer и Lucene.
Някакви идеи къде да намеря добра голяма примерна база данни, към която да извършвам заявки?
Благодаря много предварително.
Искам да направя сравнителен анализ на индекси за пълнотекстово търсене в PostgreSQL, SQLServer и Lucene.
Някакви идеи къде да намеря добра голяма примерна база данни, към която да извършвам заявки?
Благодаря много предварително.
Мисля, че чудесният източник би бил дъмпът на базата данни на wikipedia, тъй като те съдържат наистина голямо количество текст. Те са достъпни тук: http://dumps.wikimedia.org/
Можете също да опитате usenet архив, но там е по-трудно да изберете целеви език и качеството на използвания език също е по-ниско.