Где взять большое количество правил и фактов или как сгенерировать их для теста Drools?

Я хотел бы протестировать производительность Drools, например потребление памяти и скорость вывода для большого объема данных. Я сделал это с помощью тестов, доступных в проектах drools https://github.com/droolsjbpm/drools. просто как другой пример там. Существуют часто используемые тесты, такие как манеры, вальс и вальцдб. Но на моем компьютере они занимают десятки секунд. Не могли бы вы предложить мне какие-либо источники правил и объектов/фактов, которые я могу использовать и тестировать бесплатно с помощью Drools? Может быть, можно сгенерировать такие данные и правила? Тогда как я мог это сделать?

Спасибо за помощь.


person gadon    schedule 08.11.2013    source источник
comment
Я хочу иметь тесты, которые показывают пограничные случаи. И выясните, какие объекты вызывают проблемы с памятью и скоростью. Анализируя научные статьи о Рете, я догадываюсь, где это может быть, но я хотел бы знать в этой конкретной реализации.   -  person gadon    schedule 08.11.2013
comment
Дайте определение пограничным случаям. Пограничный в каком смысле?   -  person Ian McLaird    schedule 08.11.2013
comment
Когда объекты хранятся в памяти, занимают, например. несколько сотен МБ или даже больше, если это возможно. Основываясь на мнении некоторых профессионалов, я знаю, что у механизмов логического вывода возникают проблемы с большими объемами данных. А мне интересны такие случаи. Спасибо.   -  person gadon    schedule 09.11.2013


Ответы (1)


Стоит отметить, что эти тесты не имеют никакой цели. Они в основном специально разработаны для выполнения действий, которые неэффективны в механизмах правил. Они даже не имеют большого значения для сравнения между движками, учитывая, что вы вряд ли когда-нибудь напишете реальное приложение, похожее на Miss Manners.

Если вам просто нужны большие объемы данных для ваших тестов, существует множество открытых данных. Например, Великобритания предоставляет множество наборов открытых данных. Здесь вы можете выбрать тот, который подходит для вашего эксперимента.

http://data.gov.uk/data/search

Или вы можете загрузить данные о последовательности генов из GenBank:

http://www.ncbi.nlm.nih.gov/genbank/

Существует множество бесплатных данных, для которых вы можете написать правила.

Если вы действительно ищете эталонные механизмы правил, то, вероятно, было бы лучше генерировать данные самостоятельно. Это лучший способ убедиться, что вы получаете надежные статистические вариации.

Тем не менее, все, что вы будете делать, — это сравнивать определенный набор правил. Любые такие тесты станут излишними, как только правила изменятся.

person Steve    schedule 09.11.2013
comment
Спасибо за ответ Стив! Недавно я также подумал о том, чтобы расширить тест мисс манер за счет добавления гостей, вы думаете, что это не стоит усилий? Может быть, вы можете дать мне несколько советов, если я решу создать данные самостоятельно. - person gadon; 09.11.2013
comment
Все зависит от того, чего вы пытаетесь достичь с помощью эталона. Что это на самом деле говорит вам? Я не удивлюсь, если уже есть много исследований о том, что произойдет, если вы добавите больше гостей к мисс Мэннерс. Также есть много способов обмануть его, поскольку известно, что ряд механизмов правил оптимизируется для тестов. - person Steve; 09.11.2013
comment
Вот один из примеров большего количества гостей: blog.athico. .com/2009/05/ - person Steve; 09.11.2013