В связи с тем, что в настоящее время я работаю над очень несбалансированной проблемой классификации нескольких классов, я рассматриваю сбалансированные случайные леса (https://statistics.berkeley.edu/sites/default/files/tech-reports/666.pdf). У вас есть опыт реализации сбалансированных случайных лесов с помощью H2O? Если да, то не могли бы вы уточнить следующий вопрос:
Можно ли вообще изменить процесс создания бутстрап-выборок в H2O по умолчанию, чтобы получить сбалансированные подвыборки (для каждой итерации в случайном лесу брать бутстрап-выборку из класса меньшинства? замена, из большинства классов) исходного набора данных для каждого растущего дерева?