Задаване на прагове в дървото на решенията?

Може ли някой да ми обясни каква е целта на функцията setThresholds() върху градиентно подсилени дървета и произволна гора в Apache Spark? Няма документация или пример в официалния уебсайт на Apache Spark, където се използва тази функция и съм любопитен да видя дали мога да я използвам за моята конкретна цел. Тази функция задава ли прагове на вътрешните решения, които дървото взема? Например, за цифрова колона използването на setThresholds(5.0) е еквивалентно на if(column < 5.0)? или греша?


person Guillermo Herrera    schedule 07.08.2017    source източник


Отговори (1)


Изглежда не сте проверили правилните части на документация.

Стойността thresholds се дефинира както следва:

Параметър за прагове в многокласова класификация за коригиране на вероятността за прогнозиране на всеки клас. Масивът трябва да има дължина, равна на броя на класовете, със стойности >= 0. Предсказва се класът с най-голяма стойност p/t, където p е първоначалната вероятност за този клас, а t е прагът на класа.

И забелязахте, че това всъщност са прагове в множествено число, а не само един праг.

Можете да зададете прагове, като използвате setThresholds(foo), където foo са стойностите на праговете.

person eliasah    schedule 08.08.2017
comment
Не се показва тук: spark.apache.org/docs/latest/api/java/org/apache/spark/ml/ - person Guillermo Herrera; 08.08.2017
comment
Изглежда, че цялата поддръжка се дава само на Scala или Python, а не на Java. Повечето методи изобщо не са обяснени в Java API документацията - person Guillermo Herrera; 08.08.2017
comment
Наистина. Не съм го забелязвал преди. Просто никога не използвам Java API tbh - person eliasah; 08.08.2017