Може ли някой да ми обясни каква е целта на функцията setThresholds()
върху градиентно подсилени дървета и произволна гора в Apache Spark? Няма документация или пример в официалния уебсайт на Apache Spark, където се използва тази функция и съм любопитен да видя дали мога да я използвам за моята конкретна цел. Тази функция задава ли прагове на вътрешните решения, които дървото взема? Например, за цифрова колона използването на setThresholds(5.0)
е еквивалентно на if(column < 5.0)
? или греша?
Задаване на прагове в дървото на решенията?
Отговори (1)
Изглежда не сте проверили правилните части на документация.
Стойността thresholds
се дефинира както следва:
Параметър за прагове в многокласова класификация за коригиране на вероятността за прогнозиране на всеки клас. Масивът трябва да има дължина, равна на броя на класовете, със стойности >= 0. Предсказва се класът с най-голяма стойност p/t, където p е първоначалната вероятност за този клас, а t е прагът на класа.
И забелязахте, че това всъщност са прагове в множествено число, а не само един праг.
Можете да зададете прагове, като използвате setThresholds(foo)
, където foo
са стойностите на праговете.
person
eliasah
schedule
08.08.2017
Не се показва тук: spark.apache.org/docs/latest/api/java/org/apache/spark/ml/
- person Guillermo Herrera; 08.08.2017
Изглежда, че цялата поддръжка се дава само на Scala или Python, а не на Java. Повечето методи изобщо не са обяснени в Java API документацията
- person Guillermo Herrera; 08.08.2017
Наистина. Не съм го забелязвал преди. Просто никога не използвам Java API tbh
- person eliasah; 08.08.2017