Google Assistant наскоро получи достъп до действия на трети страни, които да бъдат използвани в техните приложения. Използвах това в моя Google Home, за да тествам дали „Akinator Genie“ ще работи. Ако не знаете, Акинатор е „джин“, който може да отгатне всеки измислен или реален човек в толкова много въпроси. Първо се сетих за Волдемор и Акинатор успя да отгатне правилно в рамките на 20 въпроса. Алгоритъмът надолу към костите най-вероятно е дърво на решенията.

Дървото на решенията е най-лесно за разбиране чрез картина на процеса, който предприема. Тази снимка е дърво на решенията, базирано на набора от данни на Титаник, за да разберете процента на онези, които са оцелели и които не са. В повечето снимки на дървото на решенията левият клон обикновено е вярно или да, докато десният клон обикновено е невярно или не. В този пример дървото на решенията задава въпроса „мъжки ли е сексът?“. Ако е вярно, продължете към левия клон. Ако е невярно, продължете към десния клон. Ако отидем надолу по десния клон, ще разберем, че ако НЕ си бил мъж на Титаник, си имал 73% шанс да оцелееш. Този факт стана известен във филмите за Титаник, където „първо жените и децата“ намалява вероятността мъж да оцелее след корабокрушението.

Защо да използвате дървета на решенията?

В науката за данни дърветата на решенията и техните съвкупни, произволни гори често се използват поради тяхната простота и интерпретируемост. Това е особено лесно да се направи в Python. Можете да използвате библиотеки: sklearn, IPython.display и pydotplus, за да очертаете всички клонове и решения, направени от вашето дърво на решения в лесна за възприемане блок-схема.

В този пример ние определяме дали едно училище е частно или обществено. Първият ред на всеки възел за решение е решението, използвано за разделяне на вашите данни, за да достигнете в крайна сметка планираната класификация, която сте посочили. Така че, ако F.Undergrad е по-малко или равно на 2995, продължете наляво. В крайна сметка достигаме точка, в която не можем да продължим по-нататък, листовия възел. Във всеки възел разделът „стойност“ е броят на това колко от общите проби попадат в класификацията на частните или държавните училища. Първата стойност съответства на държавно училище, а втората стойност съответства на частно училище. Ако сте объркани кое кое е, използвайте кода clf.classes_

И накрая, прикачих кода на шаблона за извеждане на визуалното дърво на решенията, използвайки код, който ми беше даден от Общото събрание. Само копиране и поставяне за сега, докато не разбера малко по-добре тънкостите.

Още веднъж помолих Akinator Genie да познае героя ми. Този път се сетих за Хари Потър. Акинатор го хвана за по-малко от 10 въпроса. Очевидно той винаги е доста добро предположение.

Благодаря, че стигнахте до тук! Ако имате въпроси, свободни места или възможности в района на Атланта, моля, напишете коментар по-долу!