Запомни това?

Това е Pokedex и ако се чудите, да, ще има много повтарящи се препратки към нашите Pokepals по време на това пътуване. Pokedex всъщност е вашият телефон, с изключение на това, че единствената му способност е търсене на Pokemon в Гугъл. Всеки герой има такъв. Не Pokedex, а някакъв помощник, който знае всичко. Човек или устройство, което остава до вас по време на пътуването и случайно има отговори на най-произволните въпроси и решения на най-тежките проблеми, които срещате. Люк имаше R2D2, г-н Бърнс имаше Смитърс и дори Куейлман имаше на кого да разчита.

И всички те се представиха отлично с достатъчно време, за да заинтригуват публиката, но не достатъчно, за да отвлекат вниманието от нашия герой или пътуването, защото нека си го кажем....

Ето защо разработих Datadex. Какво е Datadex, Ник? Страхотен въпрос, фиктивна аудитория. Радвам се, че зададохте. Datadex приема RDQ, произволни въпроси за научни данни и изплюва отговори. И така, по същество намирам отговора на произволните въпроси относно Data Science, които изникват и излизат от главата ми през целия ден, и публикувам отговорите тук в кратки, но много информативни (надявам се) статии.

Това ще постигне две неща. Първият е пълнител. Документацията ще помогне бавно да запълни изобилните празнини в знанията, които аз или вие, моята любима фиктивна аудитория, може да имаме, а второто е запълване (отново). Докато чакате следващия епизод на „The Road to Kaggle Grandmaster“, тези RDQ ще ви държат в течение на жаргона, техниките и всичко полезно, което можем да намерим по пътя.

И така, с достатъчно време за лице, за да заинтригува публиката, но не достатъчно, за да отвлече вниманието от нашия герой (мен), Datadex ще бъде идеалното допълнение по пътя към Kaggle Grandmaster.

"Ник, все още не разбирам." Добре, нека да преминем през двойка, за да започнем.

Случайни въпроси за науката за данни (RDQ):

  1. Как да обясня Data Science на моя грозен малък братовчед?

„Представете си, че продължавате да губите от някакъв бос във видеоигра и колкото и да се опитвате, изглежда не можете да спечелите. Забелязали сте, че има някакъв модел в начина, по който се движат и атакуват, но все още нямате достатъчно информация, за да спечелите, така че поемате към интернет. Търсите във форуми и блогове за повече информация (събиране на данни).

Скоро имате достатъчно съвети и трикове, за да се биете отново с шефа, но този път имате много повече информация от преди. Този път можете да използвате наученото, за да предвидите по-точно (предвидите) поведението на този неприятен проблем. В този пример малко грозничко, вие сте това, което наричаме модел. Заредихме ви с много данни (съвети и трикове от форуми + това, което сте научили чрез опит) с надеждата, че ще можете да предвидите поведението на шефа и да преодолеете проблема.

Това е, накратко, Data Science. Открихте проблем, събрахте куп данни, обработихте ги и след това ги използвахте, за да създадете решение на вашия проблем.

Ето кратко 5-минутно видео, в случай че обяснението ми беше твърде абстрактно.

Това е наука за данни... нещо като.

Очаквайте следващия епизод на „The Road to Kaggle Grandmaster“.