В моите дни като технологичен консултант си спомням кога за първи път научих за света на Data Science. Бях изключително ентусиазиран да науча повече по темата. Скоро реших, че искам самият аз да стана практикуващ Data Science. Не знаех, че Data Science не е лесна област за пробиване. Изграждането на собствени знания е трудно, а получаването на шанс за придобиване на професионален опит в областта е още по-трудно. За да станете Data Scientist, трябва да работите Data Scientist, а за да работите Data Scientist, трябва да бъдете признати за Data Scientist. Необходими са сериозни усилия, за да преминете от „желания“ до „признат“ специалист по данни. Тук използвам думата „признат“, защото признанието от другите е решаваща предпоставка. С признание идва подходяща работа, с подходяща работа идва подходящ опит и с подходящ опит можете да станете добър специалист по данни.

Въпреки че моето пътуване далеч не е завършено, досега постигнах бърз напредък. Заради моя успех искам да споделя няколко прозрения, които се надявам да ви помогнат да станете успешни.

За да придобиете знания, започнете с онлайн обучение, много по-ефективно е, отколкото си мислите (ако го правите добре)

В началото на моята професионална кариера младшите специалисти по данни в моя проект бяха далеч пред мен с познанията си по математика, компютърни науки и статистика. Въпреки това намерих ефективен начин да запълня празнината, който използвам и днес. Научих Data Science онлайн чрез codecadamy, Kaggle, Datacamp, MOOC в Coursera и лични проекти. Въпреки че онлайн обучението става все по-популярно, чувствам, че ефективността му все още не се оценява много от повечето. Затова отделете малко време, за да разгледате предимствата:

  1. Измежду всеки възможен предмет в света можете да изберете конкретнотова, което искате да научите, без да сте обвързани с по-голяма програма. Можете да съсредоточите усилията си върху това, което е подходящо за вас. Ако това е по-широка тема, която ви интересува, можете да изберете многоседмичен курс. Ако това е една техника, можете да прочетете блог.
  2. Можете да ускоритеи да завършите курс предсрочно, защото не сте обвързани с никаква учебна програма.
  3. Можете да научите всяка отделна тема, която искате да научите от института, който предлага най-висококачествоспоред прегледите на други студенти. Това предлага голямо предимство в сравнение с университетското образование, където обикновено сте обвързани с многогодишна пакетна сделка.
  4. Разполагате с огромен набор от специалисти по данни с равностойни специалисти, които могат да ви помогнат да научите поради страхотните общности на Kaggle и StackOverflow.

не ми вярваш Разгледайте отговорите от проучването на Kaggle от 2017 г. В това проучване един въпрос беше за полезността на инструментите за обучение. Познайте какво, онлайн курсовете бяха посочени 419 500 пъти като „много полезни“ инструменти. Това е приблизително два пъти по-често от традиционните инструменти като колеж/университет (185 300) и учебник (231 600). Интересното е, че първите 10, изброени на фигурата по-долу, са доминирани от онлайн платформи като Kaggle, Stackoverflow (SO) и Youtube.

Обучителни платформи за Data Science и тяхната полезност:

Има само едно нещо, което стои на пътя ви да станете информирани и това сте вие. Трябва да можете сами да определите какво трябва да научите и трябва да сте достатъчно мотивирани да го направите. Тъй като можете да научите много за малко време, вашата нагласа за учене е по-важна от вашето образование или знанията, които вече притежавате. Така че направете си списък с курсове по машинно обучение, статистика, математика, инженерство на данни и програмиране и започнете да учите! След като покриете дадена тема, уверете се, че прилагате знанията си в лични проекти, работа или в състезание на Kaggle, защото това ще ви помогне да запазите наученото в дългосрочен план.

2. За да получите подходящ опит, трябва да следвате собствените си приоритети, дори ако това е неодобрено от другите.

Ако успеете да развиете знания в Data Science, добре за вас, вие сте решили най-лесния си проблем. Следващата стъпка е да започнете да го използвате в работата си. В крайна сметка там прекарвате по-голямата част от продуктивното си време. В повечето компании обаче ще имате късмет, ако можете да инвестирате по всяко време в Data Science. Разгледайте проучването на Kaggle, където професионалистите споделят своите предизвикателства в областта на Data Science по време на работа, и ще видите, че повечето компании не са много плодородна среда за Data Science.

Предизвикателства при правенето на Data Science на работа и тяхната честота:

Чували ли сте някога за термина „зрялост на анализа“? Това е термин, който описва нивото на интеграция, което данните и анализите имат в една компания. Най-често това ниво се категоризира на пет етапа, класирани от „аналитично увредено“ (най-ниското) до „аналитично управлявано“ (най-високото). Най-вероятно вашата компания е някъде в междинен етап. Това означава, че вашата компания използва аналитично отчитане и вие редовно създавате табла за управление за вашите мениджъри. Създаването на табла за управление е полезен опит в началото, но скоро ще достигнете тавана, когато сте научили достатъчно за основното Бизнес разузнаване и искате да преминете към по-напреднали теми като Машинно обучение. Но какво правите, ако работите в компания, която не предоставя възможности за Data Science? Започнете с оценка на текущата си ситуация. В настоящата си работа какъв процент от времето си посвещавате на следните дейности?

Тип 1:Машинно обучение/предсказуем анализ

Тип 2: Кодиране на подходящи езици (с отворен код).

Тип 3:Анализ на данни, визуализация, инженеринг, ETL

Тип 4:Всички други неаналитични работни дейности

Вероятно прекарвате най-много време в типове 3 и 4. Целта е да увеличите максимално времето си, прекарано в дейност 1. Не се тревожете твърде много за другите дейности. Ако можете да прекарате време в дейности от тип 1, вие автоматично ще прекарате време в дейности от тип 2 и 3, тъй като те произтичат автоматично от работата от тип 1. Всъщност в повечето компании вашето разпределение на времето ще гравитира към дъното на списъка. Наличието на време за дейности 1 и 2 е рядкост, защото те изискват високо ниво на аналитична зрялост от вашата компания. Това изисква рядък коктейл от мениджъри с познания в областта на Анализите, достъп до качествени данни и ясен бизнес случай.

Единственият начин да изградите по-подходящ опит е да устоите на гравитацията. Използвайте списъка от 4 точки като референтна рамка за всички професионални решения, които вземате. Колкото повече време в горните региони на списъка, толкова по-добре. Това означава да правите трудни избори. Да кажем, че вашият мениджър идва при вас и ви моли да сравните цените на пазара, за да определите продажната цена за онлайн продукт X. Вие, от друга страна, имате идея да създадете контролиран модел, който динамично ценообразува същия продукт X. Двата вариантите имат същата цел. Вашият обаче е по-иновативен и затова се възприема като по-рисков от мениджъра. Пътят с най-малко съпротивление очевидно е да приемете подхода на вашия мениджър. Това е най-лесният и прост подход и ако се справите добре с него, ще увеличите шансовете си за повишение. Това обаче не е уместен опит в науката за данни. Възнаграждението за този вид работа ще ви укрепи като бизнес анализатор за сметка на вашето пътуване в Data Science. Обратната алтернатива е да поставите възможно най-много Data Science в работата си (разбира се, в приемливи граници). Това леко ще ви навреди в краткосрочен план, защото може да се окажете упорити или непрактични. Може дори да е по-малко ефективен от простото прилагане на простия, класически подход. Но в дългосрочен план това ще разшири вашия опит в Data Science и това ще ви помогне да привлечете повече работа в Data Science. Ако се заемете с работа в областта на Data Science, дори и да е малко, някои хора ще чуят за това и ще започнат да се отварят нови възможности. Това е процес на самоусъвършенстване. Колкото повече работите в Data Science, толкова повече работа в Data Science можете да получите. Всичко е свързано с онази първа стъпка на истинско приоритизиране на Data Science и всеки ден да се питате: „Това, което правя, подходящо ли е за целта ми да стана по-добър специалист по данни?“