Много хора са направили първата стъпка към навлизането в областта на данните, но в един момент всеки се изправя пред следващата голяма стъпка: как да направя кариера от това? След седмици на дискусии с амбициозни учени по данни, по-долу са петте най-важни въпроса, които постоянно чувам, когато става въпрос за навлизане в сектора на данните.

Също така, за всеки, който се опитва да научи първите стъпки, за да стане учен по данни, можете да видите тази статия.

1. Опитвам се да намеря работа в областта на науката за данни, но е трудно да се намери. Как мога да вкарам крака си във вратата?

Има някакъв странен слух, че работата на специалиста по данни е напълно различна от работата на анализатор на данни, BI разработчик, инженер по данни, мениджър на база данни или друга работа, свързана с данни. Не е! Има много припокривания между всички тези работни места, така че приемането на работа като BI разработчик ще ви помогне да дадете своя опит в обработката на данни и да изострите уменията си за наука за данни.

Не пренебрегвайте тези работни места. Има много от тях там. Има голям шанс за тези компании да работят и учени по данни, което дава чудесна възможност да се научите от първа ръка от тях. Ако нямат специалисти по данни, работещи там, това също е чудесна възможност да създадете свои собствени проекти за наука за данни, за да покажете на мениджърите своя набор от умения. Понякога, ако искате роля в науката за данни, трябва сами да създадете такава.

2. Взел съм курсове по наука за данни и тренировъчни лагери, но нямам сериозен опит в статистиката. Ще бъде ли проблем?

Чувал съм поговорката „Науката за данни е като карането на кола. Не е нужно да знаете как се казва всичко под капака, за да го карате.”

Въпреки че това може да е вярно и бихте могли да изпълнявате някои алгоритми, за да правите прогнози или прозрения, без наистина да разбирате как работят статистическите основи, ще се натъкнете на проблеми в даден момент, когато даден алгоритъм е неподходящ по определени причини поради статистически допускания, които могат да доведат до лоши прогнози. Дори по-лошо, когато трябва да обясните мотивите си защо сте избрали модел и не знаете какви са истинските предимства на модела, хората може да не се доверят на работата ви.

Амбициозните учени по данни също вярват, че всички проекти за наука за данни са писане на проблеми с машинно обучение. Има много проблеми, които могат да бъдат решени с помощта на прости вероятности и разпределения. Разбирането как работят тези дистрибуции може да ви даде способността да решавате по-широк набор от проблеми, когато не са необходими модели за машинно обучение.

Науката за данни е по-скоро като избиране на акции. Всеки може да избере акция и тя да бъде успешна в краткосрочен план, но хората, които са най-успешни на фондовия пазар, обикновено са тези, които правят проучвания за компаниите, в които инвестират.

3. Не получих специалност по наука за данни, означава ли това, че няма да бъда квалифициран за работа по наука за данни?

Абсолютно не! Науката за данни е сравнително нов термин, така че университетите, които преподават учебни програми по наука за данни, са нови в играта. Най-вероятно учените по данни, които виждате или разговаряте, не са специализирали в науката за данните, а всъщност в област като компютърни науки или математика. Въпреки това, с напредъка на онлайн курсовете по наука за данни и началните лагери можете да научите умения за наука за данни, които могат да ви помогнат да изградите онлайн портфолио, за да покажете на работодателите, че можете да боравите с набор от данни.

4. Онлайн курсовете достатъчни ли са за обучение или трябва да получа нещо като магистърска степен?

Научните учебни лагери за данни са страхотни за хора, които се опитват да се запознаят с пейзажа на работата, но няма да е достатъчно за работодателя да наеме само на базата на началния лагер. Взех курсове чрез Coursera, Udemy и Udacity за различни етапи от кариерата си. Харесвам по-евтините опции, когато се опитвам да науча конкретно умение, като изучаване на Docker, кодиране в Python, визуализации в R и т.н. Няма нужда от цял ​​тренировъчен лагер, когато просто се опитвате да се съсредоточите върху един предмет .

Магистърската степен е голяма стъпка. Имам чувството, че твърде много хора веднага започват да получават по-висока степен, без наистина да разберат дали харесват кариерата, в която се захващат. Магистърската степен е страхотна за потенциал за бъдеща кариера, но е голям риск, ако все още сте на оградата дали наистина ви харесва да бъдете учен по данни.

Когато сте напълно готови да предприемете следващата стъпка за дългосрочен растеж в науката за данни, магистърската степен е чудесен избор. Ако все още се опитвате да научите основите, нещо толкова просто като YouTube може да свърши работата.

5. Коя е най-добрата стъпка, за да накарам работодателите да ме приемат на сериозно като специалист по данни без опит?

СТРАНИЧНИ ПРОЕКТИ! Науката за данни, точно както почти всяка друга индустрия, е до голяма степен поле на „докажи ми го“. Ако се присъединявате към състезателна лига за видеоигри и ваш приятел каза, че е най-добрият играч на видеоигри в страната, бихте поискали да видите дали имат видеоклипове на техните игри или да ги гледате как играят една или две игри, за да можете да прецените себе си, нали?

Същото важи и за странични проекти в света на данните / компютърните науки. Казвате, че можете да обработвате и манипулирате данни, за да правите информативни прогнози? Страхотно! Можете ли да ми покажете пример?

Едно страхотно нещо при страничните проекти е, че те никога не остаряват. След като завършите един, можете да ги препращате завинаги. Правенето на анализ не изтича след определена дата. Завърших странични проекти преди години, които все още споменавам до ден днешен. Те са страхотни за поставяне на мотивационни писма, когато кандидатстват за работа, за да покажат „Ще бъда идеален за тази работа и ето някои проекти, които трябва да докажа“.

Най-трудната част от страничните проекти е просто да започнете с тях. Сякаш чувате през цялото време, когато някой ви казва „пич, имам тази страхотна идея за приложение…“. Колко често всъщност чувате за този човек, който преминава през процеса, за да създаде своето приложение? Да, никога. Колкото по-дълго отлагате изпълнението на проекта, толкова по-малка е вероятността той някога да бъде завършен.

Уверете се обаче, че правите проект, който е ваша собствена мисъл! Не правете анализ на набора от данни на Kaggle Titanic, ВСИЧКИ вече са го направили. Не впечатлявате никого с основен анализ, през който всеки човек с данни вече е преминал. Kaggle и други места за набори от данни са чудесно място да започнете да търсите данни, но винаги се опитвайте да мислите за проект, който ще бъде уникален за вас и ще ви накара да се откроите от тълпата.

Данните са по-ценни от всякога, което е основната причина, поради която е трудно да се навлезе в сектора на данните. Ако беше лесно, нямаше да е толкова желана работа. Има много различни начини за работа с данни и след като влезете...вие сте вътре. Отделете време да работите по странични проекти, които показват вашия набор от умения и дават на хората увереност, ако са предоставили данни с чувствителна информация на ти, ще знаеш точно какво да правиш.