Ако сте един от многото студенти по наука за данни, които са на път да влязат в работната сила, поздравления! Работили сте усилено, за да спечелите дипломата си и сте на път да започнете много вълнуваща кариера.

Има много различни посоки, в които можете да поемете кариерата си в науката за данни. За да ви помогна да започнете, съставих списък от 10 начина, по които можете да се възползвате максимално от своята степен по наука за данни.

  1. Бъдете в крак с най-новите тенденции, но изберете една ниша. Областта на науката за данни непрекъснато се развива, така че е важно да сте в крак с най-новите тенденции. Няколко начина да направите това: участвайте както в академични, така и в индустриални конференции, намерете групи за срещи, които имат отношение към областта на машинното обучение, която ви вълнува най-много, следвайте добри източници на съдържание (като TDS). Изключително важно е да се специализирате в някои от няколкото области, включени в науката за данните, въпреки че като имате добра основа в хоризонтално отношение, не трябва да се опитвате да научите всичко за каквото и да било, изберете един клас проблеми (напр. NLP, финанси, MLOps, Data Engineering ) и се задълбочете в това.
  2. Натрупайте опит в работата с данни. Един от най-добрите начини да научите за науката за данните е да придобиете опит в работата с данни. Има много начини да направите това, като например поемане на стажове или участие в състезания по наука за данни. Можете също да намерите набори от данни онлайн и да се опитате да ги анализирате сами. Kaggle може да бъде ваш приятел тук.
  3. Развийте уменията си за кодиране. Не трябва да се очаква учените по данни да са толкова напреднали в кодирането като хардкор бекенд инженерите, но кодирането е жизненоважно умение. Ако нямате много опит в кодирането, сега е моментът да научите. Има много ресурси, достъпни онлайн, като Codeacademy и Udacity. Освен това повечето програми за наука за данни предлагат курсове по кодиране. Ако сте достатъчно запознати с кодирането, тогава започнете да търсите конкретни курсове за машинно/задълбочено обучение.
  4. Научете статистически техники. Статистиката е ключова част от науката за данните. Ако искате да бъдете успешен специалист по данни, трябва да сте добре запознати със статистическите техники. Има много налични ресурси, които да ви помогнат да научите, като онлайн курсове и учебници. Статистиката не само играе ключова роля в много алгоритми, но е и полезно умение за изследване на вашите данни и/или сравняване на модели в производството.
  5. Развийте уменията си за машинно обучение. Машинното обучение е друга важна част от науката за данните. Ако искате да напреднете в кариерата си, струва си да отделите малко време, за да научите за алгоритмите и моделите за машинно обучение. Имаме късмета да разполагаме с няколко зрели ML рамки, които са с отворен код и имат много документация, която да ви подкрепя. Като използвате рамки като PyTorch, Tensorflow, Lightning и т.н., може да не научите как да създадете свой собствен модел за машинно обучение от нулата, но освен ако не създавате новия GPT-3, това няма да е проблем. Има много проблеми, които тези инструменти могат да решат. Ако искате да навлезете по-дълбоко в ML, започнете да четете кодовата база на рамката, за да се запознаете със стила на софтуерната архитектура и стила на програмиране.
  6. Научете за визуализацията на данни. Едно от най-важните умения за специалистите по данни е визуализацията на данни. Визуализирането на данни ви позволява да съобщите своите открития на другите по ясен и стегнат начин. Ако искате да научите за визуализацията на данни, има много налични ресурси, като онлайн курсове и книги.
  7. Придобийте опит с различни типове данни и източници. Специалистите по данни трябва да могат да работят с различни източници на данни. Особено ако искате да направите кариера от това, най-вероятно няма да получите готови за използване набори от данни в CSV. В реалния свят данните ще се съхраняват в облачно хранилище, база данни или дори магазин за функции. Научете техники за проектиране на функции и се опитайте да придобиете опит в работата с различни типове данни, като текстови данни, аудио, видео и таблични данни.
  8. Развийте комуникационните си умения. Учените по данни трябва да могат да съобщават откритията си на другите. Това означава, че трябва да развиете комуникативните си умения. Един от начините да направите това е да практикувате да представяте своите открития на другите. Добрият учен по данни е добър разказвач. Когато работите за компании, ще научите, че не е лесно да общувате с хора, които не са във вашия екип и трябва да бъдат актуализирани, така че ако очаквате те да разберат какво правите, ваша отговорност е да комуникирате правилно.
  9. Намерете наставник. Наставникът може да бъде ценен актив за всеки учен по данни. Менторът може да ви помогне да се ориентирате в областта на науката за данни, да предложи съвети за вашата кариера и да ви даде насоки за вашето професионално развитие. Ако не сте сигурни как да намерите наставник, можете да започнете, като попитате вашите преподаватели, колеги или приятели дали познават някой, който би бил подходящ.
  10. Включете се в общности. Има много професионални организации за учени по данни, като Американската статистическа асоциация и Института за инженери по електротехника и електроника. Присъединяването към професионална организация може да ви помогне да сте в крак с най-новите тенденции в науката за данни и да ви свърже с други специалисти по данни. Присъединете се към състезания на Kaggle, въпреки че те не представят непременно точната динамика на професионална среда, те обикновено ще ви помогнат да се изправите пред някои предизвикателства, които бихте направили в реалния живот. Включете се в Discord сървъри, Reddit, stackoverflow и др.

Работата като учен по данни е невероятно нещо, ще имате възможността да приложите най-съвременни техники за решаване на проблеми от реалния свят. Различно е от всяка друга техническа работа, която съм виждал досега, главно защото можете не само да решавате сложни проблеми с код и алгоритми, но също така можете да експериментирате с вашите решения с реални теми и ясно да виждате директно резултати за компаниите, за които работите.

За автора:
Лукас е софтуерен инженер, специализиран в машинното обучение. Той има магистърска степен по компютърни науки и е основател и главен изпълнителен директор на Elemeno AI, стартираща компания, която дава възможност на екипите за наука за данни да увеличат продукцията си в индустрията. В Elemeno вие можете да създавате магазини за функции и да разгръщате вашите модели в производство, без да е необходимо да знаете подробностите за включеното инженерство.