Мой годичный путь от написания первых строк Python до получения трех предложений о работе в области обработки данных

За год мне удалось пройти путь от написания первых настоящих строк кода на R, C++ и Python до получения четырех предложений о работе в качестве Data Scientist и Machine Learning Engineer. Хотя этот процесс начался уже год назад, я хотел задокументировать его для всех, кто начинает этот путь или интересуется наукой о данных и машинным обучением. Надеемся, вам понравится!

Это было осенью 2019 года, когда были выпущены приложения Facebook для стажировки второкурсников. Было пять основных категорий, одна из которых — наука о данных. До подачи заявки оставался месяц, и после короткого сеанса сталкинга в LinkedIn я понял, что один из моих друзей проходил стажировку годом ранее. Я выпил с ним кофе, чтобы получить его советы, идеи и предложения. Он сказал мне, что все лето использовал SQL, Python и Tableau, и что я должен подать заявку. Затем я вернулся в свою комнату и посмотрел, что такое «продолжение». Мои первые результаты поиска ничего не дали. Затем я приступил к поиску «что такое продолжение для науки о данных», когда начали появляться статьи о «SQL», я понял, что безнадежно запутался, и отказался от своего плана подавать заявку. Хотя я не подавал заявку на Facebook, я все же последовал совету моего друга и подписался на математическую статистику, чтобы узнать, есть ли у меня все необходимое, чтобы начать путь науки о данных.

Перенесемся в осень 2020 года. COVID в самом разгаре, все занятия онлайн, я прошел стажировку в небольшой консалтинговой фирме, хорошо справился со своим первым классом по статистике и решил пройти еще один. На тот момент я никогда по-настоящему не программировал, и в дополнение к моему второму классу статистики, который преподается на R, я также записался на курс «Введение в информатику», который преподается на C++. После летнего консультирования я планировал нанять сотрудников для более крупных фирм и думал о кодировании как о чем-то, что сделает меня привлекательным для фирм, но никогда не как о главном направлении моей работы. Осенью я разослал заявки на стажировку в такие консалтинговые фирмы, как McKinsey и BCG, затем в LEK и Oliver Wynman, а после этого в EY и Deloitte. Я был уверен в своих заявках, но в течение сентября и октября продолжали поступать отказы, и единственное собеседование, которое у меня было, было с EY, которое я впоследствии не получил. 1 октября, несмотря на множество отказов, я посетил семинар по программированию на Python и написал свои первые строчки на Python. Когда сезон набора консультантов подошел к концу, я понял, что у меня еще нет летней стажировки, и я не знаю, чем буду заниматься. В то время как я добавил свое имя в шляпу для нескольких стажировок по науке о данных этой осенью, у меня не было опыта на тот момент, и я никогда не слышал ответ.

После более чем двух месяцев неудачных заявок на консультационные услуги и трех месяцев ежедневного полуинтенсивного кодирования на моих занятиях я понял, что есть шанс, что я смогу подготовиться и, возможно, получить стажировку по инженерии или данным, например Data Science. Хотя у меня был интерес и некоторые знания, мне не хватало опыта. Чтобы попытаться устранить этот пробел в моем резюме, я обратился к трем стартапам, которые мои друзья начали выяснять, заинтересованы ли они в анализе, который я научился делать, который на тот момент включал регрессии и общие линейные модели. В итоге моей помощи потребовались три стартапа: один с проектом монетизации качественных данных, один с количественным анализом удержания клиентов и один с количественным анализом обеспечения качества. После окончания моего последнего зимнего сезона я погрузился в эти три проекта, встречаясь и работая с командами на протяжении всех четырехнедельных зимних каникул. За это время я также прошел курс Эндрю Нг по машинному обучению на Coursera от начала до конца. Этот опыт дал мне основу и строки в моем резюме, которые мне были нужны, чтобы начать серьезно относиться к стажировкам по науке о данных.

Я назвал новый раздел своего резюме «Независимый консультант | Консультант по науке о данных» и заполнил его как можно большим количеством ключевых слов, чтобы убедиться, что алгоритмы фильтрации резюме не отфильтруют меня. Затем я пошел на измельчение приложений. Я садился выпить в пятницу вечером и подавал заявки на 10–20 стажировок в зависимости от приложенных усилий и количества сопроводительных писем, которые мне нужно было написать. Обычно я избегал стажировок с интенсивными тестами по кодированию, так как знал, что у меня нет навыков кодирования, чтобы пройти их. После примерно 60 заявок я получил два ответа: один от Akamai Technologies, фирмы по кибербезопасности, на роль стажера по науке о данных, и один от Ekimetrics, консалтинговой компании по маркетинговым данным, на роль консультанта по науке о данных. После трех интервью с Akamai и четырех интервью с Ekimetrics я получил предложения от обоих и решил присоединиться к Akamai на лето. В Akamai у меня была возможность учиться у опытных специалистов по данным, разных сотрудников и экспертов по кибербезопасности. Мне удалось возглавить отдельный проект по обнаружению аномалий в кибератаках через Интернет и предоставить полезные результаты и анализ команде из десяти экспертов по кибербезопасности. Летом я также продолжал работать в GUAQ, одном из стартапов, в котором я начал работать зимой, и сделал личный проект по обучению с подкреплением. Наконец, в конце лета я подал заявку на несколько других вакансий, в том числе две должности инженера по машинному обучению в исследовательских институтах, одну консультанта по науке о данных и одну стажера по геопространственным данным в НАСА.

После изнурительных трех недель собеседований я получил предложения о работе от всех четырех вакансий, а также предварительное предложение о возвращении от Akamai. Несмотря на то, что у всех предложений были свои плюсы и минусы, я в конечном итоге выбрал консультирование по науке о данных в качестве своей постоянной работы из-за разнообразия работы и сочетания моего предыдущего опыта. Осенью я работал стажером по геопространственным данным в НАСА, а весной закончил свою стажировку стажировкой в ​​Джорджтаунском институте массивных данных.

В заключение я надеюсь, что эта история вдохновит надежду и настойчивость. Если в моей истории и есть главный посыл, то он должен состоять в том, чтобы начать, а второй посыл — в том, чтобы продолжать. Изучать новые навыки сложно, и трудно получить возможность их использовать. Загляните в трещины и щели и найдите людей, которым могут быть полезны навыки, которые вы пытаетесь развить, которые могут даже не знать, что они принесут пользу. Работайте бесплатно и никогда не переставайте учиться. Потенциально самым важным решением, которое я принял, было подать заявку на должность в Akamai, хотя я никогда не слышал об этой компании и не думал, что у меня есть шанс пройти стажировку. Продолжайте стрелять, и все больше и больше вероятность того, что они попадут в цель.