Привет, Назарий!

Летом 2016 года я проходил стажировку в компании под названием Urban Science, компании, которая использует науку, чтобы помочь автопроизводителям увеличить продажи, повысить лояльность клиентов и многое другое! Я был очень благодарен за возможность обучения и смог многое почерпнуть из этой стажировки. Но самое главное, я также считаю, что принесла большую пользу. Видите ли, на стажировке мне приходилось работать не с одной, а с 2-мя командами. Теперь, как это произошло? Это включает в себя прохождение бесплатного курса Введение в машинное обучение и его применение всего за пару недель.

Запуск моего проекта

В начале стажировки мне поручили объединить данные о потенциальных клиентах от разных OEM-брендов, чтобы можно было сравнить их с отраслевыми тенденциями. При этом я также должен был создавать графические отчеты для визуализации данных. Я собрал свои требования, спланировал работу и смог завершить проект раньше, чем ожидалось.

Что еще я могу сделать ?

Теперь я многому научился! Я узнал, как SSIS может быть отличным инструментом для перемещения данных. Я также понял, насколько великолепен SQL Server Reporting Services для визуализации собранных данных. Однако я спросил себя, как я могу сделать еще один шаг вперед? Как еще я могу принести пользу и чему-то научиться на стороне? Видите ли, в свободное время я проходил курс Udacity под названием «Введение в машинное обучение», который учит вас основам машинного обучения.



Поэтому я предложил менеджеру идею, что, если бы я мог предсказывать тенденции отрасли на основе данных, собранных в настоящее время?

В свободное время, например, в ожидании разрешений для базы данных (что, кстати, занимает много времени), я продолжал заходить на Udacity, смотреть видео и делать мини-проекты.

Со временем я понял, что узнал достаточно, и теперь пришло время начать применять свои знания.

Прогнозирование тенденций в отрасли

Прежде чем начать, я посоветовался со своим другом, который работает в области аналитики в Urban Science.

С его предложениями и тем, что я узнал из курса, я решил сосредоточиться на прогнозировании данных о потенциальных клиентах для одного бренда, а не для всей отрасли, думая, что это даст мне лучший прогноз.

Таким образом, я приступил к построению модели линейной регрессии (модели прогнозирования).

После долгих отладок, просматривая документацию туда-сюда, я сделал следующие шаги:

И, честно говоря, самой сложной частью была часть предварительной обработки, потому что это похоже на то, что они говорят: «ваш прогноз настолько хорош, насколько хороши ваши данные». Интересно, что благодаря постоянным возням с моделью предсказания ошибка r в квадрате 0,22 изменилась на 0,48 r в квадрате, что является большим улучшением. Очевидно, что чем выше, тем лучше. Возможно, это не лучший результат, но именно дельта меня удивляет.

День презентации

Это был презентационный день для стажеров, где мы должны были рассказать о наших проектах. Я начал с объяснения моей первоначальной цели для моего проекта и того, как я ее решил. Всем понравилось, но потом я перешел ко второй части презентации, посвященной машинному обучению. Видите ли, часть проекта, посвященная машинному обучению, никогда не входила в требования, поэтому это стало неожиданностью.

Когда я начал говорить о технических деталях, таких как диаграмма, которую вы видите выше, все просто продолжали задавать вопросы. В конце я показал результаты в формате диаграммы, где я сравнил свой прогноз с реальными значениями. Оба графика вышли очень близкими, удивив меня и зрителей.

Вывод

После презентации произошло несколько интересных вещей. Сначала моя команда, очевидно, очень гордилась мной. Затем у меня появилась возможность поговорить с менеджером команды Data Science, где мы подробно обсудили мой проект. Он дал мне несколько советов и отправил меня в путь.

На следующий день я решил спросить того же менеджера, есть ли вакансия для стажера в команде Data Science. В то время он сказал, что «к сожалению, у нас ничего не открыто». Однако через неделю мне перезвонили и сказали, что создали вакансию стажера и спрашивают, не хочу ли я присоединиться к ней.

«Черт возьми, да, я».

Я буду работать с замечательными людьми, у которых есть докторская степень в области компьютерных наук, науки о данных и т. д. И я буду работать над проектами, касающимися данных, машинного обучения и т. д.

Через неделю меня перевели в другую команду. Работая стажером в новой команде, я работал над одними из самых интересных проектов, связанных с распознаванием изображений, API, машинным обучением и визуализацией данных.

Чтобы пройти полный круг, я думаю, вы можете видеть, что если вы хотите выделиться в своей стажировке или просто в своей работе в целом, никогда не бойтесь пройти лишнюю милю. Потому что это дополнительная миля, которая может помочь вам выделиться и изменить направление в компании.

В любом случае, надеюсь, вам, как читателю, понравилась моя небольшая история, и вы смогли извлечь из нее что-то полезное.

Не стесняйтесь подписываться на меня во всех социальных сетях, где я рассказываю о программном обеспечении, жизни и танцах 😁

Хорошего дня!

Социальные сети:
Instagram: @НазДуманскийy
Facebook: @НазДуманский
YouTube: @НазДуманский
Twitter: @НазДуманский