Это часть серии интервью о данных и машинном обучении, которую я начал. Эти интервью взяты от людей, которые вдохновили меня, которые научили меня (прочтите учат меня) этим прекрасным предметам. В основном это делается для того, чтобы получить представление о реальном опыте работы над проектами, перспективы изучения нового, некоторые забавные факты и, таким образом, обогатить сообщества в процессе.

Здесь где можно найти все интервью, сделанные на данный момент.

Сегодня со мной Раджарши Митра. В настоящее время Раджарши работает специалистом по анализу данных в Microsoft. Ранее работал инженером-исследователем в компании Artifacia. Он также работал стажером AI в Niki.ai. Его основная область интересов - обработка естественного языка. Он смог превратить свои исследования в полноценные статьи, которые можно посмотреть здесь. Его статья Динамика нейронных сетей - одна из моих личных фаворитов. Обязательно зацените. Вы можете узнать больше о Раджарши здесь.

Раджарши - мой выпускник университета, и он является одним из моих вдохновителей в том, чем я занимаюсь сегодня. Фактически, он был тем, кто был достаточно любезен, чтобы познакомить меня с прекрасным миром машинного обучения летним днем ​​в 2016 году. Я до сих пор помню, как он взял пример Набор данных Boston House Price и научил меня основам Регресс. Я ему за это бесконечно благодарен. Я хотел бы от всей души поблагодарить Раджарши за то, что он нашел время дать это интервью. Я надеюсь, что это интервью послужит цели для улучшения сообществ специалистов по науке о данных и машинного обучения в целом :)

Интервью с Раджарши Митрой, специалистом по данным в Microsoft

Саяк: Привет, Раджарши! Спасибо за интервью. Рад видеть вас здесь сегодня.

Раджарши: Спасибо, что пригласили меня, Саяк!

Саяк: Может быть, вы могли бы начать с того, чтобы представиться - чем вы сейчас занимаетесь и каковы ваши обязанности там?

Раджарши. Я работаю специалистом по анализу данных в Microsoft, Хайдарабад. Моя работа в основном вращается вокруг применения техник понимания языка в области Интернета и поиска. Я применяю существующие современные нейронные модели или иногда формирую собственные идеи на миллионах данных для миллионов пользователей!

Саяк: Замечательно! Мне любопытно узнать, как вы заинтересовались наукой о данных и машинным обучением?

Раджарши: на втором курсе колледжа меня привлекло машинное обучение. Я провел несколько онлайн-курсов и несколько проектов с одним профессором. В результате я углубился в тему и вскоре начал работать над несколькими проектами самостоятельно. Я изучал теорию больше по мере того, как делал больше на практике.

Мне понравился язык. Идея заставить компьютер понять то же самое мне очень нравилась (даже сегодня). Тогда было вопросом времени, когда я применил то, что узнал в ML, в НЛП. И путешествие началось!

Саяк: Я чувствую призыв, и у меня тоже есть интерес к этой области. Когда вы только начинали, с какими проблемами вы столкнулись? Как вы их преодолели?

Раджарши: я начал в то время, когда высоко абстрактные библиотеки, такие как PyTorch, или вычислительные ресурсы, такие как GPU, не появлялись на рынке. Раньше каждый проект занимал много времени, и часто мы реализовывали что-то, основываясь только на приблизительном понимании. Более того, продолжать делать это вместе с учебной программой колледжа было непросто.

Саяк: Это так родно! Но твоя страсть всегда поддерживала тебя :) Какие из главных проектов ты реализовал в годы своего становления?

Раджарши: я работал над несколькими небольшими проектами.

Я прошел стажировку в 2015 году, где я построил базовый пользовательский запрос, понимающий систему НЛП, как часть чат-бота. Бот поможет пользователям заказывать еду, бронировать авиабилеты или такси и другие повседневные нужды. Мне требовалось предсказать природу запроса, разбить его на структуру графа, обработать для получения сущностей, атрибутов и т. Д., Что в конечном итоге привело к действию бота.

Саяк: Ого! Должно быть, это было супер весело! Эти области науки о данных и машинного обучения стремительно развиваются. Как вам удается отслеживать последние важные события?

Раджарши: в основном Twitter. Я слежу за исследователями, которые работают в моей области. Также слежу за большинством важных конференций и их публикаций. Может быть важно сказать, что я читаю не все, а сосредоточиваюсь в основном на работах или статьях, которые связаны с моей текущей работой или меня очень волнуют.

Есть много веб-сайтов, на которых собраны статьи и код вроде this, который может быть очень полезным.

Саяк: Спасибо, что передали это, Раджарши. Будучи практикующим, я часто сталкиваюсь с проблемой изучения новой концепции. Вы бы хотели поделиться своим подходом к этому процессу?

Раджарши: в наш век информации слишком много «нового». Изучение вещей, которые могут быть актуальными и полезными для вас, намного важнее, чем изучение всего нового.

Я смотрю на множество новых вещей, которые появляются каждую неделю, но я выбираю лишь несколько из них и действительно вникаю в них. Я не отбрасываю эту концепцию до тех пор, пока полностью не пойму ее, прибегая к помощи таких ресурсов, как фрагменты кода, блоги, форумы - - почти везде, где упоминается эта концепция. Большую часть времени я пытаюсь сформировать собственные идеи во время обучения или просто перенести полученные идеи в свои текущие проекты.

В первые годы я пробовал то, чему учусь, вместе с учебными работами. Я воспроизвожу документы и подтверждаю их. Это придаст мне уверенности, которую вы не получите, просто прочитав их.

Саяк: Совершенно верно. Когда вы воспроизводите бумагу, есть и другая радость. Вы узнаете так много вещей вместе с этим процессом, а не только концепции / новизны, представленные в статье. Есть какие-нибудь советы новичкам?

Раджарши: дать совет новичку было бы то же самое, что дать то же самое себе несколько лет назад.

Изучите несколько связанных вещей, но специализируйтесь на одном. Будьте очень конкретны в том, что вы делаете или хотите сделать. Долгое время ассоциируйтесь с чем-то одним и преуспевайте в этом. AI - это широкая сфера.

Старайтесь использовать чужие работы и опираться на них. Когда вы реализуете документы, посмотрите, сможете ли вы смешать в них свои собственные идеи и улучшить ситуацию.

Делать что-то хорошее в миллион раз лучше, чем делать так много обычных вещей. Возьмите одну проблему, которой вы увлечены, узнайте о предыдущей работе и начните работать над ней. Изучите его достаточно, пока не получите удовлетворительные результаты или интересные идеи.

Саяк: Эти предложения, безусловно, идут со мной в могилу. Я много раз слышал, как вы говорите об этом, и каждый раз меня мотивировали. Большое спасибо, Раджарши, за это интервью и за то, что поделились своими ценными идеями. Я надеюсь, что они будут очень полезны сообществу.

Раджарши: Я очень на это надеюсь. Обмен тем, что я узнал, также приносит мне огромную радость и часть моего обучения.

Резюме

Раджарши очень конкретно описывает свой интерес к машинному обучению, и я думаю, что сохранение этой специфики очень важно. Это дает больше определений для общего пути, которым мы следуем в нашей карьере. Но в то же время, постоянное информирование о последних событиях (по крайней мере, на высоком уровне) помогает вам быть более инновационным, добавил Раджарши. Говорить об определенной концепции и не отказываться от нее до тех пор, пока вы полностью ее не усвоите, - это, безусловно, один из ключевых соусов для того, чтобы стать эффективным практиком.

Надеюсь, вам понравилось читать это интервью. Следите за этим местом для следующего, и я надеюсь увидеть вас в ближайшее время.

Если вы хотите узнать обо мне больше, загляните на мой сайт.