Руководство по собеседованию Amex Data Science

Интервью American Express Data science (анализ кредитных рисков) делится на 3 этапа:

  1. Тематическое исследование/Технические
  2. Живое кодирование/техническое
  3. Поведенческое/техническое интервью.

В разделе «Кейс» вам предлагается бизнес-проблема, связанная с American Express, и ожидается, что вы решите эту проблему, используя подход машинного обучения.

Пример вопроса: «Если American Express хочет разработать новую карту для владельцев малого бизнеса,

  1. Как отличить эту новую карту от старой?
  2. Как определить подходящий бизнес для этой карты?
  3. Как вы будете использовать модель машинного обучения, чтобы определить, имеет ли бизнес право на получение кредита или нет?

Подход к этому вопросу

  1. Возможные отличия этой новой карты от обычной карты, которую все используют:

Кредитный лимит: поскольку эта новая карта предназначена для владельцев малого бизнеса, можно ожидать более высокий кредитный лимит, хотя в зависимости от кредитной истории заемщика и стоимости бизнеса.

Процентная ставка и годовая процентная ставка: поскольку это предназначено для владельцев малого бизнеса и единственной целью получения прибыли, мы можем ожидать более высокую процентную ставку для этой новой карты. Кроме того, эта новая карта может иметь более длительный льготный период по сравнению с обычными картами.

2. Чтобы определить право малого бизнеса на получение этой карты, мы хотели бы посмотреть на их кредитную историю. Мы хотели бы ответить на эти вопросы:

я. Был ли у них кредит раньше?

II. Каков был их платеж в предыдущем кредите

III. каков их кредитный рейтинг? У нас может быть порог, ниже которого мы не будем предоставлять кредит.

3. Чтобы использовать машинное обучение для определения приемлемости бизнеса, мы можем построить модель классификации, используя кредитную историю клиентов, чтобы предсказать, соответствует ли бизнес требованиям или нет. Кроме того, мы можем смоделировать кредитный рейтинг и установить порог, выше которого бизнес будет иметь право и ниже которого бизнес не будет иметь право.

На этом этапе они также спрашивают о вашем резюме и проектах. Вам придется объяснить свои проекты и алгоритмы, которые вы используете. Интервьюер задает конкретные вопросы на основе вашего резюме, а вы интерпретируете свои результаты и методы.

Техническая сессия/сессия кодирования

В этой части интервью отправит вам данные, например, за 5 минут до интервью. Ожидается, что вы проведете некоторый исследовательский анализ и построите с его помощью модель машинного обучения.

Вопросы, которые можно ожидать здесь

  1. Сводные статистические данные
  2. Проверьте, сбалансированы ли данные или нет
  3. Проверить корреляцию
  4. Визуализации
  5. Модели машинного обучения
  6. Объясните алгоритмы

Заключительный этап — Поведенческое интервью, но он еще и самый технический. Этот этап начался с разговора о проекте, который вы завершили. Вам придется объяснить Алгоритмы, которые вы упомянули. Ожидайте такие вопросы, как:

  1. Объясните логистическую регрессию. Какова функция сигмовидной функции в логистической регрессии?
  2. Объясните дерево решений и проиллюстрируйте, как построить дерево решений. Как мы определяем признаки в дереве решений?
  3. Объясните случайный лес. Что вызывает рандомизацию в Random forests.
  4. Различие между бустингом и бэггингом
  5. Различие между регуляризацией L1 и L2. Что делает выбор функции.
  6. Как вы справляетесь с переоснащением и недообучением
  7. Как вы настраиваете свою модель? Какие параметры точно настраиваются в случайном лесу и дереве решений?
  8. Объяснение метрик в линейной регрессии и того, как они рассчитываются
  9. Объясните P-значение. Что означает доверительный интервал
  10. Ошибка типа 1 и типа 2
  11. Объясните метрики в классификации. Объясните Precision и Recall и когда расставить приоритеты для каждого из них
  12. Расскажите мне о случае, когда вы не согласились с кем-то, работающим в команде.
  13. Расскажите мне о неудачном проекте, который вы сделали, почему он был неудачным и что нужно было сделать по-другому, чтобы сделать его успешным.
  14. Как вы заполняете пропущенные значения, когда данные распределены нормально?
  15. Каковы фазы нейронных сетей?