Понимание культуры Capital One, процесса приема на работу и вопросы собеседования

Вступление

Capital One - одна из крупнейших американских банковских холдинговых компаний с активами более 370 миллиардов долларов по состоянию на 2018 год, 755 отделениями и 2000 банкоматами. Компания занимает 98-е место в рейтинге Fortune 500 и занимает 5% рынка. По состоянию на 2016 год у Capital one было 62,5 миллиона активных держателей карт, что означает множество данных.

Не случайно Capital One был отмечен как лидер в области данных и аналитики. В 1988 году Capital One изменил индустрию кредитных карт, индивидуально настроив каждое предложение по кредитным картам с помощью статистического моделирования и реляционных баз данных. Теперь Capital One использует современные технологии и специалистов по обработке данных, чтобы создать новую волну потрясений.

Роль специалиста по данным

Специалисты по обработке данных Capital One помогают возглавить новую волну потрясений в финансовой отрасли. Проекты могут варьироваться от создания новых финтех-проектов в команде Capital One Labs до улучшения существующих продуктов и услуг.

Требуемые навыки и квалификация

Базовая квалификация

  • Степень бакалавра количественной области
  • Не менее 1 года опыта работы с языками программирования с открытым исходным кодом для крупномасштабного анализа данных (Python, R или Scala)
  • По крайней мере, 1 год опыта работы с системами контроля версий, такими как Git и GitHub.
  • Не менее 1 года опыта работы с машинным обучением или прогнозным моделированием (Scikit-learn, H2O, Xgboost или TensorFlow)
  • Не менее 1 года опыта работы с реляционными базами данных (Postgres, Redshift, MySQL) и программирования на SQL.

Предпочтительная квалификация

  • Степень магистра или докторская степень. Опыт работы с AWS (EC2, S3, Lambda, RDS и т. Д.)
  • Опыт работы с расширенными рабочими процессами Git (запросы на извлечение, проверка кода, проблемы и ветвление)
  • Опыт написания модульных тестов и интеграции с инструментами CICD (Jenkins, CircleCI и т. Д.)
  • Опыт работы в Python или R не менее 3 лет.
  • Опыт работы с машинным обучением / прогнозным моделированием не менее 3 лет (Scikit-learn, H2O, Xgboost, TensorFlow и т. Д.)
  • Опыт работы с SQL не менее 3 лет.

Процесс собеседования

Процесс собеседования в Capital One довольно строгий и состоит из нескольких этапов:

Начальный экран телефона

Интервью начинается с первого экрана телефона, который обычно длится 30 минут. Этот этап проводится под руководством рекрутера и проводится просто для того, чтобы лучше понять друг друга. Рекрутер, как правило, расскажет вам о должности и процессе собеседования, а также задаст стандартные вопросы о вашем резюме и прошлом опыте. Они хотят видеть, что вы заинтересованы в Capital One и обладаете опытом и компетенцией, необходимыми для этой должности.

Технический экран телефона

После экрана телефона идет технический раунд, который также проводится через телефон. Этот этап длится около часа и не состоит из кодирования. На этом этапе интервьюер либо…

  • Представьте вам случай из реальной жизни и попросите вас объяснить различные этапы процесса моделирования.
  • Задайте вам ряд вопросов, связанных с набором данных
  • Или оба

Пример кейса: учитывая набор данных о звонках клиентов и агентах, расскажите, как вы подготовили бы данные и смоделировали их для улучшения качества обслуживания клиентов.

Хотите больше вопросов на собеседовании по анализу реальных данных от Capital One с решениями? Узнайте больше о Интервью Query.

Data Challenge

На этом этапе у вас есть неделя, чтобы выполнить задание по получению данных домой. На этом этапе вы продемонстрируете свою способность кодировать, моделировать и решать реальные проблемы. Здесь вам будет предоставлен набор данных, и вам будет предложено очистить данные и построить прогнозную модель на основе данных для достижения заранее определенной цели.

В качестве примера предыдущим кандидатам был предоставлен набор данных о такси Нью-Йорка, и их попросили построить модель, чтобы предсказать, сколько чаевых получит водитель.

Собеседование на месте (4–5 раундов)

После проверки данных проводится собеседование на месте. Обычно проводится от трех до пяти раундов собеседований, и каждый раунд длится около часа. Типы интервью варьируются от поведенческих интервью до технических интервью и бизнес-кейсов.

Поведенческие: здесь вам задают ряд ситуационных вопросов, которые обычно начинаются со слов «расскажите мне о времени». Обязательно используйте формат ЗВЕЗДЫ (ситуация, задача, действие, результат), отвечая на эти вопросы, и будьте краткими!

Примеры вопросов включают следующее:

  • Расскажите о времени, когда вы эффективно работали в команде.
  • Опишите свои прошлые проекты в области науки о данных

Белая доска / Технический: Технические раунды могут сильно различаться - обычно этот раунд состоит из технических вопросов по статистике и машинному обучению, или этот раунд используется для решения проблемы с белой доской.

Что касается статистических вопросов, предыдущим кандидатам задавали вопросы о регрессии, корреляциях, мультиколлинеарности, p-значениях и т.д.

Экономическое обоснование. Эта часть собеседования меньше посвящена науке о данных и больше ориентирована на понимание бизнеса. Интервьюер предоставит вам случай и задаст вам несколько вопросов, связанных с бизнесом.

Предыдущий пример. Каковы доходы при автокредите? затраты? Имея модель, которая предсказывает, является ли покупатель хорошим или плохим, выясните вероятность того, что покупатель хороший, если модель предсказывает хорошо, вероятность того, что покупатель плохой, учитывая, что модель предсказывает хорошо, и т. Д.

Соответствие должности. Один из раундов будет посвящен тому, подходите ли вы для этой должности, команды и компании в целом. Здесь интервьюер расскажет об отделе, проектах, над которыми вы будете работать, и поймет, кто вы и будете ли вы хорошо интегрироваться в команду или нет.

Советы для достижения успеха

  • Будьте бдительны при принятии решения, какой язык программирования использовать для повседневного использования. Предыдущие кандидаты были оштрафованы за неиспользование Python. На всякий случай уточните у менеджера по найму или рекрутера языковые предпочтения.
  • Сделайте это простым, чтобы взять его домой. Не нужно строить многослойную нейронную сеть - они не хотят этого видеть. Более чем достаточно простой линейной модели.
  • Убедитесь, что вы используете формат ЗВЕЗДА (ситуация, задача, действие, результат) для поведенческих вопросов. Это поможет вам говорить более кратко и профессионально.
  • Высказывайте свои мысли, особенно о случаях и проблемах с доской. Не решайте проблемы молча! Даже если вы ответите неверно, по крайней мере, вы сможете продемонстрировать свое мышление, если расскажете о своем процессе вслух.

Примеры вопросов для собеседования

  • Объясните, как обрабатывать пропущенные значения
  • Как бы вы объяснили полиномиальное распределение и написали бы код Python на доске для представления этого распределения?
  • Как бы вы построили модель для прогнозирования мошенничества с кредитными картами?
  • Как обнаружить мультиколлинеарность?
  • Как соединить два набора данных?
  • Объясните компромисс смещения и дисперсии
  • В чем разница между случайным лесом и деревом с градиентным усилением?
  • Что делает регуляризация?
  • Что важнее ложных срабатываний или ложных отрицаний?
  • Опишите процесс моделирования с самого начала

Если вас интересуют руководства по другим компаниям, ознакомьтесь с вопросами собеседований по науке о данных Google, Facebook и Amazon.

Спасибо за прочтение!