Leave a Review & Get 30% OFF - Limited Time Offer!

00:00:00
Guides

Вопросы для собеседований по Data Science в 2026 году: SQL, ML и кейсы

Last updated: March 25, 2026|9 min read|By InterviewMan Team

короче кухонная стойка у Дева. 11 вечера. вторник. пад тай протекает жиром на стойку, из того места на Мишн-стрит, салфеток как обычно слишком много. Дев говорит «объясни ошибки первого и второго рода в контексте A/B теста.» тишина. рот открывается -- и ничего не выходит. я прошёл целую магистратуру по статистике. два года этого всего. и стою у него на кухне неспособный произнести хоть одно предложение про ошибки первого рода лол. формулы -- пожалуйста. человеческие слова -- нет. Дев откинулся и ждал. три секунды, которые длились год. именно из-за того момента на кухне я это и пишу, потому что через две недели вице-президент по продукту в финтех-компании задал мне точно такой же вопрос в третьем раунде онсайта и мой мозг сделал ровно то же самое. четыре часа позади. первый раунд -- оконные функции в SQL. второй -- допрос по статистике. третий -- питч по прогнозированию оттока. и тут этот человек хочет, чтобы я обосновал размеры выборок для A/B теста, а у меня пусто. магистратура не спасла. Дев меня предупреждал. он дата-сайентист в Spotify, три года там, я должен ему уже девять пив на этот момент. он как-то сказал мне в баре «собеседования в DS -- это четыре собеседования, притворяющихся одним», а я сидел в телефоне и не слушал. лол

Дев сказал кое-что в тот вечер, что мне не понравилось. стоит, облокотившись на холодильник, пиво в руке, какая наглость. «если ты не можешь объяснить концепцию продакт-менеджеру в двух предложениях -- ты не понимаешь её для собеседования.» а потом этот безумец заставил меня объяснить байесовское обновление его девушке Лене. воспитательница в детском саду. ноль знаний статистики. она сидела, ела трейл-микс и щурилась на меня, пока я бормотал, и я не мог превратить доверительные интервалы в нормальные слова. четыре попытки. ЧЕТЫРЕ. я заметно покраснел. на третьей попытке я чуть не сдался, а она всё ещё щурилась и ела трейл-микс. на четвёртой она кивнула, и что-то щёлкнуло у меня в голове. я вспоминаю прищуренное лицо Лены каждый раз, когда кто-то просит объяснить p-value без слова «вероятность», или когда использовать t-тест вместо хи-квадрат, или провести расчёт размера выборки для A/B теста. вопросы, которые всплывают в каждом DS-цикле, о котором я слышал от кого угодно. одни и те же пять концепций в обёртках разных компаний. учебник за сто сорок баксов научил меня меньше, чем леди с трейл-миксом

телефонный скрининг Meta для DS -- конец 2025, Дев через него прошёл. почти полностью SQL, сложный SQL. оконные функции. CTE. self-join'ы. арифметика дат. его задача была -- найти пользователей из таблицы логинов, у которых частота входов упала более чем на пятьдесят процентов месяц к месяцу три месяца подряд. LAG, оконные функции, группировка по датам, двадцать минут, общий редактор, вперёд. ещё двое знакомых подтвердили -- DS в Meta именно такой. SQL -- это ворота, пишешь холодной головой или скрининг окончен. кодинг в Google DS легче, чем для SWE, но им нужен настоящий Python, конкретно Pandas, дают тебе грязные данные, почисти, посчитай метрики, а потом интервьюер щурится на тебя и говорит «и что это нам говорит.» лол. люди пишут рабочий код и потом не могут сказать по-человечески, что означает их собственный результат. мёртвая тишина. я был этим человеком. пялился в датафрейм. забыл как работают числа

Дев наблюдал, как я делаю пробный Google-раунд по FaceTime, и отключил звук, чтобы я не слышал, как он смеётся. потом написал мне «бро ты написал правильный pandas и потом молчал сорок секунд.» эти сорок секунд -- та же самая тишина, которая убивает в ML-раундах, если честно. тебя не попросят вывести обратное распространение ошибки. Деву на Amazon задали «когда бы ты выбрал градиентный бустинг вместо случайного леса», а мне досталось «несбалансированные классы, что делаешь» на моке с ним за той же кухонной стойкой, тот же жир от пад тая на стойке, потому что он никогда не убирает, и я снова завис. он перечислил SMOTE и веса классов и подбор порога и precision-recall вместо accuracy и бизнес-обоснование почему ложноположительные стоят иначе чем ложноотрицательные и сидел смотрел на меня как Лена с трейл-миксом. пять пунктов. у меня было два. два из пяти звучит как будто ты прочитал один пост в блоге. нужны все пять и нужно связать их между собой -- вот это проходит. раунд глубокого погружения в ML в Amazon -- это где Дев чуть не умер, ты выбираешь один проект из резюме, и тебя сверлят тридцать минут. какая модель. почему. какие фичи. оценка. что бы ты изменил. интервьюер потратил ПЯТНАДЦАТЬ минут на фиче-инжиниринг рекомендательной системы, которую Дев построил в Spotify. пятнадцать. на одном проекте. я готовил его, допрашивая про этот проект целый час за кухонной стойкой, и к двадцатой минуте он спотыкался на решениях, которые принял восемь месяцев назад. переписал все свои заметки в ту ночь. все до единой. Google идёт в теорию -- компромисс смещения-дисперсии, сложность модели, регуляризация. «ок но ПОЧЕМУ L1 даёт разреженные веса.» ты говоришь ромбовидная область ограничений, а следом -- что это значит геометрически и почему это важно для отбора фичей в продакшене. Лена бы так прищурилась на этом лол. интуиция важнее доказательств всегда

кейс-стади -- это где Дев меня реально впечатлил. «метрики упали на двенадцать процентов на прошлой неделе, что случилось.» ты строишь расследование в реальном времени, пока интервьюер играет роль продакт-менеджера, который даёт тебе размытые ответы на всё. его кейс в Meta был «дневная аудитория Instagram Reels упала на восемь процентов в Бразилии, проведи меня через это.» пять минут уточняющих вопросов, прежде чем он предложил хоть что-то. все пользователи или сегмент. тайминг обновления приложения. сезонные паттерны конкретно в Бразилии. эти пять минут уточнений впечатлили интервьюера больше, чем аналитический фреймворк, который последовал. я бы сразу прыгнул к гипотезам и скорее всего получил бы минус за это. ровно та же проблема что и сорок секунд мёртвой pandas-тишины лол. мой мозг хочет отвечать раньше, чем хочет спрашивать. поведенческие раунды используют метод STAR, «расскажи о случае, когда твой анализ изменил бизнес-решение.» конкретный анализ, какой стейкхолдер, какое решение изменилось, измеримый результат. «сделал анализ и это помогло» -- это ответ на отказ. тестовые задания на дом -- некоторые компании всё ещё дают, датасет, задание, от сорока восьми до семидесяти двух часов, отправляешь ноутбук. Дев просматривал тестовое одной знакомой. модель на XGBoost идеально настроена, ноль объяснений почему были сделаны те или иные решения по фиче-инжинирингу. ни одного предложения о том, почему она выбрала эти фичи. она не прошла дальше. Дев посмотрел и сказал «это кэгл-дамп, а не меморандум.» пиши так, будто убеждаешь вице-президента потратить деньги. каждый человек, с которым я общался и кто получил оффер, писал именно так. можно ли проскочить с чистым ноутбуком в стиле Kaggle? может быть. но я бы не стал ставить на это после того, как видел, как ту работу отклонили

форматы компаний, если интересно, потому что Дев и по ним меня гонял лол. DS в Meta -- это SQL телефонный скрининг, потом онсайт с продуктовым мышлением плюс кейс-стади плюс техническое глубокое погружение плюс поведенческий раунд, причём продуктовое мышление -- это Meta-специфичный раунд, где ты рассуждаешь о метриках их приложений, и это раунд, про который Дев сказал, что он больше всего похож на допрос от продакт-менеджера, который тебя ненавидит. DS в Google -- телефонный скрининг с кодингом и статистикой, потом онсайт с кодингом и ML-концепциями и кейс-стади и раунд Googleyness, который является их версией «хотим ли мы обедать с этим человеком.» DS в Amazon начинается с онлайн-ассессмента по SQL и базовой статистике, потом виртуальный цикл с кодингом, глубоким погружением в ML по прошлой работе, кейс-стади, поведенческим раундом с принципами лидерства, и если ты не выучил четырнадцать принципов лидерства -- удачи. DS-циклы смешивают кодинг и разговоры, поэтому они так сбивают людей с толку. раунды SQL и Python ощущаются как кодинг-интервью, где живая подсказка подхватывает синтаксические провалы или напоминает оконную функцию, которую твой мозг выронил (мой выронил LAG во время скрининга Meta, ну надо же лол). раунды по статистике и кейс-стади более разговорные, подсказка на шаге фреймворка не даёт тебе уйти в штопор

я использовал InterviewMan во втором своём цикле. раунд SQL -- заметил, что я пишу коррелированный подзапрос, когда оконная функция была бы чище. я ЗНАЮ оконные функции. от давления я потянулся за тем, что выучил первым, а это самая тупая разновидность ошибки. раунд кейс-стади -- подсказал рассмотреть сезонность, изменения продукта, проблемы с пайплайном данных, когда я получил вопрос про падение метрик, по сути то же самое что у Дева с Brazil Reels, но для платёжной компании. ровно то, что Дев вбивал в меня за кухонной стойкой за пад таем. нервы стёрли всё начисто. моки с ним честно научили меня больше, чем боевые раунды, потому что я видел ровно где мои объяснения превращались в размахивание руками, и давления не было, так что я мог реально их исправить. двенадцать баксов в месяц, без ограничений на сессии, а после двух лет магистратуры и разгрома от леди с трейл-миксом я не собирался на этом экономить лол. в какой-то момент реально начал ждать мок-сессий с нетерпением, чего со мной в жизни не случалось. сначала я поискал что-то другое, но всё было либо только кодинг, либо только статистика, ничего что покрывало бы полный DS-цикл. статистика и кейс-стади и поведенческие и SQL в одном инструменте. всё остальное было половиной инструмента

вот мой самый тупой ход. я учил SQL неделю. статистику -- следующую неделю. ML -- после этого. отдельные маленькие ведёрки, как будто это отдельные предметы. пришёл на онсайт, а мне швырнули всё это за один день, четыре часа, всё разом, точно как тот вице-президент из финтеха, который хотел математику A/B тестов после трёх раундов всего остального. Дев мне говорил, что так и будет, в баре, за кухонной стойкой, наверное в сообщении, которое я проигнорировал, пока ел пад тай. девять пив. я должен ему девять пив и наверное должен извиниться перед Леной за то, что изуродовал байесовское обновление на её кухне, пока она пыталась есть трейл-микс. она до сих пор щурится на меня, когда я прихожу лол

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

ShareTwitterLinkedIn

Related Articles

Try InterviewMan Free

AI interview assistant. Undetectable.

Get Started