00h:00m:00s

Leave a Review & Get 72% OFF your first year - Limited Time Offer!

Claim offer
Guides

数据科学面试问题2026:SQL、ML和案例研究

Last updated: March 25, 2026|1 min read|By InterviewMan Team

好吧,场景是 Dev 家的厨房台面。晚上十一点。周二。那家 Mission 街上的店买的泰式炒河粉,油渍渗到台面上,餐巾纸照例拿了一大堆。Dev 开口就是"解释一下 A/B 测试中的第一类错误和第二类错误。"然后我脑子一片空白。嘴张开了,什么也说不出来。我可是正儿八经读了统计学硕士的。两年啊。结果我站在他厨房里,连一句关于第一类错误的话都说不出来,笑死。公式我会,用中文说出来,不行。Dev 往后一靠,等着我。三秒钟像过了一年。那个厨房台面上的瞬间就是我写这篇文章的原因,因为两周后一家金融科技公司的产品副总裁在现场面试第三轮问了我同类型的问题,我的大脑做出了一模一样的反应。那时候已经面了四个小时了。第一轮 SQL 窗口函数。第二轮统计学拷问。第三轮用户流失预测方案展示。然后这位仁兄要我论证 A/B 测试的样本量,我什么都答不上来。我的硕士学位救不了我。Dev 早就警告过我了。他在 Spotify 做数据科学家,干了三年,到现在我欠他九杯啤酒。他有次在酒吧跟我说"数据科学面试就是四场面试伪装成一场",当时我在玩手机根本没听。笑死

那天晚上 Dev 说了一句让我很不爽的话。他靠在冰箱上,手里端着啤酒,也太嚣张了。"如果你不能用两句话把一个概念解释给产品经理听,那你在面试里就等于不懂。"然后这个疯子让我把贝叶斯更新解释给他女朋友 Lena 听。幼儿园老师。统计学背景为零。她坐在那儿吃着坚果零食,眯着眼睛看我胡扯,我怎么都没办法把置信区间翻译成正常人能听懂的话。试了四次。四次啊。我脸明显红了。第三次我差点放弃了,她还在那儿眯着眼睛吃坚果零食。第四次她终于点了头,我脑子里好像有什么东西突然通了。每次有人让我在不用"概率"这个词的情况下解释 p 值,或者问什么时候用 t 检验什么时候用卡方检验,或者让我讲解 A/B 测试样本量计算的时候,我都会想起 Lena 眯眼的表情。这些问题在我听说过的每一个数据科学面试流程里都会出现。就那五个概念换个公司 logo 反复考。一百四十块钱的教科书教我的还不如坚果零食女士教我的多

不过 Meta 的数据科学电话筛选轮,2025 年底,Dev 经历过。几乎全是 SQL,很难的 SQL。窗口函数。CTE。自连接。日期计算。他的题目是从一张登录表里找出连续三个月登录频率环比下降超过百分之五十的用户。LAG、窗口函数、日期分组,二十分钟,共享编辑器,开始。我认识的另外两个人也证实了 Meta 数据科学面试就是这样。SQL 就是那道门槛,现场写出来就过,写不出来就结束。Google 数据科学的编码轮比软件工程师轻一些,但他们要的是真正的 Python,具体来说是 Pandas,给你一堆脏数据,清洗、计算指标,然后面试官眯着眼看你说"这说明了什么。"笑死。很多人写出了能跑的代码,然后却说不清自己输出的结果到底是什么意思。一片死寂。我也当过那种人。盯着一个 dataframe。忘了数字是怎么回事

Dev 在 FaceTime 上看我做了一次 Google 模拟面试,把自己静音了免得我听到他笑。面试结束后他给我发消息说"兄弟你写出了正确的 Pandas 代码然后沉默了四十秒。"那四十秒的沉默和机器学习轮里让你挂掉的沉默其实是一回事。他们不会让你推导反向传播的。Dev 在 Amazon 被问到"什么时候选择梯度提升而不是随机森林",而我在和他的模拟面试中被问到"遇到类别不平衡你怎么办",同一个厨房台面,台面上还是同样的泰式炒河粉油渍因为他从来不擦,然后我又卡住了。他一口气列出了 SMOTE、类别权重、阈值调整、用精确率-召回率代替准确率、以及为什么误报和漏报在业务层面的代价不同,然后就坐在那儿看着我,跟 Lena 吃坚果零食时的表情一模一样。五个要点。我只答出两个。五个里面答出两个听起来就像你只看了一篇博客文章。你得五个都答出来,而且得把它们串联起来,这才算过。不过 Amazon 的 ML 深度考察轮是 Dev 差点崩溃的地方,你从简历上挑一个项目,他们对你连续追问三十分钟。什么模型。为什么。什么特征。评估方式。你会改什么。有个面试官花了整整十五分钟追问 Dev 在 Spotify 做的一个推荐系统的特征工程。十五分钟。就一个项目。我帮他准备的时候在他厨房台面上对着那个项目追问了一个小时,到第二十分钟他就开始在八个月前做的决策上犯糊涂了。那天晚上他把所有笔记全部重写了。全部。Google 走的是理论路线,偏差-方差权衡、模型复杂度、正则化。"好的,但是为什么 L1 会产生稀疏权重。"你说菱形约束区域,追问就是这在几何上意味着什么,以及为什么它对生产环境中的特征选择很重要。Lena 看到这个估计眼睛都要眯成一条缝了,笑死。永远是直觉优先于证明

案例分析是 Dev 让我真正佩服的地方。"指标上周下降了百分之十二,发生了什么。"你要在面试官面前实时搭建一个调查框架,面试官扮演一个对你的所有问题都给出模糊回答的产品经理。他在 Meta 的案例分析题是"Instagram Reels 在巴西的日活用户下降了百分之八,带我走一遍你的分析思路。"他问了五分钟的澄清问题才提出第一个假设。是所有用户还是某个细分群体。App 更新的时间节点。巴西当地的季节性规律。那五分钟的澄清问题比后面的分析框架更让面试官印象深刻。换成我,我可能会直接跳到假设然后就被扣分了。和 Pandas 代码写完后四十秒沉默是一模一样的问题。我的大脑总是想先回答,而不是先提问。行为面试轮用的是 STAR 方法,"讲一个你的分析改变了业务决策的经历。"具体的分析、哪个利益相关方、改变了什么决策、可量化的结果。"做了一些分析,起到了帮助"这种回答直接不通过。有些公司还会出带回家的作业,给你一个数据集和题目,四十八到七十二小时,提交一个 notebook。Dev 帮一个朋友审过一份作业。XGBoost 模型调得很好,但对于为什么做那些特征工程完全没有解释。连一句为什么选那些特征的话都没有。她没进下一轮。Dev 看完说"这是 Kaggle 比赛的代码转存,不是分析备忘录。"要写得像你在说服一个副总裁花钱一样。我聊过的每一个拿到 offer 的人都是这么写的。只交一份干净的 Kaggle 风格 notebook 能不能过?也许吧。但看到那份作业被拒之后我不会赌这个

如果你需要的话,各公司的面试形式在这里,因为 Dev 也拿这些考过我,笑死。Meta 数据科学是 SQL 电话筛选,然后现场面试包括产品感觉、案例分析、技术深度考察和行为面试,产品感觉是 Meta 特有的一轮,你要对他们的产品做指标推理,Dev 说这一轮最像被一个讨厌你的产品经理拷问。Google 数据科学是电话筛选考编程和统计,然后现场面试考编程、ML 概念、案例分析,还有 Googleyness 轮,就是他们版本的"我们愿不愿意跟你一起吃午饭"。Amazon 数据科学先是一个在线测评考 SQL 和基础统计,然后虚拟面试循环包括编程、ML 深度考察(基于过去的项目)、案例分析、行为面试结合领导力原则,如果你没背熟十四条领导力原则那就祝你好运吧。数据科学面试循环把编程和表达混在一起,这就是为什么很多人栽在这上面。SQL 和 Python 轮感觉像编程面试,实时辅助能在你语法卡壳的时候提醒你,或者帮你想起一个脑子突然掉线的窗口函数(我在 Meta 筛选轮的时候居然忘了 LAG,偏偏是 LAG,笑死)。统计和案例分析轮更偏对话形式,在框架步骤上推你一把能防止你陷入死胡同

我在第二轮求职周期中用了 InterviewMan。SQL 轮的时候,它提醒我写了一个关联子查询,其实用窗口函数会更简洁。我明明会窗口函数的。压力让我本能地去用最先学到的东西,这是最蠢的那种错误。案例分析轮的时候,遇到指标下降的问题,它提示我考虑季节性因素、产品变更、数据管道问题,基本上就是 Dev 在 Meta 遇到的那个巴西 Reels 题的翻版,只不过换成了支付公司。和 Dev 在厨房台面上就着泰式炒河粉反复训练我的内容一模一样。紧张情绪把这些全部清空了。说实话模拟面试教给我的比真实面试多得多,因为我能清楚看到自己的解释在哪个地方变成了含糊其辞,而且没有压力所以我真的能去修正。每月十二美元,不限次数,在花了两年读硕士还被坚果零食女士虐了之后,我可不打算在这上面省钱,笑死。到后来居然开始期待模拟面试了,这在我人生中从未发生过。我一开始也找过其他工具,但不是只有编程就是只有统计,没有一个能覆盖完整的数据科学面试流程。统计、案例分析、行为面试和 SQL 全在一个工具里。其他的都只能算半个工具

说一下我犯过的最蠢的错误。我花了一周专门刷 SQL。下一周统计。再下一周 ML。一个个小桶装着,好像它们是独立的科目一样。结果走进现场面试,一下午四个小时全部砸过来,所有东西一起考,和那个金融科技公司的副总裁在三轮面试之后又要我算 A/B 测试数学一模一样。Dev 跟我说过会这样的,在酒吧里说过,在他厨房台面上说过,大概还在某条我一边吃泰式炒河粉一边无视掉的消息里说过。九杯啤酒。我欠他九杯啤酒,大概还欠 Lena 一个道歉,因为她只想安静地吃坚果零食我却在她的厨房里把贝叶斯更新讲得一塌糊涂。她现在每次看到我来还是会眯着眼睛看我,笑死

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

ShareTwitterLinkedIn

Related Articles

Try InterviewMan Free

AI interview assistant. Undetectable.

Get Started