Leave a Review & Get 30% OFF - Limited Time Offer!

00:00:00
Guides

Data science-intervjufragor 2026: SQL, ML och case

Last updated: March 25, 2026|9 min read|By InterviewMan Team

ok så Devs köksbänk. 23:00. tisdag. pad thai som läcker fett på bänken, det där stället på mission street, för många servetter som vanligt. Dev säger "förklara Type I vs Type II errors i en A/B test-kontext." ingenting. min mun öppnas och ingenting kommer ut. jag gjorde en hel master i statistik. två år av det här. och jag står i hans kök och kan inte få fram en enda mening om Type I errors lol. formler, sure. engelska ord, nope. Dev lutade sig tillbaka och väntade. tre sekunder som varade ett år. det där köksbänksögonblicket är varför jag skriver det här, för två veckor senare ställde en VP of product på ett fintech-bolag samma sorts fråga i runda tre på en onsite och min hjärna gjorde exakt samma sak. fyra timmar in. SQL window functions i runda ett. stats-grillning i runda två. churn prediction-pitch i runda tre. och sen vill den här mannen att jag ska motivera sample sizes för ett A/B test och jag har ingenting. min master räddade mig inte. Dev varnade mig. han är data scientist på Spotify, tre år där, jag är skyldig honom nio öl vid det här laget. han sa till mig en gång på en bar "DS-intervjuer är fyra intervjuer som låtsas vara en" och jag satt med mobilen och lyssnade inte. lol

Dev sa något den kvällen som jag hatade. lutad mot kylskåpet, öl i handen, fräckheten. "om du inte kan förklara ett koncept för en PM på två meningar så förstår du det inte tillräckligt för intervjun." sen fick den här galningen mig att förklara Bayesian updating för hans flickvän Lena. förskollärare. noll statistikbakgrund. hon satt där och åt trail mix och kisade på mig medan jag svamlade och jag kunde inte få confidence intervals till vanliga ord. fyra försök. FYRA. jag var synligt röd i ansiktet. försök tre höll jag nästan på att ge upp och hon satt fortfarande och kisade och åt trail mix. försök fyra nickade hon och något låstes upp i min hjärna. jag tänker på Lenas kisande ansikte varje gång någon ber mig förklara p-values utan att använda ordet probability, eller när använder du t-test vs chi-squared, eller gå igenom sample size-matematiken för A/B test. frågorna som dyker upp i varje DS-loop jag hört om från någon. samma fem koncept i olika företagsloggor. läroboken för 140 dollar lärde mig mindre än trail-mix-damen

Meta's DS-phone screen däremot, sent 2025, Dev gick igenom den. nästan helt SQL, hård SQL. window functions. CTEs. self-joins. datumräkning. hans fråga var hitta användare från en logins-tabell vars loginfrekvens föll mer än femtio procent månad över månad under tre månader i rad. LAG, window functions, datumgruppering, tjugo minuter, delad editor, kör. två andra personer jag känner bekräftade att Meta DS är så. SQL är grinden, skriv det kallt annars är screenen över. Google DS-kodning är lättare än SWE men de vill ha riktig Python, Pandas specifikt, ger dig stökig data, rensa den, räkna ut metrics, och sen kisar intervjuaren på dig och säger "vad säger det här oss." lol. folk skriver fungerande kod och kan sedan inte säga på vanlig engelska vad deras egen output betyder. död luft. jag har varit den personen. stirrat på en dataframe. glömt hur siffror fungerar

Dev såg mig göra en mock Google-runda över FaceTime och mutade sig själv så att jag inte skulle höra honom skratta. han sms:ade efteråt "bro du skrev korrekt pandas och sa sedan ingenting i fyrtio sekunder." de där fyrtio sekunderna är samma tystnad som dödar dig i ML-rundor om jag ska vara ärlig. de kommer inte be dig härleda backpropagation. Dev fick "när skulle du välja gradient boosting framför en random forest" på Amazon och jag fick "imbalanced classes what do you do" i en mock med honom vid samma köksbänk, samma pad thai-fett på bänken eftersom han aldrig städar, och jag frös igen. han rabblade upp SMOTE och class weights och threshold tuning och precision-recall över accuracy och affärsfallet för varför false positives kostar annorlunda än false negatives och satt sedan där och tittade på mig som Lena med trail mixen. fem saker. jag hade två av dem. två av fem låter som att du läst ett blogginlägg. du behöver alla fem och du behöver knyta ihop dem och det är det som tar dig igenom. Amazons ML deep-dive-runda är där Dev nästan dog dock, du väljer ett projekt från CV:t och de borrar i trettio minuter. vilken modell. varför. vilka features. evaluation. vad skulle du ändra. den här intervjuaren spenderade FEMTON minuter på feature engineering för ett rec system Dev byggt på Spotify. femton. på ett projekt. jag förberedde honom genom att förhöra honom om det projektet i en timme vid hans köksbänk och vid minut tjugo snubblade han på val han gjort åtta månader tidigare. skrev om alla hans anteckningar den kvällen. alla. Google går mer teoretiskt i stället, bias-variance tradeoff, model complexity, regularization. "ok men VARFÖR ger L1 sparse weights." du säger diamond constraint region och följdfrågan är vad betyder det geometriskt och varför spelar det roll för feature selection i prod. Lena hade kisat så hårt åt den där lol. intuition före bevis, alltid

case studies är där Dev imponerade på mig ärligt talat. "metrics föll tolv procent förra veckan, vad hände." du bygger en undersökning live medan intervjuaren spelar en PM som ger dig vaga svar på allt. hans Meta case study var "Instagram Reels daily active users föll åtta procent i Brasilien, gå igenom det." fem minuters klargörande frågor innan han föreslog en enda sak. alla användare eller ett segment. timing för appuppdatering. säsongsmönster i Brasilien specifikt. de där fem minuterna av förtydligande imponerade mer på intervjuaren än analysramverket som kom efter. jag hade hoppat direkt till hypoteser och förmodligen fått minus för det. exakt samma problem som de fyrtio sekunderna av död pandas-tystnad lol. min hjärna vill svara innan den vill fråga. behavioral-rundor använder STAR-metoden, "berätta om en gång din analys förändrade ett affärsbeslut." specifik analys, vilken stakeholder, vilket beslut ändrades, mätbart utfall. "gjorde lite analys och det hjälpte" är ett no-hire-svar. take-homes gör vissa bolag fortfarande, dataset, prompt, fyrtioåtta till sjuttiotvå timmar, lämna in en notebook. Dev granskade en väns take-home en gång. XGBoost-modell perfekt trimmad, noll förklaring till varför någon feature engineering-val gjordes. inte en enda mening om varför hon valde de featuresen. hon gick inte vidare. Dev tittade på det och sa "det här är en kaggle dump, inte ett memo." skriv det som om du försöker övertyga en VP att lägga pengar. alla jag pratade med som fick offer skrev det så. kan du komma undan med en ren kaggle-stil notebook? kanske. men jag skulle inte satsa på det efter att ha sett den inlämningen bli ratad

företagsformat om du vill ha dem för Dev förhörde mig på de här också lol. Meta DS är SQL phone screen och sedan onsite med product sense plus case study plus technical deep-dive plus behavioral, där product sense är den Meta-specifika där du resonerar om metrics för deras appar och det är rundan Dev sa kändes mest som att bli grillad av en PM som hatar dig. Google DS är phone screen med kodning och stats och sedan onsite med kodning och ML-koncept och case study och Googleyness-runda som är deras version av "är du en person vi vill äta lunch med." Amazon DS börjar med en OA för SQL och grundläggande stats och sedan virtuell loop med kodning, ML deep-dive på tidigare arbete, case study, behavioral med leadership principles och om du inte har memorerat fjorton leadership principles lycka till. DS-loopar blandar kodning och prat vilket är varför de förstör folk. SQL- och Python-rundor känns som kodintervjuer där livehjälp fångar syntaxblankningar eller påminner dig om en window function som hjärnan tappade (min tappade LAG under min Meta-screen, av alla saker lol). stats- och case study-rundor är mer samtalsmässiga, en liten knuff på ett ramverkssteg hindrar dig från att snurra iväg

jag använde InterviewMan under min andra cykel. SQL-runda, det flaggade att jag skrev en correlated subquery när en window function hade varit renare. jag KAN window functions. press fick mig att sträcka mig efter vad jag lärde mig först, vilket är den dummaste sortens misstag. case study-runda det lyfte consider seasonality, product changes, data pipeline issues när jag fick en metrics drop-fråga, i princip samma Brazil Reels-grej Dev fick men för ett payments-bolag. exakt det Dev bankade in i mig vid den där köksbänken över pad thai. nerver suddade bort allt. mocks med det lärde mig ärligt talat mer än live-rundorna eftersom jag såg exakt var mina förklaringar blev handviftande och det fanns ingen press så jag kunde faktiskt fixa dem. tolv dollar i månaden, inga sessionstak, vilket efter att ha lagt två år på en master och blivit slaktad av trail-mix-damen inte var något jag tänkte vara snål om lol. började faktiskt se fram emot mocks någon gång vilket aldrig hänt mig i hela mitt liv. jag letade runt efter något annat först men allt var bara kodning eller bara stats, inget som täckte hela DS-loopen. stats och case study och behavioral och SQL i ett verktyg. allt annat var ett halvt verktyg

här är mitt dummaste drag. jag pluggade SQL i en vecka. stats veckan efter. ML efter det. separata små hinkar som om de vore separata ämnen. gick in på min onsite och de kastade allt på mig under en enda eftermiddag, fyra timmar, allt på en gång, samma som den där fintech-VP:n som ville ha A/B test-matte efter tre rundor av allt annat. Dev sa att det skulle hända, på baren, vid hans köksbänk, förmodligen i ett sms jag ignorerade medan jag åt pad thai. nio öl. jag är skyldig honom nio öl och är nog skyldig Lena en ursäkt för att ha slaktat Bayesian updating i hennes kök medan hon försökte äta trail mix. hon kisar fortfarande på mig när jag kommer över lol

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

ShareTwitterLinkedIn

Related Articles

Try InterviewMan Free

AI interview assistant. Undetectable.

Get Started