ok så. på kjøkkenbenken til Dev. 23.00. tirsdag. pad thaien dryppet fett utover benken, fra det stedet på mission street, altfor mange servietter som vanlig. Dev sier "forklar Type I- vs Type II-feil i en A/B test-kontekst." ingenting. munnen min åpner seg og ingenting kommer ut. jeg tok en hel master i statistikk. to år med dette greiene. og så står jeg på kjøkkenet hans uten å klare å si én eneste setning om Type I-feil lol. formler, joda. engelske ord, nope. Dev lente seg tilbake og ventet. tre sekunder som varte et år. det øyeblikket på kjøkkenbenken er grunnen til at jeg skriver dette, for to uker senere spurte en VP of product i et fintech-selskap meg om akkurat samme type ting i tredje runde av en onsite, og hjernen min gjorde nøyaktig det samme. fire timer uti. SQL window functions i runde én. statistikkgrilling i runde to. pitch om churn prediction i runde tre. og så vil denne fyren at jeg skal forsvare utvalgsstørrelser for en A/B test, og jeg har ingenting. mastergraden min reddet meg ikke. Dev advarte meg. han er data scientist i Spotify, tre år der, jeg skylder ham ni øl på dette tidspunktet. han sa til meg på en bar en gang: "DS-intervjuer er fire intervjuer som later som de er ett," og jeg satt på mobilen og fulgte ikke med. lol
Dev sa noe den kvelden som jeg hatet. han lente seg mot kjøleskapet sitt, øl i hånda, frekkheten altså. "hvis du ikke kan forklare et konsept til en PM på to setninger, så forstår du det ikke godt nok til intervjuet." så fikk denne galningen meg til å forklare Bayesian updating til kjæresten hans Lena. barnehagelærer. null statistikkbakgrunn. hun satt der og spiste trail mix og myste på meg mens jeg babla, og jeg klarte ikke å få confidence intervals over i normale ord. fire forsøk. FIRE. jeg var synlig rød i ansiktet. i forsøk tre holdt jeg nesten på å gi opp, og hun satt fortsatt og myste og spiste trail mix. på fjerde forsøk nikket hun, og noe løsnet i hjernen min. jeg tenker på det mysende blikket til Lena hver gang noen ber meg forklare p-values uten å bruke ordet probability, eller når bruker du t-test vs chi-squared, eller gå gjennom matten bak utvalgsstørrelse i A/B tester. spørsmålene som dukker opp i hver eneste DS-loop jeg har hørt om fra noen som helst. de samme fem konseptene med forskjellige selskapslogoer på. læreboka til 140 dollar lærte meg mindre enn trail mix-dama
Meta sin DS phone screen da, sent i 2025, Dev gikk gjennom den. nesten bare SQL, hard SQL. window functions. CTEs. self-joins. datomatematikk. spørsmålet hans var å finne brukere i en logins-tabell der innloggingsfrekvensen hadde falt mer enn femti prosent måned over måned i tre måneder på rad. LAG, window functions, gruppering på dato, tjue minutter, delt editor, kjør. to andre jeg kjenner bekreftet at Meta DS er sånn. SQL er portvakten, skriv det rett ut fra hodet, ellers er screenen over. Google DS coding er lettere enn SWE, men de vil ha ekte Python, spesifikt Pandas, gir deg rotete data, få det rent, regn ut metrics, og så myser intervjueren på deg og sier "hva forteller dette oss." lol. folk skriver fungerende kode og klarer så ikke å si på vanlig språk hva outputen deres faktisk betyr. helt stille. jeg har vært den personen. stirret på en dataframe. glemt hvordan tall fungerer
Dev så på mens jeg gjorde en mock Google-runde over FaceTime og mutet seg selv så jeg ikke skulle høre ham le. han sendte melding etterpå: "bro, du skrev korrekt pandas og sa så ingenting på førti sekunder." de førti sekundene er den samme stillheten som dreper deg i ML-runder, egentlig. de kommer ikke til å be deg utlede backpropagation. Dev fikk "når ville du valgt gradient boosting fremfor en random forest" hos Amazon, og jeg fikk "imbalanced classes, hva gjør du" i en mock med ham ved det samme kjøkkenbordet, samme pad thai-fett på benken fordi han aldri vasker, og jeg frøs igjen. han ramsa opp SMOTE og class weights og threshold tuning og precision-recall over accuracy og businesscasen for hvorfor false positives koster noe annet enn false negatives, og satt der og så på meg som Lena med trail mixen. fem ting. jeg hadde to av dem. to av fem høres ut som du har lest ett blogginnlegg. du trenger alle fem, og du må knytte dem sammen, og det er det som gjør at du består. Amazon ML deep-dive-runden var der Dev nesten døde, da. du velger ett prosjekt fra CV-en og så borer de i det i tretti minutter. hvilken modell. hvorfor. hvilke features. evaluering. hva ville du endret. denne intervjueren brukte FEMTEN minutter på feature engineering for et rec system Dev bygde i Spotify. femten. på ett prosjekt. jeg preppet ham ved å krysseforhøre ham om det prosjektet i en time ved kjøkkenbenken hans, og innen minutt tjue snublet han i valg han hadde tatt åtte måneder tidligere. skrev om alle notatene hans den kvelden. alle sammen. Google går mer teoretisk til verks i stedet, bias-variance tradeoff, model complexity, regularization. "ok, men HVORFOR gir L1 sparse weights." du sier diamond constraint region, og oppfølgeren er hva betyr det geometrisk og hvorfor er det viktig for feature selection i prod. Lena ville ha myst enda hardere på den der lol. intuisjon over bevis, alltid
case studies er der Dev imponerte meg, ærlig talt. "metrics falt tolv prosent forrige uke, hva skjedde." du bygger en undersøkelse live mens intervjueren spiller PM og gir deg vage svar på absolutt alt. case studien hans hos Meta var "Instagram Reels daily active users falt åtte prosent i Brasil, gå gjennom hvordan du ville angripe det." fem minutter med avklaringsspørsmål før han foreslo én eneste ting. alle brukere eller et segment. timing for app-oppdatering. sesongmønstre i Brasil spesifikt. de fem avklaringsminuttene imponerte intervjueren hans mer enn analyseopplegget som kom etterpå. jeg ville sikkert ha hoppet rett til hypoteser og fått en ding for det. nøyaktig samme problem som de førti sekundene med død pandas-stillhet lol. hjernen min vil svare før den vil spørre. behavioral-runder bruker STAR method, "fortell om en gang analysen din endret en forretningsbeslutning." spesifikk analyse, hvilken stakeholder, hvilken beslutning endret seg, målbar effekt. "gjorde litt analyse og det hjalp" er et no-hire-svar. take-homes gjør noen selskaper fortsatt, datasett, prompt, førtiåtte til syttito timer, lever en notebook. Dev gjennomgikk en venns take-home en gang. XGBoost-modell perfekt tunet, null forklaring på hvorfor ett eneste feature engineering-valg var tatt. ikke én setning om hvorfor hun valgte de featureene. hun gikk ikke videre. Dev så på det og sa "dette er en Kaggle dump, ikke et memo." skriv det som om du prøver å overbevise en VP om å bruke penger. hver person jeg snakket med som fikk tilbud, skrev det sånn. kan du kanskje slippe unna med en ren notebook i Kaggle-stil? kanskje. men jeg ville ikke ha satset på det etter å ha sett den innleveringen bli avvist
selskapsformatene hvis du vil ha dem, for Dev quizet meg på dette også lol. Meta DS er SQL phone screen og så onsite med product sense pluss case study pluss technical deep-dive pluss behavioral, der product sense er Meta-spesifikke runden hvor du resonnerer om metrics for appene deres, og det var runden Dev sa føltes mest som å bli grillet av en PM som hater deg. Google DS er phone screen med coding og statistikk og så onsite med coding og ML concepts og case study og Googleyness-runde, som er deres versjon av "er du en person vi faktisk vil spise lunsj med." Amazon DS starter med en OA for SQL og grunnleggende statistikk og så virtuell loop med coding, ML deep-dive på tidligere arbeid, case study, behavioral med leadership principles, og hvis du ikke har pugget fjorten leadership principles, lykke til. DS-loops blander coding og prat, og det er derfor de ødelegger folk. SQL- og Python-runder føles som coding interviews der live hjelp fanger opp syntax-blackouts eller minner deg på en window function hjernen din mistet (min mistet LAG under Meta-screenen min, av alle ting lol). statistikk- og case study-runder er mer samtalebasert, og et lite dytt i ett framework-steg kan hindre at du spinner ut
jeg brukte InterviewMan i andre runde. i SQL-runden flagget det at jeg skrev en correlated subquery når en window function hadde vært renere. jeg VET hva window functions er. press fikk meg til å gripe etter det jeg lærte først, som er den dummeste typen feil. i case study-runden løftet det frem consider seasonality, product changes, data pipeline issues da jeg fikk et spørsmål om fallende metrics, i praksis den samme Brazil Reels-greia Dev fikk, men for et payments-selskap. akkurat det Dev hamret inn i meg ved den kjøkkenbenken over pad thai. nervene vasket det helt bort. mocks med det lærte meg ærlig talt mer enn de faktiske rundene, fordi jeg så nøyaktig hvor forklaringene mine gled over i håndvifting, og det var ikke press, så jeg kunne faktisk fikse det. tolv dollar i måneden, ingen tak på sessions, og etter å ha brukt to år på en master og blitt knust av trail mix-dama var jeg ikke akkurat i humør til å være gjerrig på dette lol. begynte faktisk å glede meg til mock-sessions på et tidspunkt, noe som aldri har skjedd meg i hele mitt liv. jeg så etter noe annet først, men alt var enten bare coding eller bare statistikk, ingenting som traff hele DS-loopen. statistikk og case study og behavioral og SQL i ett verktøy. alt annet var et halvt verktøy
her er mitt dummeste trekk. jeg leste SQL i en uke. statistikk uka etter. ML etter det. separate små bøtter som om det er separate fag. så gikk jeg inn i onsite og de kastet alt på meg i én og samme ettermiddag, fire timer, alt samtidig, akkurat som den fintech-VP-en som ville ha A/B test-matte etter tre runder med alt annet. Dev sa at det kom til å skje, på baren, ved kjøkkenbenken hans, sannsynligvis i en melding jeg ignorerte mens jeg spiste pad thai. ni øl. jeg skylder ham ni øl og skylder sikkert Lena en unnskyldning for å ha slaktet Bayesian updating på kjøkkenet hennes mens hun prøvde å spise trail mix. hun myser fortsatt på meg når jeg kommer innom lol
Ready to Ace Your Next Interview?
Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.
