Data Science -haastattelukysymykset 2026: SQL, ML ja case-tehtavat

okei eli Devin keittiön taso. klo 23. tiistai. pad thai vuotaa rasvaa tiskin päälle, se paikka mission streetillä, liikaa serviettejä kuten aina. Dev sanoo "selitä tyypin I ja tyypin II virheet A/B-testauksen kontekstissa." ei mitään. suuni aukeaa eikä mitään tule ulos. tein kokonaisen maisterin tilastotieteessä. kaksi vuotta tätä kamaa. ja seison hänen keittiössään kykenemättä sanomaan yhtä lausetta tyypin I virheistä lol.

kaavoja, toki. sanoja, ei. Dev nojasi taakse ja odotti. kolme sekuntia jotka kestivät vuoden. tuo keittiöhetki on syy miksi kirjoitan tämän, koska kaksi viikkoa myöhemmin fintech-yhtiön tuotejohtaja kysyi minulta samanlaisen kysymyksen kolmannessa paikan päällä -kierroksessa ja aivoni tekivät täsmälleen saman. neljä tuntia menossa. SQL-ikkunafunktiot kierros yksi. tilastogrillaus kierros kaksi. asiakasvaihtuvuusmalli kierros kolme. sitten tämä mies haluaa minun perustelevan otoskoot A/B-testille eikä minulla ole mitään.

maisterini ei pelastanut minua. Dev varoitti minua. hän on data scientist Spotifylla, kolme vuotta siellä, olen hänelle velkaa yhdeksän olutta tässä vaiheessa. hän kertoi minulle baarissa kerran "DS-haastattelut ovat neljä haastattelua jotka teeskentelevät olevansa yksi" ja olin puhelimellani enkä kuunnellut. lol

Dev sanoi sinä iltana jotain mitä vihasin. nojaten jääkaappiinsa, olut kädessä, se röyhkeys. "jos et pysty selittämään konseptia tuotepäällikölle kahdessa lauseessa, et ymmärrä sitä haastattelua varten." sitten tämä hullu pani minut selittämään bayesiläistä päivitystä tyttöystävälleen Lenalle. lastentarhanopettaja. nolla tilastotaustaa. hän istui siinä syöden pähkinäsekoitusta ja siristellen silmiään kun höpötin enkä pystynyt saamaan luottamusvälejä tavallisiksi sanoiksi. neljä yritystä. NELJÄ. olin selvästi punainen.

kolmannella yrityksellä melkein luovutin ja hän edelleen siristi silmiään ja söi pähkinäsekoitusta. neljännellä kerralla hän nyökkäsi ja jotain avautui aivoissani. ajattelen Lenan siristävää naamaa joka kerta kun joku pyytää minua selittämään p-arvot käyttämättä sanaa todennäköisyys, tai milloin käytät t-testiä vs. khin neliötestiä, tai käy läpi A/B-testin otoskoon matikka. ne kysymykset jotka tulevat jokaisessa DS-kierroksessa mistä olen kuullut. samat viisi konseptia eri firmojen logoissa. sataneljänkymmenen euron oppikirja opetti minulle vähemmän kuin pähkinäsekoitusneiti

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

Metan DS-puhelinhaastattelu kuitenkin, loppuvuonna 2025, Dev kävi sen läpi. melkein kokonaan SQL:ää, vaikeaa SQL:ää. ikkunafunktioita. CTE:itä. self-joineja. päivämäärämatikkaa. hänen kysymyksensä oli etsi käyttäjät kirjautumistaulusta joiden kirjautumistiheys laski yli viisikymmentä prosenttia kuukaudesta toiseen kolmen peräkkäisen kuukauden ajan. LAG, ikkunafunktiot, päivämääräryhmittely, kaksikymmentä minuuttia, jaettu editori, anna mennä. kaksi muuta tuntemaa vahvisti Metan DS:n olevan sellaista. SQL on portti, kirjoita se kylmiltään tai haastattelu on ohi.

Googlen DS-koodaus on kevyempää kuin SWE mutta he haluavat oikeaa Pythonia, nimenomaan Pandasia, antavat sotkuista dataa, siivoa se, laske metriikat, sitten haastattelija siristää silmiään ja sanoo "mitä tämä kertoo meille." lol. ihmiset kirjoittavat toimivaa koodia ja sitten eivät pysty sanomaan mitä heidän oma tulostensa tarkoittaa. kuollut hiljaisuus. olen ollut se henkilö. tuijottamassa dataframea. unohdin miten numerot toimivat

Dev katsoi harjoitus-Google-kierrostani FaceTimessa ja mykisti itsensä etten kuulisi hänen nauravan. hän viestitti jälkeen "kaveri sä kirjoitit oikean pandas-koodin ja sitten sanoit neljäkymmentä sekuntia ei mitään." tuo neljäkymmentä sekuntia on sama hiljaisuus joka tappaa ML-kierroksissa rehellisesti. he eivät aio pyytää sinua johtamaan backpropagaatiota. Dev sai "milloin valitsisit gradient boostingin random forestin yli" Amazonilla ja minä sain "epätasapainoiset luokat mitä teet" harjoituksessa hänen kanssaan samalla keittiön tasolla, sama pad thai -rasva tiskillä koska hän ei koskaan siivoa, ja jähmettyin taas.

hän listasi SMOTE:n ja luokkapainot ja kynnyksen säätämisen ja precision-recall yli tarkkuuden ja liiketoimintatapauksen miksi väärät positiiviset maksavat eri verran kuin väärät negatiiviset ja istui siinä katsoen minua kuin Lena pähkinäsekoituksen kanssa. viisi asiaa. minulla oli kaksi niistä. kaksi viidestä kuulostaa siltä että luit blogipostauksen. tarvitset kaikki viisi ja sinun pitää yhdistää ne ja se on se mikä läpäisee. Amazonin ML-syväsukellus oli missä Dev melkein kuoli kuitenkin, valitset yhden projektin ansioluettelostasi ja he poraavat sinua kolmekymmentä minuuttia.

mikä malli. miksi. mitkä piirteet. arviointi. mitä muuttaisit. tämä haastattelija käytti VIISITOISTA minuuttia piirteiden suunnitteluun suosittelujärjestelmästä jonka Dev rakensi Spotifylle. viisitoista. yhdestä projektista. valmistin häntä tenttaamalla häntä tuosta projektista tunnin hänen keittiönsä tasolla ja kahdenkymmennen minuutin kohdalla hän kompuroi valinnoissa joita hän teki kahdeksan kuukautta sitten. kirjoitti kaikki muistiinpanonsa uusiksi sinä iltana. kaikki. Google menee teoreettisemmaksi, bias-varianssi-kompromissi, mallin kompleksisuus, regularisaatio.

"okei mutta MIKSI L1 tuottaa harvoja painoja." sanot timanttirajoitusalue ja jatkokysymys on mitä se tarkoittaa geometrisesti ja miksi sillä on väliä piirteiden valinnassa tuotannossa. Lena olisi siristellyt silmiään niin kovasti tuossa lol. intuitio todistusten yli aina

tapaustutkimukset ovat missä Dev vaikutti minuun rehellisesti. "metriikat laskivat kaksitoista prosenttia viime viikolla, mitä tapahtui." rakennat tutkimuksen livenä samalla kun haastattelija esittää tuotepäällikköä joka antaa epämääräisiä vastauksia kaikkeen. hänen Meta-tapaustutkimuksensa oli "Instagram Reelsin päivittäiset aktiiviset käyttäjät laskivat kahdeksan prosenttia Brasiliassa, käy se läpi." viisi minuuttia tarkentavia kysymyksiä ennen kuin hän ehdotti mitään. kaikki käyttäjät vai segmentti. sovelluspäivityksen ajoitus. Brasilian kausivaihtelut nimenomaan.

nuo viisi tarkentavaa minuuttia vaikuttivat hänen haastattelijaansa enemmän kuin analyysiviitekehys joka tuli sen jälkeen. olisin hypännyt suoraan hypoteeseihin ja saanut miinusta siitä luultavasti. täsmälleen sama ongelma kuin neljänkymmenen sekunnin kuolleen pandas-hiljaisuuden kanssa lol. aivoni haluavat vastata ennen kuin haluavat kysyä. käyttäytymiskierrokset käyttävät STAR-menetelmää, "kerro tilanteesta jossa analyysisi muutti liiketoimintapäätöstä." tietty analyysi, kuka sidosryhmäläinen, mikä päätös muuttui, mitattava tulos. "tein analyysin ja se auttoi" on hylkäysvastaus.

kotitehtäviä jotkut firmat vielä tekevät, datasetti, tehtävänanto, neljäkymmentäkahdeksan - seitsemänkymmentäkaksi tuntia, palauta notebook. Dev arvioi kaverin kotitehtävän kerran. XGBoost-malli viritetty täydellisesti, nolla selitystä miksi mikään piirrevalinta tehtiin. ei yhtä lausetta miksi hän valitsi ne piirteet. ei edennyt. Dev katsoi sitä ja sanoi "tämä on kaggle-dumppi eikä muistio." kirjoita se kuin vakuuttaisit johtajaa käyttämään rahaa. jokainen henkilö jolle puhuin ja joka sai tarjouksen kirjoitti sen niin. voisitko selvitä siistillä kaggle-tyylisellä notebookilla? ehkä. mutta en veikkaisi sen puolesta nähtyäni tuon palautuksen hylättynä

firmakohtaiset formaatit jos haluat ne koska Dev tenttasi minua myös näistä lol. Metan DS on SQL-puhelinhaastattelu sitten paikan päällä tuotenäkemys plus tapaustutkimus plus tekninen syväsukellus plus käyttäytyminen, tuotenäkemys on Metan oma kierros jossa arvioit heidän sovellustensa metriikoita ja se on kierros jonka Dev sanoi tuntuvan eniten siltä kuin tuotepäällikkö joka vihaa sinua grillaisi sinua. Googlen DS on puhelinhaastattelu koodauksella ja tilastoilla sitten paikan päällä koodaus ja ML-konseptit ja tapaustutkimus ja Googleyness-kierros joka on heidän versionsa "onko tämä ihminen jota haluamme lounaalle." Amazonin DS alkaa OA:lla SQL:stä ja perustilastoista sitten virtuaalikierros koodauksella, ML-syväsukellus aiemmasta työstä, tapaustutkimus, käyttäytyminen johtamisperiaatteilla ja jos et ole opetellut ulkoa neljäätoista johtamisperiaatetta onnea.

DS-kierrokset sekoittavat koodausta ja puhetta ja siksi ne sekoittavat ihmisiä. SQL- ja Python-kierrokset tuntuvat koodaushaastatteluilta joissa live-apu nappaa syntaksiaukkoja tai muistuttaa ikkunafunktiosta jonka aivosi pudottivat (omani pudottivat LAG:n Meta-haastattelussani, kaikista asioista lol). tilasto- ja tapaustutkimuskierrokset ovat keskustelevampia, viitekehysaskeleen muistutus estää spiraaliin joutumisen

käytin InterviewMania toisella kierroksellani. SQL-kierros, merkitsi minut kirjoittamassa korreloitua alikyselyä kun ikkunafunktio olisi siistimpi. TIEDÄN ikkunafunktiot. paine sai minut tarttumaan siihen minkä opin ensin mikä on typerin virhetyyppi. tapaustutkimuskierroksessa se toi esiin huomioi kausivaihtelut, tuotemuutokset, dataputkiongelmat kun sain metriikkalaskukysymyksen, periaatteessa sama Brasilian Reels -juttu jonka Dev sai mutta maksufirmalle. täsmälleen se mitä Dev jankutti minulle keittiön tasollaan pad thain yli.

hermot pyyhkivät kaiken puhtaaksi. harjoitukset sen kanssa opettivat rehellisesti enemmän kuin oikeat kierrokset koska näin tarkalleen missä selitykseni muuttuivat käsien heilutteluksi eikä ollut painetta joten pystyin oikeasti korjaamaan ne. kaksitoista euroa kuussa, ei rajoja sessioille, mikä sen jälkeen kun käytin kaksi vuotta maisteriin ja pähkinäsekoitusneiti tuhosi minut en aio pihistellä tässä lol. aloin oikeasti odottaa harjoitussessioita jossain vaiheessa mikä ei ole koskaan tapahtunut minulle.

katsoin ensin muita mutta kaikki oli vain koodausta tai vain tilastoja, mikään ei kattanut koko DS-kierrosta. tilastot ja tapaustutkimus ja käyttäytyminen ja SQL yhdessä työkalussa. kaikki muu oli puolikas työkalu

tässä typerin siirtoni. opiskelin SQL:ää viikon. tilastoja seuraavan viikon. ML:ää sen jälkeen. erillisiä pieniä laatikoita kuin ne olisivat erillisiä aineita. kävelin paikan päälle haastatteluun ja he heittivät kaiken niskaan yhtenä iltapäivänä, neljä tuntia, kaikki kerralla, sama kuin se fintech-johtaja joka halusi A/B-testimatikkaa kolmen kierroksen jälkeen kaikkea muuta. Dev kertoi minulle niin tapahtuvan, baarissa, keittiön tasollaan, luultavasti tekstiviestissä jonka ohitin pad thaita syödessäni.

yhdeksän olutta. olen hänelle velkaa yhdeksän olutta ja luultavasti velkaa Lenalle anteeksipyynnön bayesiläisen päivityksen teurastamisesta hänen keittiössään kun hän yritti syödä pähkinäsekoitusta. hän edelleen siristää silmiään kun tulen käymään lol

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

Get Started Free View Pricing

ShareTwitter LinkedIn

Guides

Data Science -haastattelukysymykset 2026: SQL, ML ja case-tehtavat

Ready to Ace Your Next Interview?

Related Articles

Product Design -haastattelukysymykset 2026: kritiikit, whiteboard ja portfolio

Product Manager -haastattelukysymykset 2026: miten valmistaudut PM-haastatteluihin

Myyntihaastattelukysymykset 2026: kylmasoitoista kauppojen klousaamiseen