Domande da colloquio per Data Science 2026: SQL, ML e case study

ok allora il bancone della cucina di Dev. le 11 di sera. martedì. pad thai che cola grasso sul bancone, quel posto su mission street, troppi tovaglioli come al solito. Dev fa "spiegami gli errori di Tipo I e Tipo II nel contesto di un A/B test." niente. apro la bocca e non esce niente. ho fatto un intero master in statistica.

due anni di questa roba. e sono lì in piedi nella sua cucina incapace di dire una frase sugli errori di Tipo I lol. formule, certo. parole in italiano, no. Dev si è appoggiato allo schienale e ha aspettato. tre secondi che sono durati un anno. quel momento al bancone della cucina è il motivo per cui sto scrivendo questo, perché due settimane dopo un VP di prodotto in una fintech mi ha fatto lo stesso tipo di domanda al terzo round di un colloquio in sede e il mio cervello ha fatto la stessa identica cosa.

quattro ore dentro. primo round sulle window function SQL. secondo round interrogatorio di statistica. terzo round pitch sulla previsione del churn. poi questo tizio vuole che giustifichi le dimensioni del campione per un A/B test e io non ho niente. il mio master non mi ha salvato. Dev me l'aveva detto. è data scientist a Spotify, tre anni lì, gli devo nove birre a questo punto.

una volta al bar mi disse "i colloqui DS sono quattro colloqui che fingono di essere uno" e io ero al telefono senza ascoltare. lol

Dev disse una cosa quella sera che odiai. appoggiato al frigo, birra in mano, che faccia tosta. "se non riesci a spiegare un concetto a un PM in due frasi non lo capisci abbastanza per il colloquio." poi questo pazzo mi ha fatto spiegare l'aggiornamento bayesiano alla sua ragazza Lena. maestra d'asilo. zero background statistico. era lì seduta a mangiare mix di frutta secca e mi guardava socchiudendo gli occhi mentre io farfugliavo e non riuscivo a tradurre gli intervalli di confidenza in parole normali.

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

quattro tentativi. QUATTRO. ero visibilmente rosso. al terzo tentativo stavo quasi per arrendermi e lei continuava a socchiudere gli occhi e mangiare frutta secca. al quarto tentativo annuì e qualcosa si sbloccò nel mio cervello. penso alla faccia con gli occhi socchiusi di Lena ogni volta che qualcuno mi chiede di spiegare i p-value senza usare la parola probabilità, o quando usi il t-test rispetto al chi-quadrato, o fammi vedere la matematica delle dimensioni del campione per un A/B test.

le domande che saltano fuori in ogni ciclo di colloqui DS di cui ho sentito parlare da chiunque. gli stessi cinque concetti con loghi di aziende diverse. un libro di testo da centoquaranta dollari mi ha insegnato meno della signora della frutta secca

lo screening telefonico DS di Meta però, fine 2025, Dev lo ha fatto. quasi interamente SQL, SQL difficile. window function. CTE. self-join. calcoli con le date. la sua domanda era trovare utenti da una tabella di login la cui frequenza di accesso è calata di più del cinquanta percento mese su mese per tre mesi consecutivi. LAG, window function, raggruppamento per date, venti minuti, editor condiviso, vai.

altre due persone che conosco hanno confermato che il DS di Meta è così. SQL è il cancello d'ingresso, scrivi a freddo o lo screening è finito. il coding DS di Google è più leggero rispetto a SWE ma vogliono vero Python, Pandas in particolare, ti danno dati sporchi, puliscili, calcola le metriche, poi l'intervistatore ti guarda socchiudendo gli occhi e fa "cosa ci dice questo." lol.

le persone scrivono codice funzionante e poi non sanno dire in italiano cosa significa il loro output. silenzio di tomba. sono stato quella persona. fissando un dataframe. dimenticando come funzionano i numeri

Dev mi ha guardato fare un mock round di Google su FaceTime e si è messo in muto così non lo sentivo ridere. dopo mi ha scritto "fra hai scritto pandas corretto e poi non hai detto niente per quaranta secondi." quei quaranta secondi sono lo stesso silenzio che ti ammazza nei round di ML onestamente. non ti chiederanno di derivare la backpropagation.

Dev ha avuto "quando sceglieresti il gradient boosting rispetto a un random forest" ad Amazon e io ho avuto "classi sbilanciate cosa fai" in un mock con lui allo stesso bancone della cucina, stesso grasso di pad thai sul bancone perché non pulisce mai, e mi sono bloccato di nuovo. lui ha elencato SMOTE e pesi delle classi e calibrazione della soglia e precision-recall invece dell'accuracy e il business case del perché i falsi positivi costano diversamente dai falsi negativi e se ne stava lì seduto a guardarmi come Lena con la frutta secca.

cinque cose. io ne avevo due. due su cinque sembra che hai letto un post di un blog. te ne servono tutte e cinque e devi collegarle tra loro e questo è ciò che ti fa passare. il round di approfondimento ML di Amazon è dove Dev è quasi morto però, scegli un progetto dal tuo curriculum e ti trapanano per trenta minuti.

quale modello. perché. quali feature. valutazione. cosa cambieresti. questo intervistatore ha passato QUINDICI minuti sulla feature engineering per un sistema di raccomandazione che Dev aveva costruito a Spotify. quindici. su un progetto. l'ho preparato interrogandolo su quel progetto per un'ora al bancone della sua cucina e al minuto venti stava inciampando su scelte che aveva fatto otto mesi prima. ha riscritto tutti i suoi appunti quella notte.

tutti quanti. Google va sul teorico invece, tradeoff bias-varianza, complessità del modello, regolarizzazione. "ok ma PERCHÉ L1 produce pesi sparsi." dici regione di vincolo a diamante e la domanda successiva è cosa significa geometricamente e perché conta per la feature selection in produzione. Lena avrebbe socchiuso gli occhi fortissimo su quella lol. intuizione prima delle dimostrazioni sempre

i case study sono dove Dev mi ha impressionato onestamente. "le metriche sono calate del dodici percento la settimana scorsa, cosa è successo." costruisci un'indagine dal vivo mentre l'intervistatore interpreta un PM che ti dà risposte vaghe su tutto. il suo case study di Meta era "gli utenti attivi giornalieri di Instagram Reels sono calati dell'otto percento in Brasile, guidami nel ragionamento." cinque minuti di domande chiarificatrici prima di proporre una singola cosa.

tutti gli utenti o un segmento. tempistiche degli aggiornamenti dell'app. pattern stagionali specificamente in Brasile. quei cinque minuti di chiarimento hanno impressionato il suo intervistatore più del framework di analisi che è venuto dopo. io sarei saltato dritto alle ipotesi e probabilmente avrei preso un giudizio negativo per questo. lo stesso identico problema dei quaranta secondi di silenzio con pandas lol.

il mio cervello vuole rispondere prima di voler fare domande. i round comportamentali usano il metodo STAR, "raccontami di una volta in cui la tua analisi ha cambiato una decisione aziendale." analisi specifica, quale stakeholder, quale decisione è cambiata, risultato misurabile. "ho fatto un po' di analisi e ha aiutato" è una risposta da non-assunzione. i take-home alcune aziende li fanno ancora, dataset, prompt, quarantotto-settantadue ore, consegna un notebook.

Dev ha rivisto il take-home di un'amica una volta. modello XGBoost calibrato perfettamente, zero spiegazioni sul perché di ogni scelta di feature engineering. neanche una frase sul perché aveva scelto quelle feature. non è passata alla fase successiva. Dev l'ha guardato e ha detto "questo è un dump da kaggle non un memo." scrivilo come se stessi convincendo un VP a spendere soldi.

ogni persona con cui ho parlato che ha ricevuto un'offerta l'ha scritto così. potresti cavartela con un notebook pulito stile kaggle? forse. ma non ci scommetterei dopo aver visto quel lavoro venire rifiutato

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

formati delle aziende se li volete perché Dev mi ha interrogato anche su questi lol. Meta DS è screening telefonico SQL poi colloquio in sede con product sense più case study più approfondimento tecnico più comportamentale, il product sense è quello specifico di Meta dove ragioni sulle metriche per le loro app ed è il round che Dev ha detto sembrava più come essere grigliato da un PM che ti odia.

Google DS è screening telefonico con coding e statistica poi colloquio in sede con coding e concetti ML e case study e round Googleyness che è la loro versione di "sei una persona con cui vogliamo pranzare." Amazon DS inizia con un OA per SQL e statistica base poi loop virtuale con coding, approfondimento ML sul lavoro passato, case study, comportamentale con i principi di leadership e se non hai memorizzato quattordici principi di leadership buona fortuna.

i loop DS mescolano coding e parlato ed è per questo che mettono in difficoltà le persone. i round SQL e Python sembrano colloqui di coding dove l'aiuto in tempo reale ti segnala errori di sintassi o ti ricorda una window function che il tuo cervello ha perso (il mio ha perso LAG durante il mio screening Meta, tra tutte le cose lol). i round di statistica e case study sono più conversazionali, un suggerimento su un passaggio del framework ti impedisce di andare in tilt

ho usato InterviewMan durante il mio secondo ciclo. round SQL, mi ha segnalato che stavo scrivendo una subquery correlata quando una window function sarebbe stata più pulita. le window function le CONOSCO. la pressione mi ha fatto aggrappare a quello che ho imparato per primo che è il tipo di errore più stupido. round case study mi ha suggerito considera la stagionalità, i cambiamenti di prodotto, i problemi nella pipeline dati quando ho avuto una domanda su un calo delle metriche, praticamente la stessa cosa del Reels in Brasile che ha avuto Dev ma per un'azienda di pagamenti.

esattamente quello che Dev mi aveva martellato in testa al bancone della cucina con il pad thai. i nervi hanno cancellato tutto. i mock con quello onestamente mi hanno insegnato più dei round veri perché vedevo esattamente dove le mie spiegazioni diventavano gesti vaghi e non c'era pressione quindi potevo effettivamente correggerle. dodici dollari al mese, nessun limite alle sessioni, che dopo aver speso due anni per un master e essere stato distrutto dalla signora della frutta secca non avevo intenzione di fare il tirchio su questo lol.

a un certo punto ho iniziato a non vedere l'ora delle sessioni di mock che non mi era mai successo in vita mia. prima ho cercato qualcos'altro ma tutto era solo coding o solo statistica, niente che coprisse l'intero loop DS. statistica e case study e comportamentale e SQL in un unico strumento. tutto il resto era mezzo strumento

ecco la mia mossa più stupida. ho studiato SQL per una settimana. statistica la settimana dopo. ML dopo ancora. piccoli compartimenti separati come se fossero materie separate. sono entrato al colloquio in sede e mi hanno lanciato tutto addosso in un pomeriggio, quattro ore, tutto insieme, uguale a quel VP della fintech che voleva la matematica degli A/B test dopo tre round di tutto il resto.

Dev me l'aveva detto, al bar, al suo bancone della cucina, probabilmente in un messaggio che ho ignorato mentre mangiavo pad thai. nove birre. gli devo nove birre e probabilmente devo delle scuse a Lena per aver massacrato l'aggiornamento bayesiano nella sua cucina mentre cercava di mangiare frutta secca. ancora mi guarda con gli occhi socchiusi quando vado a trovarli lol

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

Get Started Free View Pricing

ShareTwitter LinkedIn

Guides

Domande da colloquio per Data Science 2026: SQL, ML e case study

Ready to Ace Your Next Interview?

Related Articles

Domande da colloquio per Product Design 2026: critique, whiteboard e portfolio

Domande da colloquio per Product Manager 2026: come prepararsi ai colloqui PM

Domande da colloquio per vendite 2026: dalle chiamate a freddo alla chiusura degli affari