Questions d'entretien data science 2026 : SQL, ML et etudes de cas

ok donc le comptoir de cuisine de Dev. 23h. Mardi. pad thai qui coule de la graisse sur le comptoir, cet endroit sur Mission Street, trop de serviettes comme d'habitude. Dev va "expliquer les erreurs de type I et de type II dans un contexte de test A/B". rien. ma bouche s'ouvre et rien ne sort. j'ai fait un master complet en statistiques.

deux ans de ce truc. et je me tiens dans sa cuisine, incapable de dire une phrase sur les erreurs de type I mdr. des formules, bien sûr. des mots anglais, non. Dev se rassit et attendit. trois secondes qui ont duré un an. Ce moment au comptoir de la cuisine est la raison pour laquelle j'écris ceci, car deux semaines plus tard, un vice-président des produits dans une entreprise de technologie financière m'a posé le même genre de question au troisième tour d'une visite sur place et mon cerveau a fait exactement la même chose.

quatre heures. La fenêtre SQL fonctionne au premier tour. les statistiques grillent le deuxième tour. Lancement de prédiction de désabonnement, troisième tour. alors cet homme veut que je justifie la taille des échantillons pour un test A/B et je n'ai rien. mon master ne m'a pas sauvé. Dev m'a prévenu. il est data scientist chez Spotify, là-bas depuis trois ans, je lui dois neuf bières à ce stade.

il m'a dit une fois dans un bar "Les interviews DS sont quatre interviews prétendant n'en être qu'une" et j'étais au téléphone sans écouter. mdr

Dev a dit quelque chose que j'ai détesté cette nuit-là. accoudé à son frigo, bière à la main, l'audace. "Si vous ne pouvez pas expliquer un concept à un PM en deux phrases, vous ne le comprenez pas pour l'entretien." puis ce fou m'a fait expliquer la mise à jour bayésienne à sa petite amie Lena. institutrice de maternelle. zéro fond de statistiques.

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

elle était assise là, mangeant du mélange montagnard et me louchant pendant que je divaguais et je n'arrivais pas à traduire les intervalles de confiance en mots normaux. quatre tentatives. QUATRE. j'étais visiblement rouge. troisième tentative, j'ai presque abandonné et elle louchait toujours et mangeait du mélange montagnard. tentative quatre, elle a hoché la tête et quelque chose s'est déverrouillé dans mon cerveau.

Je pense au visage louche de Lena chaque fois que quelqu'un me demande d'expliquer les valeurs p sans utiliser le mot probabilité, ou quand utilisez-vous le test t par rapport au chi carré, ou me guidez-vous dans les calculs de la taille de l'échantillon du test A/B. les questions qui apparaissent dans chaque boucle DS dont j'ai entendu parler par n'importe qui. cinq mêmes concepts portant des logos d'entreprise différents. Un manuel de cent quarante dollars m'a appris moins que le mélange montagnard lady

Meta, Dev l'a parcouru. presque entièrement SQL, SQL dur. fonctions de fenêtre. CTE. s'auto-joint. dater des mathématiques. sa question était de trouver des utilisateurs à partir d'une table de connexions dont la fréquence de connexion a chuté de plus de cinquante pour cent d'un mois à l'autre pendant trois mois consécutifs. LAG, fonctions de fenêtre, regroupement de dates, vingt minutes, éditeur partagé, c'est parti.

deux autres personnes que je connais ont confirmé que Meta DS est comme ça. SQL est la porte, écrivez-le à froid ou l'écran est terminé. Google Le codage DS est plus léger que SWE mais ils veulent du vrai Python, Pandas en particulier, vous remettent des données désordonnées, les nettoient, calculent des métriques, puis l'intervieweur vous regarde et dit "qu'est-ce que cela nous dit".

mdr. les gens écrivent du code fonctionnel et ne peuvent ensuite pas dire en anglais ce que signifie leur propre sortie. air mort. j'ai été cette personne. regarder une trame de données. oublier comment fonctionnent les nombres

Dev m'a regardé faire une simulation de Google sur FaceTime et s'est mis en sourdine pour ne pas l'entendre rire. il m'a envoyé un texto après "frère, tu as écrit les pandas corrects et tu n'as rien dit pendant quarante secondes." ces quarante secondes, c'est le même silence qui vous tue honnêtement dans les rounds ML. ils ne vous demanderont pas de dériver la rétropropagation.

Dev a eu "quand choisiriez-vous l'augmentation du dégradé sur une forêt aléatoire" à Amazon et j'ai eu "classes déséquilibrées, que faites-vous" sur une simulation avec lui sur ce même comptoir de cuisine, même graisse pad thai sur le comptoir parce qu'il ne nettoie jamais, et je me suis encore figé. il a énuméré SMOTE et les poids de classe, le réglage des seuils, le rappel de précision par rapport à l'exactitude et l'analyse de rentabilisation expliquant pourquoi les faux positifs coûtent différemment des faux négatifs et s'est assis là à me regarder comme Lena avec le mélange montagnard.

cinq choses. j'en avais deux. deux sur cinq semblent lire un article de blog. vous avez besoin des cinq et vous devez les connecter et c'est ce qui passe. Cependant, c'est lors de la ronde d'approfondissement Amazon ML que Dev a failli mourir, vous choisissez un projet dans votre CV et ils vous entraînent pendant trente minutes. quel modèle. pourquoi.

quelles fonctionnalités. évaluation. que changeriez-vous. cet intervieweur a passé QUINZE minutes sur l'ingénierie des fonctionnalités pour un système de développement de système d'enregistrement construit chez Spotify. quinze. sur un projet. Je l'ai préparé en l'interrogeant sur ce projet pendant une heure devant le comptoir de sa cuisine et à la vingtième minute, il trébuchait sur les choix qu'il avait faits huit mois auparavant.

a réécrit toutes ses notes cette nuit-là. tous. Google devient plutôt théorique, compromis biais-variance, complexité du modèle, régularisation. "ok mais POURQUOI L1 produit-il des poids clairsemés." vous dites région de contrainte en diamant et le suivi est ce que cela signifie géométriquement et pourquoi cela est important pour la sélection des fonctionnalités dans la production. Lena aurait tellement louché sur celui-là mdr. l'intuition sur les preuves toujours

sont celles où Dev m'a honnêtement impressionné. "Les statistiques ont chuté de douze pour cent la semaine dernière, que s'est-il passé." vous construisez une enquête en direct pendant que l'intervieweur incarne un PM qui vous donne des réponses vagues à tout. Son étude de cas Meta était "Les utilisateurs actifs quotidiens d'Instagram Reels ont chuté de huit pour cent au Brésil, expliquez-moi." cinq minutes de questions de clarification avant de proposer une seule chose.

tous les utilisateurs ou un segment. calendrier de mise à jour de l'application. les tendances saisonnières au Brésil en particulier. ces cinq minutes de clarification ont plus impressionné son interlocuteur que le cadre d'analyse qui a suivi. j'aurais sauté directement aux hypothèses et je me serais probablement fait sonner pour cela. exactement le même problème que les quarante secondes de silence des pandas morts mdr.

mon cerveau veut répondre avant de demander. les rondes comportementales utilisent la méthode STAR, "parlez-moi d'une fois où votre analyse a modifié une décision commerciale". analyse spécifique, quelle partie prenante, quelle décision a changé, résultat mesurable. "J'ai fait quelques analyses et cela m'a aidé" est une réponse sans embauche. ce que certaines entreprises font encore à la maison, un ensemble de données, une invite, quarante-huit à soixante-douze heures, soumettre un cahier.

Dev a examiné une fois le message d'un ami. Le modèle XGBoost est parfaitement adapté, aucune explication sur la raison pour laquelle un choix d'ingénierie de fonctionnalités a été fait. pas une phrase expliquant pourquoi elle avait choisi ces fonctionnalités. elle n'a pas avancé. Dev l'a regardé et a dit "c'est un dépotoir de Kaggle, pas un mémo." écrivez-le comme si vous convainquiez un vice-président de dépenser de l'argent.

toutes les personnes à qui j'ai parlé et qui ont reçu une offre l'ont écrite de cette façon. pourriez-vous vous en sortir avec un cahier propre de style kaggle ? peut être. mais je ne parierais pas là-dessus après avoir vu cette soumission être rejetée

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

company si vous les voulez parce que Dev m'a également interrogé à ce sujet mdr. Meta DS est un écran de téléphone SQL puis sur site avec un sens du produit plus une étude de cas plus une analyse technique approfondie et un comportement, le sens du produit étant celui spécifique à Meta où vous raisonnez sur les métriques de leurs applications et c'est le tour que Dev a dit, cela ressemble le plus à être grillé par un PM qui vous déteste.

Google DS est un écran de téléphone avec codage et statistiques, puis sur site avec des concepts de codage et de ML, une étude de cas et Googleyness round qui est leur version de "êtes-vous une personne avec qui nous voulons déjeuner". Amazon DS commence par un OA pour SQL et des statistiques de base, puis une boucle virtuelle avec codage, une analyse approfondie du ML sur les travaux antérieurs, une étude de cas, un comportement avec les principes de leadership et si vous n'avez pas mémorisé quatorze principes de leadership, bonne chance.

Les boucles DS mélangent codage et conversation, c'est pourquoi elles gâchent les gens. Les cycles SQL et Python ressemblent à des interviews de codage où l'aide en direct détecte les blancs de syntaxe ou vous rappelle une fonction de fenêtre que votre cerveau a abandonnée (le mien a laissé tomber LAG pendant mon écran Meta, de toutes choses mdr). les statistiques et les cycles d'études de cas sont plus conversationnels, un coup de pouce sur une étape du cadre vous empêche de sombrer dans une spirale

i a utilisé InterviewMan lors de mon deuxième cycle. SQL round m'a signalé l'écriture d'une sous-requête corrélée lorsqu'une fonction de fenêtre serait plus propre. je CONNAIS les fonctions des fenêtres. la pression m'a fait atteindre ce que j'ai appris en premier, ce qui est le type d'erreur la plus stupide. Une étude de cas autour de cela a fait surface, prenant en compte la saisonnalité, les changements de produits, les problèmes de pipeline de données lorsque j'ai reçu une question sur les mesures, essentiellement la même chose que Brazil Reels que Dev a obtenue, mais pour une société de paiement.

exactement ce que Dev m'a percé au comptoir de la cuisine pendant un pad thaï. les nerfs ont tout effacé. Honnêtement, les moqueries avec cela m'ont appris plus que les rondes en direct parce que j'ai vu exactement où mes explications se sont transformées en agitant la main et il n'y avait aucune pression pour que je puisse réellement les corriger.

douze dollars par mois, pas de plafond sur les séances, ce qui, après avoir passé deux ans en master et avoir été détruit par une dame de mix montagnard, je n'étais pas sur le point d'être bon marché à propos de ce mdr. En fait, j'ai commencé à attendre avec impatience des séances simulées à un moment donné, ce qui ne m'était jamais arrivé de ma vie.

J'ai d'abord cherché autre chose, mais tout n'était que du codage ou des statistiques, rien qui touche la boucle DS complète. statistiques et études de cas, comportementales et SQL dans un seul outil. tout le reste n'était qu'un demi-outil

voici mon geste le plus stupide. j'ai étudié SQL pendant une semaine. statistiques la semaine prochaine. ML après ça. des petits seaux séparés comme s'il s'agissait de sujets distincts. est entré sur mon site et ils m'ont tout lancé en un après-midi, quatre heures, tout en même temps, tout comme ce vice-président de la fintech qui voulait un test A/B de mathématiques après trois tours de tout le reste.

Dev m'a dit que cela se produirait, au bar, sur le comptoir de sa cuisine, probablement dans un texte que j'ai ignoré en mangeant du pad thai. neuf bières. Je lui dois neuf bières et je dois probablement des excuses à Lena pour avoir massacré la mise à jour bayésienne dans sa cuisine alors qu'elle essayait de manger un mélange montagnard. elle me regarde toujours quand je viens mdr

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

Get Started Free View Pricing

ShareTwitter LinkedIn

Guides

Questions d'entretien data science 2026 : SQL, ML et etudes de cas

Ready to Ace Your Next Interview?

Related Articles

Questions d'entretien en design produit 2026 : critiques, whiteboard et portfolio

Questions d'entretien chef de produit 2026 : comment se preparer aux entretiens PM

Questions d'entretien commercial 2026 : du demarchage a la conclusion