Pytania na rozmowe Data Science 2026: SQL, ML i case studies

ok więc blat kuchenny Deva. 23:00. wtorek. pad thai zostawia tłuste plamy na blacie, to miejsce na mission street, jak zwykle za dużo serwetek. Dev mówi "wyjaśnij błędy Type I vs Type II w kontekście testu A/B." nic. otwieram usta i nic z nich nie wychodzi. zrobiłem całe magisterium ze statystyki. dwa lata tego wszystkiego. a stoję w jego kuchni i nie potrafię powiedzieć jednego zdania o błędach Type I lol.

wzory, jasne. słowa po angielsku, nie. Dev odchylił się i czekał. trzy sekundy, które trwały rok. ten moment przy kuchennym blacie jest powodem, dla którego to piszę, bo dwa tygodnie później VP of product w fintechu zadał mi praktycznie to samo pytanie w trzeciej rundzie onsite i mózg zrobił mi dokładnie to samo. cztery godziny już za mną. SQL window functions w rundzie pierwszej.

przepytywanie ze statystyki w rundzie drugiej. prezentacja predykcji churnu w rundzie trzeciej. a potem ten gość chce, żebym uzasadnił wielkości próbki do testu A/B, a ja nie mam nic. moje magisterium mnie nie uratowało. Dev mnie ostrzegał. jest data scientistem w Spotify, siedzi tam trzy lata, w tym momencie wiszę mu już dziewięć piw. powiedział mi kiedyś w barze "rozmowy DS to tak naprawdę cztery rozmowy udające jedną" a ja siedziałem na telefonie i nie słuchałem. lol

Dev powiedział tamtej nocy coś, czego nienawidziłem. oparty o lodówkę, piwo w ręku, bezczelny typ. "jeśli nie potrafisz wyjaśnić konceptu PM-owi w dwóch zdaniach, to nie rozumiesz go na potrzeby rozmowy." potem ten wariat kazał mi wyjaśnić Bayesian updating swojej dziewczynie Lenie. nauczycielce w przedszkolu. zero backgroundu statystycznego. siedziała tam, jadła mieszankę studencką i mrużyła na mnie oczy, kiedy ja nawijałem, i nie potrafiłem ubrać confidence intervals w normalne słowa.

cztery próby. CZTERY. byłem czerwony jak burak. przy trzeciej próbie prawie się poddałem, a ona dalej mrużyła oczy i jadła mieszankę studencką. przy czwartej skinęła głową i coś mi się odblokowało w mózgu. myślę o tej minie Leny za każdym razem, kiedy ktoś każe mi wyjaśnić p-values bez użycia słowa prawdopodobieństwo, albo kiedy używasz t-testu vs chi-squared, albo przeprowadź mnie przez matematykę wielkości próbki dla testu A/B.

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

pytania, które pojawiają się w każdej pętli DS, o jakiej słyszałem od kogokolwiek. te same pięć konceptów w koszulkach z innymi logotypami firm. podręcznik za sto czterdzieści dolców nauczył mnie mniej niż pani od mieszanki studenckiej

Meta phone screen dla DS za to, końcówka 2025, Dev przez to przeszedł. prawie w całości SQL, i to trudny SQL. window functions. CTEs. self-joins. date math. jego pytanie brzmiało: znajdź użytkowników z tabeli logowań, których częstotliwość logowań spadła miesiąc do miesiąca o ponad pięćdziesiąt procent przez trzy kolejne miesiące. LAG, window functions, grupowanie po datach, dwadzieścia minut, wspólny edytor, jedziesz.

dwie inne osoby, które znam, potwierdziły, że Meta DS tak właśnie wygląda. SQL to bramka, albo napiszesz to z marszu, albo screen się kończy. Google DS ma mniej kodowania niż SWE, ale chcą prawdziwego Pythona, konkretnie Pandas, dają ci brudne dane, każą je wyczyścić, policzyć metryki, a potem interviewer mruży na ciebie oczy i mówi "co nam to mówi." lol.

ludzie piszą działający kod, a potem nie potrafią powiedzieć po ludzku, co właściwie oznacza ich własny output. martwa cisza. byłem tą osobą. gapiącą się na dataframe. zapominającą, jak działają liczby

Dev oglądał, jak robię mock Google round przez FaceTime, i wyciszył się, żebym nie słyszał, jak się ze mnie śmieje. napisał mi potem "stary, napisałeś poprawne pandas, a potem nie powiedziałeś nic przez czterdzieści sekund." te czterdzieści sekund to ta sama cisza, która zabija cię też w rundach ML, szczerze mówiąc. oni nie będą cię prosić o wyprowadzenie backpropagation. Dev dostał na Amazon pytanie "kiedy wybrałbyś gradient boosting zamiast random forest" a ja dostałem "niezbalansowane klasy, co robisz" na mocku z nim przy tym samym kuchennym blacie, z tym samym tłustym pad thai na blacie, bo on nigdy nie sprząta, i znowu się zaciąłem.

wyliczył SMOTE i class weights i threshold tuning i precision-recall zamiast accuracy i biznesowe uzasadnienie, dlaczego false positives kosztują inaczej niż false negatives, i siedział tam patrząc na mnie jak Lena z mieszanką studencką. pięć rzeczy. ja miałem dwie. dwa z pięciu brzmi jakbyś przeczytał jeden wpis na blogu. musisz mieć wszystkie pięć i musisz umieć je połączyć, i to właśnie przechodzi dalej.

Amazon ML deep-dive round to było miejsce, gdzie Dev prawie umarł, wybierasz jeden projekt z CV i cisną cię z niego przez trzydzieści minut. jaki model. dlaczego. jakie feature'y. ewaluacja. co byś zmienił. ten interviewer spędził PIĘTNAŚCIE minut na feature engineeringu dla systemu rekomendacji, który Dev zbudował w Spotify. piętnaście. na jednym projekcie. przygotowywałem go, przepytując go z tego projektu przez godzinę przy jego kuchennym blacie, i w dwudziestej minucie już potykał się o decyzje, które podjął osiem miesięcy wcześniej.

tej nocy przepisał wszystkie swoje notatki. wszystkie. Google idzie bardziej w teorię, bias-variance tradeoff, złożoność modelu, regularyzacja. "ok ale DLACZEGO L1 daje rzadkie wagi." mówisz o obszarze ograniczeń w kształcie rombu, a followup brzmi, co to znaczy geometrycznie i dlaczego ma znaczenie dla selekcji cech na produkcji. Lena zmrużyłaby oczy tak mocno przy tym pytaniu lol. intuicja ponad dowody, zawsze

case studies to było miejsce, gdzie Dev naprawdę mi zaimponował. "metryki spadły o dwanaście procent w zeszłym tygodniu, co się stało." budujesz dochodzenie na żywo, podczas gdy interviewer gra PM-a, który daje ci mgliste odpowiedzi na wszystko. jego Meta case study brzmiało "Instagram Reels daily active users spadli o osiem procent w Brazylii, przeprowadź mnie przez to." pięć minut pytań doprecyzowujących, zanim zaproponował choć jedną rzecz.

wszyscy użytkownicy czy segment. timing aktualizacji aplikacji. wzorce sezonowe konkretnie w Brazylii. te pięć minut doprecyzowania zaimponowało interviewerowi bardziej niż framework analizy, który przyszedł później. ja pewnie od razu rzuciłbym się w hipotezy i dostałbym za to ding. dokładnie ten sam problem, co czterdzieści sekund martwej ciszy nad pandas lol. mój mózg chce odpowiedzieć, zanim chce zapytać. rundy behavioral używają metody STAR, "opowiedz mi o sytuacji, gdy twoja analiza zmieniła decyzję biznesową." konkretna analiza, jaki stakeholder, jaka decyzja się zmieniła, mierzalny wynik.

"zrobiłem jakąś analizę i pomogła" to odpowiedź no-hire. take-homes niektóre firmy wciąż robią, dataset, prompt, czterdzieści osiem do siedemdziesięciu dwóch godzin, wysyłasz notebook. Dev raz przejrzał take-home znajomej. model XGBoost dostrojony perfekcyjnie, zero wyjaśnienia, dlaczego jakikolwiek wybór we feature engineeringu został podjęty. ani jednego zdania o tym, czemu wybrała te cechy. nie przeszła dalej. Dev spojrzał na to i powiedział "to jest zrzut z kaggle, a nie memo." pisz to tak, jakbyś przekonywał VP-a do wydania pieniędzy.

każda osoba, z którą rozmawiałem i która dostała ofertę, pisała to właśnie w ten sposób. czy dałoby się prześlizgnąć z czystym notebookiem w stylu kaggle? może. ale po tym, jak widziałem odrzucone to zgłoszenie, nie stawiałbym na to

formaty w firmach, jeśli ich chcesz, bo Dev mnie też z tego przepytywał lol. Meta DS to SQL phone screen, a potem onsite z product sense plus case study plus technical deep-dive plus behavioral, przy czym product sense to ten Meta-specyficzny element, w którym rozumujesz o metrykach dla ich aplikacji, i to właśnie ta runda według Deva najbardziej przypominała grillowanie przez PM-a, który cię nienawidzi.

Google DS to phone screen z kodowaniem i statystyką, a potem onsite z kodowaniem i konceptami ML i case study i rundą Googleyness, czyli ich wersją "czy jesteś osobą, z którą chcemy chodzić na lunch." Amazon DS zaczyna się od OA z SQL i podstaw statystyki, a potem jest virtual loop z kodowaniem, ML deep-dive o twojej wcześniejszej pracy, case study, behavioral z leadership principles i jeśli nie wykułeś czternastu leadership principles, to powodzenia.

pętle DS mieszają kodowanie i gadanie, dlatego tak rozwalają ludzi. rundy SQL i Python przypominają coding interviews, gdzie pomoc na żywo wyłapuje luki składniowe albo przypomina ci window function, która wypadła ci z głowy (mi wyleciał LAG podczas screena do Meta, ze wszystkich rzeczy lol). rundy ze statystyki i case study są bardziej konwersacyjne, lekkie popchnięcie przy jakimś kroku frameworka powstrzymuje cię przed odlotem w spiralę

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

używałem InterviewMan podczas drugiego cyklu. runda SQL, wyłapał, że piszę correlated subquery tam, gdzie cleaner byłaby window function. ja ZNAM window functions. presja sprawiła, że sięgnąłem po cokolwiek, czego nauczyłem się najpierw, czyli najgłupszy rodzaj błędu. w rundzie case study podsunął mi rozważ sezonowość, zmiany w produkcie, problemy z pipeline danych, kiedy dostałem pytanie o spadek metryk, praktycznie to samo co z Brazylią i Reels, które dostał Dev, tylko dla firmy płatniczej.

dokładnie to, co Dev wbijał mi do głowy przy tym kuchennym blacie nad pad thai. nerwy wyczyściły to wszystko do zera. mocki z tym narzędziem szczerze nauczyły mnie więcej niż live rounds, bo widziałem dokładnie, gdzie moje wyjaśnienia zamieniały się w machanie rękami, i nie było presji, więc mogłem to naprawdę poprawić. dwanaście dolców miesięcznie, bez limitów sesji, więc po wydaniu dwóch lat na magisterkę i po tym, jak rozjechała mnie pani od mieszanki studenckiej, nie miałem zamiaru na tym oszczędzać lol.

w którymś momencie naprawdę zacząłem czekać na mock sessions, co nigdy wcześniej w życiu mi się nie zdarzyło. najpierw rozejrzałem się za czymś innym, ale wszystko było tylko do kodowania albo tylko do statystyki, nic nie obejmowało całej pętli DS. statystyka i case study i behavioral i SQL w jednym narzędziu. wszystko inne było połową narzędzia

a oto mój najgłupszy ruch. uczyłem się SQL przez tydzień. statystyki w następnym tygodniu. ML po tym. osobne małe wiaderka, jakby to były osobne przedmioty. wszedłem na onsite i rzucili we mnie tym wszystkim w jedno popołudnie, cztery godziny, wszystko naraz, dokładnie jak tamten fintechowy VP, który chciał matematyki testów A/B po trzech rundach wszystkiego innego. Dev mówił mi, że tak będzie, w barze, przy swoim kuchennym blacie, pewnie też w jakimś SMS-ie, którego zignorowałem, jedząc pad thai.

dziewięć piw. wiszę mu dziewięć piw i pewnie jestem też winien Lenie przeprosiny za zmasakrowanie Bayesian updating w jej kuchni, kiedy próbowała sobie spokojnie zjeść mieszankę studencką. dalej mruży na mnie oczy, kiedy przychodzę lol

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

Get Started Free View Pricing

ShareTwitter LinkedIn

Guides

Pytania na rozmowe Data Science 2026: SQL, ML i case studies

Ready to Ace Your Next Interview?

Related Articles

Pytania na rozmowe Product Manager 2026: jak przygotowac sie do rozmow PM

Rozmowa kwalifikacyjna inzyniera oprogramowania Uber: czego sie spodziewac w 2026

Oszustwa deepfake na rozmowach rosna: jak sie chronic