Pertanyaan Wawancara Data Science 2026: SQL, ML, dan Studi Kasus

oke jadi meja dapur Dev. jam 11 malam. hari selasa. pad thai meneteskan minyak ke meja, dari tempat di mission street itu, tisu terlalu banyak seperti biasa. Dev bilang "jelaskan Type I vs Type II errors dalam konteks A/B test." kosong. mulutku kebuka dan nggak ada yang keluar. aku mengambil satu master penuh di statistik. dua tahun hidup dengan hal-hal beginian. dan aku berdiri di dapurnya nggak bisa mengucapkan satu kalimat pun tentang Type I errors lol. rumus, bisa. kata-kata bahasa inggris, nope. Dev duduk santai dan menunggu. tiga detik yang rasanya setahun. momen di meja dapur itu adalah alasan aku menulis ini, karena dua minggu kemudian seorang VP of product di perusahaan fintech menanyakan pertanyaan sejenis di round tiga sebuah onsite dan otakku melakukan hal yang sama persis. empat jam sudah berlalu. SQL window functions round satu. stats grilling round dua. churn prediction pitch round tiga. lalu pria ini ingin aku membenarkan sample sizes untuk sebuah A/B test dan aku nggak punya apa-apa. gelar masterku nggak menyelamatkanku. Dev sudah memperingatkanku. dia data scientist di Spotify, sudah tiga tahun di sana, aku utang dia sembilan bir pada titik ini. dia pernah bilang padaku di bar "DS interviews itu empat interview yang pura-pura jadi satu" dan aku lagi lihat ponsel, nggak dengerin. lol

Dev mengatakan sesuatu malam itu yang aku benci. bersandar di kulkas, bir di tangan, beraninya. "kalau kamu nggak bisa menjelaskan konsep ke seorang PM dalam dua kalimat, berarti kamu nggak memahaminya untuk interview." lalu orang gila ini menyuruhku menjelaskan Bayesian updating ke pacarnya Lena. guru TK. nol latar belakang stats. dia duduk di sana makan trail mix dan menyipitiku sementara aku ngoceh dan nggak bisa membuat confidence intervals jadi kata-kata normal. empat percobaan. EMPAT. mukaku jelas merah. percobaan ketiga aku hampir menyerah dan dia masih tetap menyipit sambil makan trail mix. percobaan keempat dia mengangguk dan sesuatu terbuka di otakku. aku memikirkan wajah Lena yang menyipit setiap kali seseorang memintaku menjelaskan p-values tanpa memakai kata probability, atau kapan kamu pakai t-test vs chi-squared, atau jelaskan matematika sample size A/B test. pertanyaan-pertanyaan yang muncul di tiap DS loop yang pernah kudengar dari siapa pun. lima konsep yang sama pakai logo perusahaan berbeda. buku teks seratus empat puluh dolar ngajarin aku lebih sedikit daripada si perempuan trail mix

phone screen DS Meta sih, akhir 2025, Dev menjalani itu. hampir sepenuhnya SQL, SQL yang berat. window functions. CTEs. self-joins. date math. pertanyaannya adalah cari users dari tabel logins yang frekuensi loginnya turun lebih dari lima puluh persen month over month selama tiga bulan berturut-turut. LAG, window functions, pengelompokan tanggal, dua puluh menit, editor bersama, jalan. dua orang lain yang kukenal mengonfirmasi Meta DS memang seperti itu. SQL adalah gerbangnya, tulis dari kepala atau screen-nya selesai. coding Google DS lebih ringan daripada SWE tapi mereka ingin Python sungguhan, spesifiknya Pandas, mereka kasih data berantakan, bersihkan, hitung metrics, lalu interviewer menyipit ke arahmu dan bilang "ini memberi tahu kita apa." lol. orang menulis kode yang jalan lalu nggak bisa menjelaskan dalam bahasa biasa apa arti output mereka sendiri. dead air. aku pernah jadi orang itu. menatap dataframe. lupa cara kerja angka

Dev menonton aku melakukan mock round Google lewat FaceTime dan dia mute dirinya supaya aku nggak dengar dia ketawa. dia nge-text setelahnya "bro kamu nulis pandas yang benar lalu diam empat puluh detik." empat puluh detik itu adalah keheningan yang sama yang membunuhmu di ML rounds sebenarnya. mereka nggak akan menyuruhmu menurunkan backpropagation. Dev dapat pertanyaan "kapan kamu akan memilih gradient boosting dibanding random forest" di Amazon dan aku dapat "imbalanced classes what do you do" dalam mock dengannya di meja dapur yang sama, minyak pad thai yang sama di meja karena dia nggak pernah bersih-bersih, dan aku membeku lagi. dia menyebutkan SMOTE, class weights, threshold tuning, precision-recall di atas accuracy, dan business case kenapa false positives punya biaya berbeda dari false negatives, lalu duduk menatapku seperti Lena dengan trail mix-nya. lima hal. aku punya dua. dua dari lima terdengar seperti kamu cuma baca satu postingan blog. kamu butuh kelimanya dan kamu harus menghubungkannya, dan itulah yang membuatmu lolos. Amazon ML deep-dive round adalah tempat Dev hampir mati, kamu memilih satu proyek dari resume lalu mereka menguliti itu selama tiga puluh menit. model apa. kenapa. features apa. evaluation. apa yang akan kamu ubah. interviewer ini menghabiskan LIMA BELAS menit pada feature engineering untuk sebuah rec system yang Dev bangun di Spotify. lima belas. untuk satu proyek. aku mempersiapkannya dengan menginterogasinya tentang proyek itu selama satu jam di meja dapurnya dan di menit dua puluh dia mulai tersandung pada keputusan yang dia buat delapan bulan sebelumnya. aku menulis ulang semua catatannya malam itu. semuanya. Google malah jadi teoretis, bias-variance tradeoff, model complexity, regularization. "oke tapi KENAPA L1 menghasilkan sparse weights." kamu bilang diamond constraint region lalu follow-up-nya adalah apa arti itu secara geometris dan kenapa itu penting untuk feature selection di prod. Lena pasti bakal menyipit keras untuk yang itu lol. intuisi di atas pembuktian selalu

case studies adalah tempat Dev benar-benar membuatku terkesan jujur saja. "metrics turun dua belas persen minggu lalu, apa yang terjadi." kamu membangun investigasi secara live sementara interviewer berperan sebagai PM yang memberi jawaban samar untuk semuanya. case study Meta miliknya adalah "Instagram Reels daily active users turun delapan persen di Brazil, jelaskan alurnya." lima menit pertanyaan klarifikasi sebelum dia mengusulkan satu hal pun. semua users atau satu segmen. timing app update. pola musiman khusus Brazil. lima menit klarifikasi itu lebih mengesankan interviewer-nya daripada framework analisis yang datang setelahnya. aku pasti akan langsung lompat ke hipotesis dan mungkin diding karena itu. masalahnya persis sama dengan empat puluh detik keheningan pandas tadi lol. otakku ingin menjawab sebelum dia ingin bertanya. behavioral rounds pakai metode STAR, "ceritakan saat analisismu mengubah keputusan bisnis." analisis spesifik, stakeholder yang mana, keputusan apa yang berubah, hasil yang terukur. "melakukan beberapa analisis dan itu membantu" adalah jawaban no-hire. take-home masih dilakukan beberapa perusahaan, dataset, prompt, empat puluh delapan sampai tujuh puluh dua jam, kirim notebook. Dev pernah meninjau take-home milik teman. model XGBoost disetel sempurna, nol penjelasan kenapa pilihan feature engineering apa pun dibuat. bahkan tidak satu kalimat tentang kenapa dia memilih features itu. dia tidak lanjut. Dev melihatnya dan berkata "ini dump kaggle, bukan memo." tulis seperti kamu sedang meyakinkan VP untuk mengeluarkan uang. setiap orang yang kuajak bicara yang dapat offer menulisnya seperti itu. apakah kamu bisa lolos dengan notebook bergaya kaggle yang bersih? mungkin. tapi aku nggak akan bertaruh setelah melihat submission itu ditolak

format perusahaan kalau kamu mau, karena Dev juga mengujiku soal ini lol. Meta DS adalah SQL phone screen lalu onsite dengan product sense plus case study plus technical deep-dive plus behavioral, product sense itu yang khas Meta di mana kamu menalar metrics untuk aplikasi mereka dan itu round yang menurut Dev paling terasa seperti di-grill oleh PM yang membencimu. Google DS adalah phone screen dengan coding dan stats lalu onsite dengan coding dan konsep ML dan case study dan round Googleyness yang merupakan versi mereka dari "apakah kamu orang yang ingin kami ajak makan siang bersama." Amazon DS dimulai dengan OA untuk SQL dan stats dasar lalu virtual loop dengan coding, ML deep-dive untuk pekerjaan masa lalu, case study, behavioral dengan leadership principles, dan kalau kamu belum menghafal empat belas leadership principles ya semoga berhasil. DS loops mencampur coding dan ngobrol, itu sebabnya banyak orang hancur. round SQL dan Python terasa seperti coding interviews di mana bantuan live menangkap blank syntax atau mengingatkanmu pada window function yang hilang dari otakmu (otakku menjatuhkan LAG saat screen Meta-ku, dari semua hal lol). round stats dan case study lebih percakapan, dorongan kecil pada satu langkah framework mencegahmu spiral

aku menggunakan InterviewMan di siklus keduaku. SQL round, dia menandai aku sedang menulis correlated subquery padahal window function akan lebih rapi. aku TAHU window functions. tekanan membuatku meraih apa yang pertama kali kupelajari, yang merupakan jenis kesalahan paling bodoh. di case study round dia memunculkan consider seasonality, product changes, data pipeline issues saat aku mendapat pertanyaan metrics drop, pada dasarnya hal Brazil Reels yang sama seperti yang didapat Dev tapi untuk perusahaan payments. tepat yang dibor Dev ke kepalaku di meja dapur itu di atas pad thai. rasa gugup menyapu semuanya bersih. mock dengan tool itu jujur mengajariku lebih banyak daripada live rounds karena aku melihat persis di mana penjelasanku berubah jadi hand-waving dan nggak ada tekanan jadi aku benar-benar bisa memperbaikinya. dua belas dolar sebulan, nggak ada session caps, yang setelah menghabiskan dua tahun untuk gelar master dan tetap dihajar oleh perempuan trail mix, bukan sesuatu yang akan kuhemat lol. aku bahkan mulai menantikan mock sessions pada suatu titik, yang belum pernah terjadi seumur hidupku. aku sempat mencari hal lain dulu tapi semuanya hanya coding atau hanya stats, nggak ada yang menutup seluruh DS loop. stats dan case study dan behavioral dan SQL dalam satu tool. yang lain itu cuma setengah tool

ini langkah terbodohku. aku belajar SQL selama seminggu. stats minggu berikutnya. ML setelah itu. ember-ember kecil terpisah seolah itu semua mata pelajaran terpisah. lalu aku masuk onsite dan mereka melemparkan semuanya padaku dalam satu sore, empat jam, semuanya sekaligus, sama seperti VP fintech yang menginginkan matematika A/B test setelah tiga rounds dari segala hal lain. Dev sudah bilang itu akan terjadi, di bar, di meja dapurnya, mungkin dalam text yang kuabaikan sambil makan pad thai. sembilan bir. aku utang dia sembilan bir dan mungkin utang permintaan maaf pada Lena karena membantai Bayesian updating di dapurnya saat dia sedang mencoba makan trail mix. dia masih menyipitiku setiap kali aku datang lol

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

Get Started Free View Pricing

ShareTwitter LinkedIn

Guides

Pertanyaan Wawancara Data Science 2026: SQL, ML, dan Studi Kasus

Ready to Ace Your Next Interview?

Related Articles

Asisten Wawancara AI: Panduan Lengkap 2026

Wawancara Software Engineer Amazon: Apa yang Diharapkan + Alat AI

Cara Menggunakan ChatGPT untuk Wawancara (dan Alternatif Lebih Baik)