Soalan Temu Duga Sains Data 2026: SQL, ML, dan Kajian Kes

jadi begini, kaunter dapur Dev. 11 malam. hari Selasa. pad thai menitik minyak atas kaunter, dari tempat tu di mission street, tisu bersepah macam biasa. Dev cakap "terangkan ralat Jenis I vs Jenis II dalam konteks ujian A/B." kosong. mulut aku terbuka dan tak ada apa keluar. aku dah habiskan satu master dalam statistik. dua tahun dengan benda ni. dan aku berdiri dalam dapur dia tak mampu sebut walau satu ayat pasal ralat Jenis I lol.

formula, boleh. nak terangkan dengan perkataan biasa, tak boleh. Dev bersandar dan tunggu. tiga saat yang rasa macam setahun. momen atas kaunter dapur tu lah sebabnya aku tulis benda ni, sebab dua minggu kemudian seorang VP produk di syarikat fintech tanya aku soalan jenis yang sama dalam pusingan ketiga temuduga onsite dan otak aku buat benda yang sama tepat-tepat. empat jam dah berlalu.

pusingan satu SQL window functions. pusingan dua kena soal statistik bertubi-tubi. pusingan tiga bentang ramalan churn. lepas tu lelaki ni nak aku justifikasikan saiz sampel untuk ujian A/B dan aku tak ada apa-apa. master aku langsung tak selamatkan aku. Dev dah bagi amaran. dia saintis data di Spotify, dah tiga tahun kat sana, setakat ni aku hutang dia sembilan botol bir.

dia pernah cakap kat bar "temuduga DS ni sebenarnya empat temuduga yang menyamar jadi satu" dan aku masa tu sibuk dengan telefon tak dengar pun. lol

Dev cakap sesuatu malam tu yang aku memang menyampah nak dengar. bersandar pada peti ais dia, bir di tangan, yakin bukan main. "kalau kau tak boleh terangkan sesuatu konsep kepada PM dalam dua ayat, maknanya kau tak faham konsep tu untuk temuduga." lepas tu orang gila ni suruh aku terangkan Bayesian updating kepada teman wanita dia, Lena. cikgu tadika. langsung tak ada latar belakang statistik.

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

dia duduk situ makan trail mix sambil jeling sempit kat aku masa aku membebel, dan aku langsung tak boleh tukarkan confidence intervals kepada bahasa biasa. empat cubaan. EMPAT. muka aku memang dah merah padam. cubaan ketiga aku hampir nak mengalah dan dia masih lagi menjeling sempit sambil makan trail mix. cubaan keempat dia angguk dan ada sesuatu terbuka dalam otak aku.

aku akan teringat muka Lena yang menjeling tu setiap kali orang suruh aku terangkan p-values tanpa guna perkataan probability, atau bila nak guna t-test vs chi-squared, atau jelaskan matematik saiz sampel ujian A/B. soalan-soalan yang muncul dalam hampir setiap loop DS yang aku pernah dengar daripada sesiapa pun. lima konsep yang sama, cuma pakai logo syarikat berbeza. buku teks seratus empat puluh dolar ajar aku kurang daripada perempuan makan trail mix tu

Meta punya DS phone screen pula, hujung 2025, Dev dah lalui. hampir semuanya SQL, SQL yang susah. window functions. CTEs. self-joins. matematik tarikh. soalan dia ialah cari pengguna daripada jadual logins yang kekerapan log masuk mereka jatuh lebih daripada lima puluh peratus bulan ke bulan selama tiga bulan berturut-turut. LAG, window functions, pengelompokan tarikh, dua puluh minit, editor kongsi, jalan.

dua lagi orang yang aku kenal sahkan Meta DS memang macam tu. SQL ialah pintu masuk, tulis terus tanpa bantuan atau phone screen tamat. Google DS coding lebih ringan daripada SWE tapi mereka nak Python yang betul-betul jadi, khususnya Pandas, bagi kau data berselerak, bersihkan, kira metrik, kemudian penemuduga jeling kau dan tanya "apa yang ini beritahu kita." lol. orang tulis kod yang berjalan elok, lepas tu tak boleh terangkan dalam bahasa biasa apa maksud output sendiri. terus senyap. aku pernah jadi orang tu. tenung dataframe. lupa macam mana nombor berfungsi

Dev tengok aku buat mock round Google melalui FaceTime dan dia mute diri sendiri supaya aku tak dengar dia gelak. dia mesej aku lepas tu "bro kau tulis pandas yang betul lepas tu diam empat puluh saat." empat puluh saat tu lah senyap yang sama membunuh kau dalam pusingan ML sebenarnya. mereka bukan nak suruh kau terbitkan backpropagation. Dev dapat soalan "bila kau akan pilih gradient boosting berbanding random forest" di Amazon dan aku pula dapat "kelas tak seimbang, apa kau buat" dalam mock dengan dia di kaunter dapur yang sama, minyak pad thai yang sama atas kaunter sebab dia memang tak pernah bersih, dan aku beku lagi.

dia senaraikan terus SMOTE dan class weights dan threshold tuning dan precision-recall berbanding accuracy dan kes perniagaan kenapa false positives beri kos berbeza daripada false negatives, lepas tu duduk pandang aku macam Lena dengan trail mix dia. lima benda. aku ada dua. dua daripada lima bunyinya macam kau cuma baca satu blog post. kau perlukan kelima-lima dan kau kena sambungkan semuanya, dan itulah yang membolehkan kau lepas.

pusingan ML deep-dive Amazon pula tempat Dev hampir mati, kau pilih satu projek daripada resume kau dan mereka korek kau selama tiga puluh minit. model apa. kenapa. ciri apa. penilaian. apa yang kau akan ubah. penemuduga ni habiskan LIMA BELAS minit pada feature engineering untuk sistem cadangan yang Dev bina di Spotify. lima belas. untuk satu projek. aku bantu dia buat persediaan dengan menyoal siasat dia tentang projek tu selama sejam di kaunter dapur dia dan masuk minit kedua puluh dia dah mula tersangkut pada keputusan yang dia buat lapan bulan sebelum tu.

malam tu juga dia tulis semula semua nota dia. semuanya. Google pula pergi arah teori, bias-variance tradeoff, kerumitan model, regularization. "ok tapi KENAPA L1 menghasilkan weights yang jarang." kau jawab kawasan kekangan berbentuk berlian dan soalan susulan ialah apa maksudnya dari segi geometri dan kenapa ia penting untuk feature selection dalam prod. Lena mesti jeling sempit gila untuk yang itu lol. intuisi sentiasa lebih penting daripada bukti formal

case study memang tempat Dev paling buat aku kagum sejujurnya. "metrik turun dua belas peratus minggu lepas, apa jadi." kau bina siasatan secara langsung sementara penemuduga berlakon jadi PM yang bagi jawapan samar untuk semua benda. case study Meta dia ialah "pengguna aktif harian Instagram Reels turun lapan peratus di Brazil, jelaskan macam mana kau akan siasat." lima minit tanya soalan penjelasan sebelum dia cadangkan walau satu benda pun.

semua pengguna atau segmen tertentu. masa kemas kini app. corak bermusim khusus di Brazil. lima minit penjelasan tu lebih mengagumkan penemuduga dia daripada rangka analisis yang datang selepas itu. aku mungkin terus terjah hipotesis dan kena reject sebab tu agaknya. masalah yang sama juga macam empat puluh saat senyap mati depan pandas tadi lol. otak aku nak jawab dulu sebelum dia nak bertanya.

pusingan behavioral guna kaedah STAR method, "ceritakan tentang satu masa bila analisis kau mengubah keputusan perniagaan." analisis apa tepatnya, stakeholder mana, keputusan apa yang berubah, hasil yang boleh diukur. "buat beberapa analisis dan ia membantu" ialah jawapan no-hire. take-home masih ada syarikat yang buat, dataset, prompt, empat puluh lapan hingga tujuh puluh dua jam, hantar notebook. Dev pernah semak take-home seorang kawannya.

model XGBoost ditala dengan sempurna, sifar penerangan kenapa apa-apa pilihan feature engineering dibuat. tak ada walau satu ayat kenapa dia pilih features tu. dia tak mara ke peringkat seterusnya. Dev tengok dan cakap "ini longgokan kaggle, bukan memo." tulis macam kau sedang meyakinkan seorang VP untuk belanjakan duit. setiap orang yang aku cakap dengan yang dapat tawaran tulis macam tu. boleh ke kau lepas dengan notebook gaya kaggle yang kemas? mungkin. tapi aku takkan pertaruhkan benda tu lepas tengok penyerahan itu ditolak

format syarikat kalau kau nak, sebab Dev tanya aku pasal benda ni juga lol. Meta DS ada saringan telefon SQL kemudian onsite dengan product sense serta kajian kes serta technical deep-dive serta behavioral, product sense tu yang khusus untuk Meta di mana kau fikirkan tentang metrik untuk aplikasi mereka dan itulah pusingan yang Dev kata paling terasa macam kena grill dengan PM yang benci kau.

Google DS ialah saringan telefon dengan coding dan stats kemudian onsite dengan coding dan konsep ML dan kajian kes dan pusingan Googleyness yang merupakan versi mereka untuk "adakah kau orang yang kami nak makan tengah hari bersama." Amazon DS bermula dengan OA untuk SQL dan stats asas kemudian virtual loop dengan coding, ML deep-dive pada kerja lepas, kajian kes, behavioral dengan leadership principles dan kalau kau tak hafal empat belas leadership principles, semoga berjaya.

DS loop campur coding dan bercakap, sebab itulah ia buat ramai orang tersangkut. Pusingan SQL dan Python terasa macam coding interviews di mana bantuan secara langsung dapat tangkap kekosongan sintaks atau ingatkan kau tentang window function yang otak kau tertinggal (aku tertinggal LAG masa saringan Meta aku, daripada semua benda lol). pusingan stats dan kajian kes lebih bersifat perbualan, sedikit dorongan pada langkah framework boleh elakkan kau daripada terus panik

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

aku guna InterviewMan semasa kitaran kedua aku. pusingan SQL, ia tandakan aku menulis correlated subquery bila window function akan lebih kemas. aku TAHU window function. tekanan buat aku capai apa saja yang aku belajar dulu, yang memang jenis kesilapan paling bodoh. pusingan kajian kes, ia munculkan pertimbangkan seasonality, perubahan produk, isu data pipeline bila aku dapat soalan penurunan metrik, pada asasnya benda yang sama macam kes Brazil Reels yang Dev dapat tapi untuk syarikat pembayaran.

memang tepat macam yang Dev ulang kaji dengan aku di kaunter dapur sambil makan pad thai. gementar habis padam semua benda tu. mock dengannya memang jujurnya ajar aku lebih banyak daripada pusingan sebenar sebab aku nampak tepat di mana penjelasan aku bertukar jadi cakap kosong dan tak ada tekanan jadi aku betul-betul boleh baikinya. dua belas dolar sebulan, tiada had sesi, yang lepas habiskan dua tahun buat sarjana dan kena hancurkan oleh perempuan trail mix tu, memang aku takkan berkira pasal ni lol.

sampai satu tahap aku mula nantikan sesi mock, yang tak pernah berlaku dalam hidup aku. mula-mula aku cari benda lain dulu tapi semuanya coding-only atau stats-only, tak ada yang betul-betul cover seluruh DS loop. stats dan kajian kes dan behavioral dan SQL dalam satu alat. yang lain semua macam alat separuh masak

ini langkah paling bodoh aku. aku belajar SQL seminggu. stats minggu berikutnya. ML selepas itu. baldi-baldi kecil berasingan macam semuanya subjek berbeza. aku masuk onsite dan mereka campak semua itu kepada aku dalam satu petang, empat jam, semuanya sekali gus, sama macam VP fintech tu yang mahukan matematik A/B test selepas tiga pusingan benda lain. Dev dah beritahu aku itu akan jadi, di bar, di kaunter dapurnya, mungkin juga dalam mesej yang aku abaikan sambil makan pad thai.

sembilan bir. aku berhutang dia sembilan bir dan mungkin juga berhutang Lena satu permohonan maaf sebab membantai Bayesian updating di dapurnya masa dia cuba makan trail mix. dia masih jeling aku bila aku datang lol

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

Get Started Free View Pricing

ShareTwitter LinkedIn

Guides

Soalan Temu Duga Sains Data 2026: SQL, ML, dan Kajian Kes

Ready to Ace Your Next Interview?

Related Articles

Soalan Temu Duga Reka Bentuk Produk 2026: Kritikan, Whiteboard, dan Portfolio

Soalan Temu Duga Pengurus Produk 2026: Cara Bersedia untuk Temu Duga PM

Temu Duga Jurutera Perisian Uber: Apa yang Dijangka pada 2026