שאלות ראיון מדעני נתונים 2026: SQL, ML ומקרי בוחן

אוקיי, אז השיש במטבח של Dev. אחת עשרה בלילה. יום שלישי. פאד תאי שמטפטף שומן על השיש, מהמקום ההוא ברחוב Mission, יותר מדי מפיות כרגיל. Dev אומר, "תסבירי Type I לעומת Type II errors בהקשר של מבחן A/B." כלום. הפה שלי נפתח ושום דבר לא יוצא. עשיתי תואר שני שלם בסטטיסטיקה. שנתיים של כל החומר הזה. ואני עומדת במטבח שלו ולא מצליחה להוציא אפילו משפט אחד על Type I errors lol.

נוסחאות, בטח. מילים פשוטות, לא. Dev נשען לאחור וחיכה. שלוש שניות שהרגישו כמו שנה. הרגע ההוא על השיש במטבח הוא הסיבה שאני כותבת את זה, כי שבועיים אחר כך VP of product בחברת פינטק שאל אותי בדיוק את אותו סוג שאלה בסיבוב השלישי של onsite, והמוח שלי עשה בדיוק את אותו דבר. ארבע שעות לתוך היום. SQL window functions בסיבוב הראשון.

צלייה ב-stats בסיבוב השני. pitch על churn prediction בסיבוב השלישי. ואז הבחור הזה רוצה שאני אצדיק sample sizes למבחן A/B ואין לי כלום. התואר השני שלי לא הציל אותי. Dev הזהיר אותי. הוא data scientist ב-Spotify, כבר שלוש שנים שם, ואני חייבת לו בשלב הזה תשע בירות. פעם אחת הוא אמר לי בבר, "DS interviews הם ארבעה ראיונות שמתחפשים לאחד," ואני הייתי בטלפון ולא הקשבתי. lol

Dev אמר באותו ערב משהו ששנאתי. נשען על המקרר שלו, בירה ביד, עם כל החוצפה בעולם. "אם את לא יכולה להסביר קונספט ל-PM בשני משפטים, את לא באמת מבינה אותו בשביל הראיון." ואז המשוגע הזה הכריח אותי להסביר Bayesian updating לחברה שלו Lena. גננת. אפס רקע בסטטיסטיקה. היא ישבה שם, אכלה תערובת אגוזים וצמצמה אליי עיניים בזמן שאני מברברת, ולא הצלחתי לתרגם confidence intervals למילים נורמליות.

ארבעה ניסיונות. ארבעה. הייתי אדומה לגמרי. בניסיון השלישי כמעט ויתרתי, והיא עדיין ישבה שם, מצמצמת עיניים ואוכלת תערובת אגוזים. בניסיון הרביעי היא הנהנה, ומשהו נפתח לי במוח. אני חושבת על מבט הצמצום של Lena בכל פעם שמישהו מבקש ממני להסביר p-values בלי להשתמש במילה probability, או מתי משתמשים ב-t-test לעומת chi-squared, או תעבירי אותי דרך המתמטיקה של sample size במבחן A/B.

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

אלה השאלות שמופיעות בכל DS loop ששמעתי עליו ממי שרק תרצי. אותם חמישה רעיונות, רק עם לוגו אחר של חברה. ספר לימוד במאה וארבעים דולר לימד אותי פחות מגברת התערובת אגוזים.

אבל ה-phone screen של Meta ל-DS, בסוף 2025, Dev עבר אותו. כמעט כולו SQL, SQL קשה. window functions. CTEs. self-joins. date math. השאלה שלו הייתה למצוא משתמשים מטבלת logins שתדירות ההתחברות שלהם ירדה ביותר מחמישים אחוז month over month במשך שלושה חודשים רצופים. LAG, window functions, קיבוץ לפי תאריכים, עשרים דקות, עורך משותף, צאי לדרך. עוד שני אנשים שאני מכירה אישרו לי ש-Meta DS באמת נראית ככה.

SQL הוא שער הכניסה, תכתבי אותו מהראש או שהסינון נגמר. הקידוד של Google DS קל יותר מ-SWE, אבל הם רוצים Python אמיתי, Pandas ספציפית, נותנים לך דאטה מבולגן, תנקי אותו, תחשבי metrics, ואז המראיין מצמצם אלייך עיניים ואומר, "מה זה אומר לנו." lol. אנשים כותבים קוד עובד ואז לא מצליחים להגיד במילים פשוטות מה בעצם אומר הפלט שלהם. שקט מת. אני הייתי הבן אדם הזה. בוהה ב-dataframe. שוכחת איך מספרים עובדים.

Dev ראה אותי עושה mock round של Google ב-FaceTime והשתיק את עצמו כדי שאני לא אשמע אותו צוחק. אחר כך הוא שלח לי הודעה: "bro כתבת pandas נכון ואז לא אמרת כלום במשך ארבעים שניות." ארבעים השניות האלה הן בדיוק השתיקה שהורגת אותך גם בסבבי ML, אם להיות כנה. הם לא הולכים לבקש ממך לגזור backpropagation. Dev קיבל ב-Amazon את "מתי היית בוחרת gradient boosting על פני random forest" ואני קיבלתי "יש לך imbalanced classes, מה את עושה" ב-mock שעשיתי איתו על אותו שיש במטבח, עם אותו שומן של פאד תאי על השיש כי הוא בחיים לא מנקה, ושוב קפאתי.

הוא זרק SMOTE ו-class weights ו-threshold tuning ו-precision-recall במקום accuracy ואת ההיגיון העסקי של למה false positives עולים אחרת מ-false negatives, וישב שם והסתכל עליי כמו Lena עם התערובת אגוזים. חמישה דברים. לי היו שניים. שניים מתוך חמישה נשמעים כאילו קראת פוסט אחד בבלוג. את צריכה את כל החמישה, ואת צריכה לחבר ביניהם, וזה מה שמעביר. סבב ה-ML deep-dive של Amazon הוא המקום שבו Dev כמעט מת, אבל.

בוחרים פרויקט אחד מהרזומה שלך והם קודחים עליו שלושים דקות. איזה מודל. למה. איזה features. evaluation. מה היית משנה. המראיין הזה בילה חמש עשרה דקות על feature engineering במערכת המלצות ש-Dev בנה ב-Spotify. חמש עשרה. על פרויקט אחד. אני הכנתי אותו לזה בזה שחקרתי אותו על הפרויקט הזה שעה על השיש במטבח שלו, ובדקה העשרים הוא כבר התחיל להתבלבל לגבי החלטות שקיבל שמונה חודשים קודם.

הוא כתב מחדש את כל ההערות שלו באותו לילה. את כולן. Google הולכת יותר לכיוון התיאורטי, bias-variance tradeoff, model complexity, regularization. "אוקיי, אבל למה L1 מייצר sparse weights." את אומרת diamond constraint region, והשאלה הבאה היא מה זה אומר גיאומטרית ולמה זה חשוב ל-feature selection בפרודקשן. Lena הייתה מצמצמת עיניים כל כך חזק על השאלה הזאת lol. תמיד אינטואיציה לפני הוכחות.

case studies זה המקום שבו Dev באמת הרשים אותי, אם להיות כנה. "metrics ירדו בשנים עשר אחוז בשבוע שעבר, מה קרה." את בונה חקירה בלייב בזמן שהמראיין משחק PM שנותן לך תשובות מעורפלות על הכול. ה-case study של Meta שלו היה, "Instagram Reels daily active users ירדו בשמונה אחוז בברזיל, תעבירי אותי דרך זה." חמש דקות של שאלות הבהרה לפני שהוא הציע אפילו כיוון אחד.

כל המשתמשים או רק סגמנט מסוים. מתי יצא עדכון אפליקציה. האם יש seasonal patterns ספציפיים לברזיל. חמש הדקות האלה של הבהרות הרשימו את המראיין שלו יותר ממסגרת הניתוח שבאה אחר כך. אני הייתי קופצת ישר להיפותזות וכנראה נופלת על זה. בדיוק אותה בעיה כמו ארבעים השניות של דממת pandas lol. המוח שלי רוצה לענות לפני שהוא רוצה לשאול. בסבבי behavioral משתמשים ב-שיטת STAR, "ספרי לי על פעם שבה הניתוח שלך שינה החלטה עסקית." איזה ניתוח בדיוק, איזה stakeholder, איזו החלטה השתנתה, ומה הייתה התוצאה המדידה.

"עשיתי איזה ניתוח וזה עזר" זאת תשובת no-hire. יש חברות שעדיין עושות take-homes, dataset, prompt, ארבעים ושמונה עד שבעים ושתיים שעות, מגישים notebook. Dev פעם עבר על take-home של חברה של חבר. מודל XGBoost מכויל מושלם, אפס הסבר למה בכלל נעשתה בחירת feature engineering כלשהי. אפילו לא משפט אחד על למה היא בחרה את ה-features האלה. היא לא התקדמה. Dev הסתכל על זה ואמר, "זה dump של Kaggle, לא memo." תכתבי את זה כאילו את מנסה לשכנע VP להוציא כסף.

כל מי שדיברתי איתו וקיבל offer כתב את זה ככה. אפשר אולי להחליק עם notebook נקי בסגנון Kaggle? אולי. אבל אני לא הייתי מהמרת על זה אחרי שראיתי את ההגשה ההיא נדחית.

פורמטי חברות, אם זה מעניין אותך, כי Dev גם בחן אותי על זה lol. Meta DS זה SQL phone screen ואז onsite עם product sense ועוד case study ועוד technical deep-dive ועוד behavioral, כש-product sense הוא הסיבוב הספציפי של Meta שבו את חושבת דרך metrics של האפליקציות שלהם, וזה הסיבוב ש-Dev אמר שהרגיש הכי דומה לזה ש-PM ששונא אותך חוקר אותך.

Google DS זה phone screen עם coding ו-stats ואז onsite עם coding ו-ML concepts ו-case study וסבב Googleyness, שהוא הגרסה שלהם ל-"האם את בן אדם שאנחנו רוצים לאכול איתו צהריים." Amazon DS מתחיל עם OA על SQL ו-basic stats ואז virtual loop עם coding, ML deep-dive על עבודות עבר, case study, behavioral עם עקרונות המנהיגות, ואם לא שיננת ארבעה עשר leadership principles, בהצלחה.

DS loops מערבבים קוד ודיבור, וזאת הסיבה שהם שוברים אנשים. סבבי SQL ו-Python מרגישים כמו ראיונות קוד, שבהם עזרה חיה תופסת לך syntax blanks או מזכירה לך window function שהמוח שלך השמיט (לי נפל LAG באמצע המסך של Meta, מכל הדברים lol). סבבי stats ו-case study הם יותר שיחתיים, ודחיפה קטנה בשלב אחד של framework שומרת עלייך מלצלול לסחרור.

השתמשתי ב-InterviewMan במהלך הסבב השני שלי. בסבב SQL הוא סימן לי שאני כותבת correlated subquery כש-window function היה נקי יותר. אני יודעת window functions. הלחץ פשוט גרם לי להישען על מה שלמדתי ראשון, שזה הסוג הכי מטומטם של טעות. בסבב case study הוא העלה לי "תשקלי seasonality, שינויים במוצר, בעיות ב-data pipeline" כשקיבלתי שאלה על ירידה ב-metrics, בעצם אותה סיטואציה של Brazil Reels ש-Dev קיבל אבל אצל חברת תשלומים.

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

בדיוק מה ש-Dev קדח לי לראש על השיש במטבח מעל פאד תאי. העצבים מחקו הכול. ה-mocks איתו בכנות לימדו אותי יותר מהסבבים האמיתיים, כי ראיתי בדיוק איפה ההסברים שלי הופכים ל-hand-waving, ולא היה לחץ אז באמת יכולתי לתקן. שנים עשר דולר בחודש, בלי caps על sessions, ואחרי שבזבזתי שנתיים על תואר שני וקיבלתי השפלה מגברת התערובת אגוזים, לא התכוונתי להיות קמצנית על זה lol.

בשלב מסוים אפילו התחלתי לחכות למפגשי mock, וזה לא קרה לי מעולם בחיים. חיפשתי קודם משהו אחר, אבל הכול היה coding-only או stats-only, שום דבר שלא נגע בכל ה-DS loop. stats ו-case study ו-behavioral ו-SQL בכלי אחד. כל השאר היו חצי כלי.

הנה המהלך הכי מטומטם שלי. למדתי SQL שבוע אחד. stats בשבוע שאחריו. ML אחר כך. דליים קטנים ונפרדים כאילו אלה מקצועות שונים. הגעתי ל-onsite וזרקו עליי את כל זה באותו אחר צהריים, ארבע שעות, הכול בבת אחת, בדיוק כמו אותו fintech VP שרצה מתמטיקה של A/B test אחרי שלושה סבבים של כל דבר אחר. Dev אמר לי שזה מה שיקרה, בבר, על השיש במטבח שלו, וכנראה גם בהודעה שהתעלמתי ממנה בזמן שאכלתי פאד תאי.

תשע בירות. אני חייבת לו תשע בירות, וכנראה גם חייבת ל-Lena התנצלות על זה שרצחתי לה את Bayesian updating במטבח שלה בזמן שהיא רק ניסתה לאכול תערובת אגוזים. היא עדיין מצמצמת אליי עיניים כשאני באה לשם lol.

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

Get Started Free View Pricing

ShareTwitter LinkedIn

Guides

שאלות ראיון מדעני נתונים 2026: SQL, ML ומקרי בוחן

Ready to Ace Your Next Interview?

Related Articles

שאלות ראיון עיצוב מוצר 2026: ביקורות, לוח לבן ותיק עבודות

שאלות ראיון מנהל מוצר 2026: איך להתכונן לראיונות PM

שאלות ראיון מכירות 2026: משיחות קרות לסגירת עסקאות