Leave a Review & Get 30% OFF - Limited Time Offer!

00:00:00
Guides

Data science interview questions 2026: SQL, ML aur case studies

Last updated: March 25, 2026|11 min read|By InterviewMan Team

ok तो देव का किचन काउंटर। रात्रि 11 बजे. मंगलवार। पैड थाई काउंटर पर ग्रीस लीक कर रहा था, मिशन स्ट्रीट पर वह जगह, हमेशा की तरह बहुत सारे नैपकिन। देव कहते हैं, "ए/बी परीक्षण संदर्भ में टाइप I बनाम टाइप II त्रुटियों की व्याख्या करें।" कुछ नहीं। मेरा मुँह खुलता है और कुछ भी नहीं निकलता। मैंने सांख्यिकी में मास्टर डिग्री हासिल की। इस सामान के दो साल. और मैं उसकी रसोई में खड़ी होकर टाइप I त्रुटियों के बारे में एक वाक्य भी कहने में असमर्थ हूँ, हाहाहा। सूत्र, निश्चित रूप से। अंग्रेजी शब्द, नहीं। देव वापस बैठ गया और इंतजार करने लगा। तीन सेकंड जो एक साल तक चले। वह रसोई काउंटर क्षण यही कारण है कि मैं यह लिख रहा हूं, क्योंकि दो सप्ताह बाद एक फिनटेक कंपनी में उत्पाद के उपाध्यक्ष ने मुझसे ऑनसाइट के तीसरे दौर में उसी तरह का प्रश्न पूछा और मेरे दिमाग ने ठीक वैसा ही किया। चार घंटे में। SQL विंडो एक दौर में काम करती है। दूसरे दौर के आँकड़े ग्रिलिंग। मंथन भविष्यवाणी पिच तीसरा दौर। फिर यह आदमी चाहता है कि मैं ए/बी परीक्षण के लिए नमूना आकार को उचित ठहराऊं और मेरे पास कुछ भी नहीं है। मेरे स्वामी ने मुझे नहीं बचाया। देव ने मुझे चेतावनी दी. वह Spotify में एक डेटा वैज्ञानिक है, वहां तीन साल से, इस समय मुझे उसकी नौ बियर देनी हैं। उन्होंने एक बार एक बार में मुझसे कहा था, "डीएस साक्षात्कार एक होने का दिखावा करने वाले चार साक्षात्कार हैं" और मैं अपने फोन पर कुछ भी नहीं सुन रहा था। lol

Dev ने उस रात कुछ ऐसा कहा जो मुझे नापसंद था। अपने फ्रिज पर झुका हुआ, हाथ में बियर, दुस्साहस। "यदि आप किसी प्रधानमंत्री को एक अवधारणा दो वाक्यों में नहीं समझा सकते हैं तो आप इसे साक्षात्कार के लिए नहीं समझ पाएंगे।" फिर इस पागल ने मुझे बायेसियन को उसकी प्रेमिका लीना को अपडेट करने के बारे में समझाया। बालवाड़ी शिक्षक। शून्य आँकड़े पृष्ठभूमि। वह वहाँ बैठ कर ट्रेल मिक्स खा रही थी और मेरी ओर घूर रही थी जबकि मैं इधर-उधर की बातें कर रहा था और मैं सामान्य शब्दों में विश्वास अंतराल नहीं पा सका। चार प्रयास. चार. मैं स्पष्ट रूप से लाल था. तीसरा प्रयास मैंने लगभग छोड़ ही दिया था और वह अभी भी तिरछी नजरें झुकाए बैठी थी और ट्रेल मिक्स खा रही थी। चार प्रयास में उसने सिर हिलाया और मेरे दिमाग में कुछ खुला। मैं हर बार लीना के तिरछे चेहरे के बारे में सोचता हूं जब कोई मुझसे संभावना शब्द का उपयोग किए बिना पी-वैल्यू समझाने के लिए कहता है, या आप टी-टेस्ट बनाम ची-स्क्वायर का उपयोग कब करते हैं, या मुझे ए/बी टेस्ट नमूना आकार गणित के बारे में बताते हैं। प्रत्येक डीएस लूप में जो प्रश्न दिखाई देते हैं, उनके बारे में मैंने किसी से भी सुना है। अलग-अलग कंपनी के लोगो पहनने वाली समान पाँच अवधारणाएँ। सौ चालीस रुपये की पाठ्यपुस्तक ने मुझे ट्रेल मिक्स लेडी

Meta की डीएस फोन स्क्रीन हालांकि, 2025 के अंत में, देव ने देखी। लगभग पूरी तरह से एसक्यूएल, हार्ड एसक्यूएल। विंडो फ़ंक्शन. सीटीई. स्वयं जुड़ता है। तिथि गणित. उनका प्रश्न एक लॉगिन तालिका से उन उपयोगकर्ताओं को ढूंढना था जिनकी लॉगिन आवृत्ति लगातार तीन महीनों तक महीने-दर-महीने पचास प्रतिशत से अधिक गिर गई। एलएजी, विंडो फ़ंक्शन, दिनांक समूहन, बीस मिनट, साझा संपादक, जाएं। मेरे जानने वाले दो अन्य लोगों ने पुष्टि की है कि Meta DS ऐसा ही है। एसक्यूएल गेट है, इसे ठंडा लिखें या स्क्रीन हो गई है। Google DS कोडिंग SWE की तुलना में हल्की है, लेकिन वे वास्तविक पायथन चाहते हैं, विशेष रूप से पांडा, आपको गन्दा डेटा सौंपते हैं, उसे साफ़ करते हैं, मेट्रिक्स की गणना करते हैं, फिर साक्षात्कारकर्ता आपकी ओर देखकर तिरछा हो जाता है और कहता है "यह हमें क्या बताता है।" ज़ोर-ज़ोर से हंसना। लोग वर्किंग कोड लिखते हैं और फिर अंग्रेजी में यह नहीं कह सकते कि उनके आउटपुट का क्या मतलब है। मृत हवा. मैं वह व्यक्ति रहा हूं. डेटाफ़्रेम को घूरना। यह भूल जाना कि संख्याएँ कैसे काम करती हैं

डेव ने मुझे फेसटाइम पर नकली Google राउंड करते हुए देखा और खुद को म्यूट कर लिया ताकि मैं उसकी हंसी न सुन सकूं। उसने मुझे इसके बाद संदेश भेजा "भाई, तुमने सही पांडा लिखा और फिर चालीस सेकंड तक कुछ नहीं कहा।" वह चालीस सेकंड वही चुप्पी है जो ईमानदारी से आपको एमएल राउंड में मार देती है। वे आपसे बैकप्रोपेगेशन प्राप्त करने के लिए नहीं कहेंगे। देव को Amazon पर "कब आप एक यादृच्छिक जंगल पर ग्रेडिएंट बूस्टिंग चुनेंगे" मिला और मुझे उसी रसोई काउंटर पर उसके साथ मॉक पर "असंतुलित कक्षाएं आप क्या करते हैं" मिलीं, काउंटर पर वही पैड थाई ग्रीस था क्योंकि वह कभी सफाई नहीं करता था, और मैं फिर से जम गया। उन्होंने एसएमओटीई और क्लास वेट और थ्रेसहोल्ड ट्यूनिंग और सटीकता पर सटीक-रिकॉल और व्यावसायिक मामले को सूचीबद्ध किया कि झूठी सकारात्मक लागत झूठी नकारात्मक से अलग क्यों होती है और ट्रेल मिक्स के साथ लीना की तरह मुझे देखते हुए बैठ गई। पांच बातें. मेरे पास उनमें से दो थे. पाँच में से दो ऐसे लगते हैं जैसे आप कोई ब्लॉग पोस्ट पढ़ रहे हों। आपको सभी पाँचों की आवश्यकता है और आपको उन्हें जोड़ने की आवश्यकता है और यही होता है। Amazon ML डीप-डाइव राउंड वह है जहां देव लगभग मर गया था, हालांकि, आप अपने बायोडाटा से एक प्रोजेक्ट चुनते हैं और वे आपको तीस मिनट तक ड्रिल करते हैं। कौन सा मॉडल. क्यों। क्या विशेषताएं. मूल्यांकन। आप क्या बदलोगे. इस साक्षात्कारकर्ता ने Spotify पर निर्मित एक आरईसी सिस्टम डेव के लिए फीचर इंजीनियरिंग पर पंद्रह मिनट बिताए। पंद्रह। एक प्रोजेक्ट पर. मैंने उसके किचन काउंटर पर एक घंटे तक उस प्रोजेक्ट के बारे में पूछताछ करके उसे तैयार किया और बीस मिनट तक वह आठ महीने पहले चुने गए विकल्पों पर अटक रहा था। उस रात अपने सभी नोट्स दोबारा लिखे। उन सभी को। Google इसके बजाय सैद्धांतिक हो जाता है, पूर्वाग्रह-विचरण व्यापार, मॉडल जटिलता, नियमितीकरण। "ठीक है लेकिन L1 कम वजन क्यों पैदा करता है।" आप कहते हैं कि हीरा बाधा क्षेत्र और अनुवर्ती यह है कि ज्यामितीय रूप से इसका क्या मतलब है और यह उत्पाद में फीचर चयन के लिए क्यों महत्वपूर्ण है। लीना ने उस एक को देखकर बहुत ज़ोर से आँखें सिकोड़ ली होंगी। सबूतों पर अंतर्ज्ञान हमेशा

केस स्टडी वाला हिस्सा है जहां Dev ने मुझे सच में impress किया। सवाल कुछ ऐसा था, "पिछले हफ्ते metrics बारह percent गिर गए, क्या हुआ।" इसमें तुम्हें live investigation बनानी पड़ती है और interviewer PM बनकर बैठता है जो हर बात का आधा जवाब देता है। उसकी Meta case study थी, "Brazil में Instagram Reels के daily active users आठ percent गिर गए हैं, walk me through it।" और उसने कोई hypothesis फेंकने से पहले पूरे पांच मिनट clarifying questions में लगाए। सब users गिरे या कोई specific segment. app update कब गया. Brazil में उस समय कोई seasonal pattern था या नहीं. उसके interviewer को ये पांच मिनट बाद वाले framework से ज़्यादा पसंद आए।

मैं होता तो शायद सीधे hypotheses पर कूद जाता और वहीं ding खा लेता। वही पुरानी problem. dead pandas वाली चालीस सेकंड की चुप्पी, बस दूसरे रूप में। मेरा दिमाग पूछने से पहले जवाब देना चाहता है। behavioral round में STAR विधि आती है, "मुझे उस समय के बारे में बताओ जब तुम्हारे analysis ने business decision बदल दिया।" वहां vague मत होना. कौन सा analysis, कौन सा stakeholder, क्या decision बदला, measurable result क्या था. "थोड़ा analysis किया और मदद मिली" -- ये no-hire answer है।

कुछ companies अभी भी take-home देती हैं। dataset, prompt, अड़तालीस से बहत्तर घंटे, फिर notebook submit करो। Dev ने एक बार एक दोस्त का take-home review किया था। XGBoost model बहुत tune किया हुआ था, लेकिन feature engineering choices क्यों कीं उसका explanation zero. एक sentence तक नहीं कि वही features क्यों चुने। वो आगे नहीं बढ़ी। Dev ने उसे देखकर कहा, "ये Kaggle dump है, memo नहीं।" इसे ऐसे लिखो जैसे VP को पैसा खर्च करने के लिए convince कर रहे हो। offer पाने वाले लगभग सब लोगों से मैंने यही सुना। क्या clean Kaggle-style notebook कभी pass हो सकती है? शायद. पर उस rejection को देखने के बाद मैं उस पर bet नहीं लगाऊंगा।

कंपनी प्रारूप, क्योंकि देव ने मुझसे इनके बारे में भी पूछताछ की थी। Meta DS एसक्यूएल फोन स्क्रीन है, फिर उत्पाद की समझ के साथ-साथ केस स्टडी के साथ-साथ तकनीकी डीप-डाइव प्लस व्यवहार के साथ ऑनसाइट है, उत्पाद की समझ Meta-विशिष्ट है जहां आप उनके ऐप्स के लिए मेट्रिक्स के बारे में तर्क करते हैं और यह वह दौर है जिसे देव ने कहा कि ऐसा महसूस होता है कि आपको एक पीएम द्वारा ग्रिल किया जा रहा है जो आपसे नफरत करता है। Google DS कोडिंग और आंकड़ों के साथ फोन स्क्रीन है, फिर कोडिंग और एमएल अवधारणाओं और केस स्टडी और Googleyness राउंड के साथ ऑनसाइट है, जो उनका संस्करण है "क्या आप वह व्यक्ति हैं जिसके साथ हम दोपहर का भोजन करना चाहते हैं।" Amazon DS SQL और बुनियादी आँकड़ों के लिए OA से शुरू होता है, फिर कोडिंग के साथ वर्चुअल लूप, पिछले काम पर ML गहन-गोता, केस अध्ययन, नेतृत्व सिद्धांतों के साथ व्यवहार और यदि आपने चौदह नेतृत्व सिद्धांतों को याद नहीं किया है तो शुभकामनाएँ। डीएस लूप्स कोडिंग और बातचीत को मिश्रित करते हैं, यही कारण है कि वे लोगों को परेशान करते हैं। एसक्यूएल और पायथन राउंड ऐसा लगता है जैसे कोडिंग साक्षात्कार जहां लाइव सहायता वाक्यविन्यास रिक्त स्थान को पकड़ती है या आपको आपके मस्तिष्क में गिराए गए विंडो फ़ंक्शन की याद दिलाती है (मेरी Meta स्क्रीन के दौरान सभी चीजों का LAG गिर गया, हाहाहा)। आँकड़े और केस स्टडी राउंड अधिक संवादात्मक होते हैं, एक फ्रेमवर्क चरण पर एक धक्का आपको सर्पिल होने से रोकता है

i ने मेरे दूसरे चक्र के दौरान InterviewMan का उपयोग किया। एसक्यूएल राउंड ने मुझे एक सहसंबद्ध सबक्वेरी लिखने के लिए चिह्नित किया जब एक विंडो फ़ंक्शन क्लीनर होगा। मैं विंडो फ़ंक्शंस जानता हूँ। दबाव ने मुझे वह सब हासिल करने पर मजबूर कर दिया जो मैंने सबसे पहले सीखा, जो कि सबसे मूर्खतापूर्ण गलती है। केस स्टडी राउंड में यह सामने आया कि मौसमी, उत्पाद परिवर्तन, डेटा पाइपलाइन के मुद्दों पर विचार करें जब मुझे मेट्रिक्स ड्रॉप प्रश्न मिला, मूल रूप से वही ब्राज़ील रील्स चीज़ जो देव को मिली थी लेकिन एक भुगतान कंपनी के लिए। बिल्कुल वही जो देव ने उस रसोई काउंटर पर पैड थाई के दौरान मुझमें डाला। नसों ने यह सब साफ़ कर दिया। इसके साथ मॉक ने मुझे ईमानदारी से लाइव राउंड से अधिक सिखाया क्योंकि मैंने वही देखा जहां मेरे स्पष्टीकरण हाथ हिलाने में बदल गए और कोई दबाव नहीं था इसलिए मैं वास्तव में उन्हें ठीक कर सकता था। बारह रुपये प्रति माह, सत्रों पर कोई सीमा नहीं, मास्टर डिग्री पर दो साल बिताने और ट्रेल मिक्स लेडी द्वारा बर्बाद होने के बाद मैं इस बारे में सस्ता नहीं होने वाला था। वास्तव में मैंने किसी समय मॉक सेशन का इंतजार करना शुरू कर दिया था, जो मेरे जीवन में कभी नहीं हुआ था। मैंने पहले किसी और चीज़ की तलाश की लेकिन सब कुछ केवल कोडिंग या केवल आँकड़े ही था, ऐसा कुछ भी नहीं जो पूर्ण डीएस लूप को प्रभावित करता हो। आँकड़े और मामले का अध्ययन और व्यवहार और एसक्यूएल एक उपकरण में। बाकी सब आधा टूल

here मेरा सबसे मूर्खतापूर्ण कदम है। मैंने एक सप्ताह तक एसक्यूएल का अध्ययन किया। अगले सप्ताह के आँकड़े। उसके बाद एम.एल. छोटी बाल्टियाँ अलग करें जैसे कि वे अलग-अलग विषय हों। वे मेरी ऑनसाइट में आए और उन्होंने एक दोपहर, चार घंटे में सब कुछ मुझ पर फेंक दिया, सब कुछ एक ही बार में, उस फिनटेक वीपी के समान जो बाकी सभी चीजों के तीन राउंड के बाद ए/बी टेस्ट गणित चाहता था। देव ने मुझे बताया कि ऐसा होगा, बार में, उसके रसोई काउंटर पर, शायद एक संदेश में जिसे मैंने पैड थाई खाते समय अनदेखा कर दिया था। नौ बियर. मुझे उसके नौ बियर देने हैं और शायद लीना को अपनी रसोई में बायेसियन को कुचलने के लिए माफ़ी मांगनी चाहिए, जब वह ट्रेल मिक्स खाने की कोशिश कर रही थी। जब मैं lol

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

ShareTwitterLinkedIn

Related Articles

Try InterviewMan Free

AI interview assistant. Undetectable.

Get Started