Preguntas de entrevista de ciencia de datos 2026: SQL, ML y estudios de caso

ok, entonces, la encimera de la cocina de Dev. 23 h. martes. El pad thai gotea grasa en el mostrador, ese lugar en Mission Street, demasiadas servilletas como siempre. Dev dice "explica los errores de tipo I y tipo II en un contexto de prueba A/B". nada. Mi boca se abre y no sale nada. Hice una maestría completa en estadísticas.

Dos años de esto. y estoy parado en su cocina incapaz de decir una frase sobre los errores de tipo I jajaja. Fórmulas, claro. palabras en inglés, no. Dev se recostó y esperó. tres segundos que duraron un año. Ese momento en la encimera de la cocina es la razón por la que escribo esto, porque dos semanas después, un vicepresidente de producto de una empresa fintech me hizo el mismo tipo de pregunta en la tercera ronda onsite y mi cerebro hizo exactamente lo mismo.

cuatro horas dentro del loop. funciones de ventana en SQL en la primera ronda. estadísticas pesadas en la segunda. un pitch de predicción de churn en la tercera. Entonces este hombre quiere que justifique los tamaños de muestra para una prueba A/B y no tengo nada. mi maestría no me salvó. Dev me advirtió. Es científico de datos en Spotify, lleva tres años allí y a estas alturas le debo nueve cervezas.

Una vez me dijo en un bar: "Las entrevistas de DS son cuatro entrevistas que fingen ser una" y yo estaba mirando el teléfono sin escuchar. jajaja

Dev dijo algo esa noche que odié. apoyado en su nevera, cerveza en mano, la audacia. "Si no puedes explicar un concepto a un PM en dos oraciones, no lo entenderás para la entrevista". Entonces este lunático me hizo explicarle la actualización bayesiana a su novia Lena. maestra de jardín de infantes. fondo de estadísticas cero. Ella se sentó allí comiendo una mezcla de frutos secos y mirándome con los ojos entrecerrados mientras yo divagaba y no podía expresar los intervalos de confianza en palabras normales.

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

cuatro intentos. CUATRO. Estaba visiblemente rojo. En el tercer intento casi me rindo y ella todavía estaba entrecerrando los ojos y comiendo una mezcla de frutos secos. En el cuarto intento, ella asintió y algo se abrió en mi cerebro. Pienso en la cara entrecerrada de Lena cada vez que alguien me pide que explique los valores p sin usar la palabra probabilidad, o cuándo se usa la prueba t versus chi-cuadrado, o me guía a través de las matemáticas del tamaño de muestra de la prueba A/B.

las preguntas que aparecen en cada bucle de DS que he oído de alguien. Los mismos cinco conceptos con diferentes logotipos de empresas. El libro de texto de ciento cuarenta dólares me enseñó menos que la dama de la mezcla de frutos secos

Meta. casi en su totalidad SQL, SQL duro. funciones de ventana. CTE. autouniones. matemáticas de fechas. su pregunta era encontrar usuarios en una tabla de inicios de sesión cuya frecuencia de inicio de sesión disminuyera más del cincuenta por ciento mes tras mes durante tres meses consecutivos. LAG, funciones de ventana, agrupación por fechas, veinte minutos, editor compartido, listo. Otras dos personas que conozco confirmaron que Meta DS es así.

SQL es la puerta, escríbalo en frío o la pantalla estará lista. La codificación Google DS es más liviana que SWE, pero quieren Python real, Pandas específicamente, entregarle datos desordenados, limpiarlos, calcular métricas, luego el entrevistador lo mira entrecerrando los ojos y dice "¿qué nos dice esto?". jajaja. la gente escribe código funcional y luego no puede decir en inglés lo que significa su propio resultado. aire muerto. Yo he sido esa persona. mirando un marco de datos. olvidando cómo funcionan los números

Dev me vio hacer una ronda simulada de Google por FaceTime y se silenció para que no lo oyera reír. Me envió un mensaje de texto después de "hermano, escribiste pandas correctos y luego no dijiste nada durante cuarenta segundos". Esos cuarenta segundos son el mismo silencio que te mata en las rondas de ML honestamente. no le pedirán que derive la retropropagación.

Dev recibió "¿cuándo elegirías gradient boosting por encima de random forest?" en Amazon y yo obtuve "clases desequilibradas, ¿qué haces?" en una simulación con él en el mismo mostrador de la cocina, la misma mancha de grasa en el mostrador porque nunca limpia, y me congelé de nuevo. enumeró SMOTE y pesos de clase y ajuste de umbral y precision-recall por encima de accuracy y el caso comercial de por qué los falsos positivos cuestan distinto que los falsos negativos y se sentó allí mirándome como Lena con la mezcla de frutos secos.

cinco cosas. Yo tenía dos. dos de cinco suena a que leíste una publicación de blog. necesitas los cinco y necesitas conectarlos y eso es lo que pasa. La ronda de ML de Amazon donde más apretaron es donde Dev casi muere; eliges un proyecto de tu currículum y te perforan durante treinta minutos. qué modelo. por qué. qué features.

evaluación. ¿Qué cambiarías? Este entrevistador dedicó QUINCE minutos a la ingeniería de features para un sistema de recomendación que Dev construyó en Spotify. quince. en un proyecto. Lo preparé interrogándolo sobre ese proyecto durante una hora en la encimera de su cocina y en el minuto veinte ya estaba tropezando con las decisiones que había tomado ocho meses antes. Reescribió todas sus notas esa noche.

todas. En cambio, Google se vuelve teórico: compensación entre sesgo y varianza, complejidad del modelo y regularización. "Está bien, pero ¿POR QUÉ L1 produce pesos dispersos?" tú dices región de restricción en diamante y el seguimiento es qué significa eso geométricamente y por qué importa para la selección de features en producción. Lena habría entrecerrado los ojos durísimo ante eso jajaja. intuición por encima de pruebas siempre

"Las métricas cayeron un doce por ciento la semana pasada, ¿qué pasó?" construyes una investigación en vivo mientras el entrevistador hace de PM que te da respuestas vagas a todo. su estudio de caso Meta fue "Los usuarios activos diarios de Instagram Reels cayeron un ocho por ciento en Brasil, explíquemelo". Cinco minutos de preguntas aclaratorias antes de proponer una sola cosa.

todos los usuarios o un segmento. timing de la actualización de la app. patrones estacionales en Brasil específicamente. Esos cinco minutos aclaratorios impresionaron más a su entrevistador que el marco de análisis que vino después. Habría saltado directamente a las hipótesis y probablemente me habrían criticado por ello. Exactamente el mismo problema que los cuarenta segundos de silencio de los pandas muertos jajaja.

Mi cerebro quiere responder antes de preguntar. Las rondas de comportamiento utilizan el método STAR, "cuénteme sobre una ocasión en la que su análisis cambió una decisión comercial". análisis específico, qué parte interesada, qué decisión cambió, resultado medible. "Hice algunos análisis y ayudó" es una respuesta de no contratación. take-homes que algunas empresas todavía hacen: conjunto de datos, prompt, cuarenta y ocho a setenta y dos horas, enviar un notebook.

Dev revisó una vez el take-home de una amiga. El modelo XGBoost estaba ajustado perfecto, sin explicación de por qué se tomó ninguna decisión de ingeniería de features. ni una frase sobre por qué eligió esas features. ella no avanzó. Dev lo miró y dijo: "Esto es un volcado de Kaggle, no una nota". escríbelo como si estuvieras convenciendo a un vicepresidente para que gaste dinero.

Todas las personas con las que hablé y que recibieron una oferta lo escribieron de esa manera. ¿Podrías salirte con la tuya con un notebook limpio estilo Kaggle? tal vez. pero no apostaría por ello después de ver cómo rechazaban esa entrega

si los quieres porque Dev también me interrogó sobre estos jajaja. Meta DS es una pantalla de teléfono SQL y luego en el sitio con sentido del producto más estudio de caso más inmersión técnica profunda más comportamiento, siendo el sentido del producto el específico de Meta en el que razonas sobre las métricas de sus aplicaciones y es la ronda que el desarrollador dijo que se sentía más como ser interrogado por un PM que te odia.

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

Google DS es una pantalla de teléfono con codificación y estadísticas, luego en el sitio con codificación y conceptos de ML y un estudio de caso y una ronda de Googleyness, que es su versión de "¿eres una persona con la que queremos almorzar?". Amazon DS comienza con un OA para SQL y estadísticas básicas, luego un bucle virtual con codificación, profundización de ML en trabajos anteriores, estudio de caso, comportamiento con principios de liderazgo y si no ha memorizado catorce principios de liderazgo, buena suerte.

Los bucles DS mezclan codificación y conversación, por lo que confunden a la gente. Las rondas de SQL y Python se sienten como entrevistas de codificación donde la ayuda en vivo detecta espacios en blanco de sintaxis o te recuerda una función de ventana que tu cerebro abandonó (la mía perdió LAG durante mi pantalla Meta, nada más jajaja). Las rondas de estadísticas y estudios de casos son más conversacionales, un empujón en un paso del marco evita que usted se convierta en una espiral

i usé InterviewMan durante mi segundo ciclo. Ronda SQL, me marcó escribiendo una subconsulta correlacionada cuando una función de ventana estaría más limpia. SÉ las funciones de la ventana. La presión me hizo buscar primero lo que aprendí, que es el tipo de error más tonto. El estudio de caso surgió considerando la estacionalidad, los cambios de productos, los problemas de canalización de datos cuando recibí una pregunta sobre la caída de métricas, básicamente lo mismo que Dev recibió de Brazil Reels, pero para una empresa de pagos.

exactamente lo que Dev me taladró en la encimera de la cocina mientras tomaba pad thai. Los nervios lo limpiaron todo. Honestamente, las burlas me enseñaron más que las rondas en vivo porque vi exactamente dónde mis explicaciones se convertían en gestos con las manos y no había presión para poder arreglarlas. doce dólares al mes, sin límites en las sesiones, lo cual después de pasar dos años en una maestría y ser arruinado por una señora de la mezcla de frutos secos, no estaba dispuesto a ser tacaño con esto jajaja.

De hecho, comencé a esperar sesiones simuladas en algún momento, algo que nunca me había sucedido en mi vida. Primero busqué algo más, pero todo era solo codificación o solo estadísticas, nada que alcanzara el ciclo completo de DS. estadísticas y estudios de casos y comportamiento y SQL en una sola herramienta. todo lo demás era media herramienta

Aquí está mi movimiento más tonto. Estudié SQL durante una semana. estadísticas la próxima semana. ML después de eso. Separe pequeños cubos como si fueran temas separados. Entré a mi sitio y me arrojaron todo en una tarde, cuatro horas, todo a la vez, igual que ese vicepresidente de fintech que quería una prueba A/B de matemáticas después de tres rondas de todo lo demás.

Dev me dijo que eso sucedería, en el bar, en el mostrador de su cocina, probablemente en un mensaje de texto que ignoré mientras comía pad thai. nueve cervezas. Le debo nueve cervezas y probablemente le debo a Lena una disculpa por destrozar la actualización bayesiana en su cocina mientras intentaba comer una mezcla de frutos secos. Ella todavía me mira entrecerrando los ojos cuando vengo jajaja

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

Get Started Free View Pricing

ShareTwitter LinkedIn

Guides

Preguntas de entrevista de ciencia de datos 2026: SQL, ML y estudios de caso

Ready to Ace Your Next Interview?

Related Articles

Preguntas de entrevista de diseno de producto 2026: criticas, pizarra y portafolio

Preguntas de entrevista de product manager 2026: como prepararte para entrevistas PM

Que empresas permiten o prohiben la IA en entrevistas en 2026