Perguntas de entrevista de ciencia de dados 2026: SQL, ML e estudos de caso

ok então o balcão da cozinha do Dev. 23h. terça-feira. pad thai vazando graxa no balcão, aquele lugar na rua da missão, guardanapos demais como sempre. Dev vai "explicar erros Tipo I versus Tipo II em um contexto de teste A/B". nada. minha boca se abre e não sai nada. fiz um mestrado completo em estatísticas. dois anos dessas coisas.

e estou parado na cozinha dele, incapaz de dizer uma frase sobre erros do Tipo I, haha. fórmulas, claro. palavras em inglês, não. Dev sentou-se e esperou. três segundos que duraram um ano. aquele momento no balcão da cozinha é o motivo pelo qual estou escrevendo isso, porque duas semanas depois, um vice-presidente de produto de uma empresa fintech me fez o mesmo tipo de pergunta na terceira rodada de um local e meu cérebro fez exatamente a mesma coisa.

quatro horas depois. A janela SQL funciona na primeira rodada. estatísticas grelhando a segunda rodada. arremesso de previsão de rotatividade, terceira rodada. então esse homem quer que eu justifique o tamanho das amostras para um teste A/B e não tenho nada. meu mestrado não me salvou. Dev me avisou. ele é cientista de dados no Spotify, há três anos, devo nove cervejas a ele neste momento.

ele me disse uma vez em um bar: "Entrevistas do DS são quatro entrevistas fingindo ser uma" e eu estava no telefone sem ouvir. haha

Dev disse algo naquela noite que eu odiei. encostado na geladeira, cerveja na mão, a audácia. “se você não consegue explicar um conceito a um PM em duas frases, você não o entende para a entrevista.” então esse lunático me fez explicar a atualização bayesiana para sua namorada Lena. professora de jardim de infância. histórico de estatísticas zero. ela ficou lá comendo mistura de trilha e semicerrando os olhos para mim enquanto eu divagava e não conseguia transformar intervalos de confiança em palavras normais.

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

quatro tentativas. QUATRO. eu estava visivelmente vermelho. tentativa três, quase desisti e ela ainda estava apertando os olhos e comendo mistura de trilha. tentativa quatro, ela assentiu e algo desbloqueou em meu cérebro. penso na cara estrábica de Lena toda vez que alguém me pede para explicar os valores-p sem usar a palavra probabilidade, ou quando você usa o teste t versus qui-quadrado, ou me explica a matemática do tamanho da amostra do teste A/B.

as perguntas que aparecem em cada loop do DS das quais ouvi falar de alguém. mesmos cinco conceitos usando logotipos de empresas diferentes. livro didático de cento e quarenta dólares me ensinou menos do que trail mix lady

Meta, no entanto, no final de 2025, Dev passou por isso. quase inteiramente SQL, SQL difícil. funções de janela. CTEs. auto-junta-se. data matemática. sua pergunta era encontrar usuários em uma tabela de logins cuja frequência de login caísse mais de cinquenta por cento mês após mês durante três meses consecutivos. LAG, funções de janela, agrupamento de datas, vinte minutos, editor compartilhado, pronto.

duas outras pessoas que conheço confirmaram que Meta DS é assim. SQL é o portão, escreva frio ou a tela estará pronta. A codificação Google DS é mais leve que SWE, mas eles querem Python real, especificamente Pandas, entregar dados confusos, limpá-los, calcular métricas, então o entrevistador olha para você e diz "o que isso nos diz". lol. as pessoas escrevem código funcional e não conseguem dizer em inglês o que significa sua própria saída. ar morto. eu tenho sido essa pessoa. olhando para um dataframe. esquecendo como os números funcionam

Dev me viu fazer uma simulação de Google no FaceTime e silenciou-se para que eu não o ouvisse rindo. ele me mandou uma mensagem depois de "cara, você escreveu pandas corretos e depois não disse nada por quarenta segundos." esses quarenta segundos são o mesmo silêncio que mata você honestamente nas rodadas de ML. eles não vão pedir que você derive a retropropagação.

Dev obteve "quando você escolheria o aumento de gradiente em uma floresta aleatória" em Amazon e eu obtive "classes desequilibradas, o que você faz" em uma simulação com ele naquele mesmo balcão da cozinha, a mesma graxa tailandesa no balcão porque ele nunca limpa, e eu congelei novamente. ele listou SMOTE e pesos de classe e ajuste de limite e recuperação de precisão sobre precisão e o caso de negócios de por que os falsos positivos custam diferentes dos falsos negativos e ficou lá olhando para mim como Lena com o mix de trilhas.

cinco coisas. eu tinha dois deles. dois em cada cinco parecem que você leu uma postagem de blog. você precisa de todos os cinco e conectá-los e é isso que passa. A rodada de aprofundamento do ML Amazon foi onde Dev quase morreu, você escolhe um projeto de seu currículo e eles o treinam por trinta minutos. qual modelo. por que.

quais recursos. avaliação. o que você mudaria. este entrevistador gastou QUINZE minutos na engenharia de recursos para um sistema rec que Dev construiu no Spotify. quinze. em um projeto. eu o preparei interrogando-o sobre aquele projeto por uma hora no balcão da cozinha e no minuto vinte ele estava tropeçando nas escolhas que fez oito meses antes. reescreveu todas as suas anotações naquela noite.

todos eles. Em vez disso, Google torna-se teórico, compensação entre polarização e variação, complexidade do modelo, regularização. "ok, mas POR QUE L1 produz pesos esparsos." você diz região de restrição de diamante e o acompanhamento é o que isso significa geometricamente e por que é importante para a seleção de recursos no produto. Lena teria semicerrado os olhos com tanta força para isso haha. intuição sobre provas sempre

estudos de caso são onde Dev me impressionou honestamente. "as métricas caíram 12% na semana passada, o que aconteceu." você constrói uma investigação ao vivo enquanto o entrevistador interpreta um PM que lhe dá respostas vagas para tudo. seu estudo de caso Meta foi "Os usuários ativos diários do Instagram Reels caíram 8% no Brasil, mostre-me isso." cinco minutos de esclarecimento de perguntas antes de propor qualquer coisa.

todos os usuários ou um segmento. tempo de atualização do aplicativo. padrões sazonais no Brasil especificamente. aqueles cinco minutos de esclarecimento impressionaram mais o entrevistador do que a estrutura de análise que veio depois. eu teria pulado direto para as hipóteses e provavelmente seria prejudicado por isso. exatamente o mesmo problema dos quarenta segundos de silêncio dos pandas mortos haha.

meu cérebro quer responder antes de perguntar. rodadas comportamentais usam o método STAR, "conte-me sobre uma ocasião em que sua análise mudou uma decisão de negócios". análise específica, qual parte interessada, que decisão mudou, resultado mensurável. "fiz algumas análises e ajudou" é uma resposta sem contratação. algumas empresas ainda fazem, conjunto de dados, alerta, quarenta e oito a setenta e duas horas, envie um caderno.

Dev revisou o que um amigo levou para casa uma vez. Modelo XGBoost ajustado perfeitamente, nenhuma explicação de por que qualquer escolha de engenharia de recursos foi feita. nem uma frase sobre por que ela escolheu esses recursos. ela não avançou. Dev olhou para ele e disse "isto é um despejo kaggle, não um memorando". escreva como se estivesse convencendo um vice-presidente a gastar dinheiro.

todas as pessoas com quem conversei que receberam uma oferta escreveram dessa forma. você poderia se safar com um caderno limpo estilo kaggle? talvez. mas eu não apostaria nisso depois de ver aquele envio ser rejeitado

formatos da empresa se você quiser, porque Dev me questionou sobre isso também haha. Meta DS é a tela do telefone SQL e, em seguida, no local com percepção do produto mais estudo de caso, além de aprofundamento técnico e comportamental, sendo a percepção do produto específica do Meta onde você raciocina sobre métricas para seus aplicativos e é a rodada que Dev disse que mais parecia ser interrogado por um PM que odeia você.

Ready to ace your next interview?

InterviewMan gives you real-time AI answers during live interviews — undetectable on Zoom, Meet, and Teams.

Try InterviewMan Free

Google DS é a tela do telefone com codificação e estatísticas, em seguida, no local com codificação e conceitos de ML e estudo de caso e rodada do Googleyness, que é a versão deles de "você é uma pessoa com quem queremos almoçar". Amazon DS começa com um OA para SQL e estatísticas básicas, em seguida, loop virtual com codificação, aprofundamento de ML em trabalhos anteriores, estudo de caso, comportamental com princípios de liderança e se você não memorizou quatorze princípios de liderança, boa sorte.

Os loops DS misturam codificação e conversação, e é por isso que bagunçam as pessoas. As rodadas de SQL e Python parecem entrevistas de codificação, onde a ajuda ao vivo captura espaços em branco de sintaxe ou lembra você de uma função de janela que seu cérebro derrubou (o meu derrubou LAG durante minha tela Meta, entre todas as coisas, lol). estatísticas e rodadas de estudo de caso são mais conversacionais, um empurrãozinho em uma etapa da estrutura evita que você entre em espiral

i usei InterviewMan durante meu segundo ciclo. Rodada de SQL me sinalizou escrevendo uma subconsulta correlacionada quando uma função de janela seria mais limpa. eu SEI as funções da janela. a pressão me fez buscar tudo o que aprendi primeiro, o que é o tipo de erro mais idiota. o estudo de caso sobre ele surgiu considerando sazonalidade, mudanças de produto, problemas de pipeline de dados quando recebi uma pergunta sobre queda de métricas, basicamente a mesma coisa do Brazil Reels que Dev recebeu, mas para uma empresa de pagamentos.

exatamente o que Dev me perfurou naquele balcão da cozinha enquanto saboreávamos pad thai. os nervos limparam tudo. zombarias honestamente me ensinaram mais do que as rodadas ao vivo, porque eu vi exatamente onde minhas explicações se transformaram em acenos de mão e não houve pressão para que eu pudesse realmente corrigi-las. doze dólares por mês, sem limite de sessões, o que depois de passar dois anos em um mestrado e ser destruído pela senhora do trail mix, eu não estava disposto a ser mesquinho com isso haha.

na verdade, comecei a ansiar por sessões simuladas em algum momento, o que nunca aconteceu comigo na minha vida. procurei por outra coisa primeiro, mas tudo era apenas codificação ou apenas estatísticas, nada que atingisse o loop completo do DS. estatísticas e estudo de caso e comportamentais e SQL em uma ferramenta. todo o resto era meia ferramenta

aqui está minha jogada mais idiota. estudei SQL por uma semana. estatísticas na próxima semana. ML depois disso. pequenos baldes separados como se fossem assuntos separados. entrei no meu local e eles jogaram tudo em mim em uma tarde, quatro horas, tudo de uma vez, assim como aquele vice-presidente de fintech que queria um teste A/B de matemática depois de três rodadas de todo o resto.

Dev me disse que isso aconteceria, no bar, no balcão da cozinha, provavelmente em uma mensagem que ignorei enquanto comia pad thai. nove cervejas. devo nove cervejas a ele e provavelmente devo a Lena um pedido de desculpas por massacrar a atualização bayesiana em sua cozinha enquanto ela tentava comer mistura para trilhas. ela ainda olha para mim quando eu chego hahaha

Ready to Ace Your Next Interview?

Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.

Get Started Free View Pricing

ShareTwitter LinkedIn

Guides

Perguntas de entrevista de ciencia de dados 2026: SQL, ML e estudos de caso

Ready to Ace Your Next Interview?

Related Articles

Perguntas de entrevista de design de produto 2026: criticas, whiteboard e portfolio

Perguntas de entrevista para gerente de produto em 2026: como se preparar para entrevistas de PM

Perguntas de entrevista para vendas em 2026: de ligacoes frias ao fechamento