NADIA. FILLE. tu avais raison sur tout et j'aurais dû écouter depuis le début mais non, j'ai dû bombarder ma première boucle Anthropic pour comprendre ça moi-même.
ok, voici ce qui s'est passé. 11h00 Appel Zoom. Je me suis réveillé à 10h47, j'ai enfilé le sweat à capuche dans lequel je dormais, j'ai pris un café qui est devenu froid avant même que l'appel ne commence. L'intervieweur demande "quel mode d'échec des LLM vous inquiète le plus". je dis "hallucinations" comme ça, c'est une brillante prise originale. elle ne hoche pas la tête. ne réagit pas. attend. puis "ok, qu'est-ce qui change à ce sujet lorsque vous donnez à un agent l'utilisation d'un outil." et mon cerveau juste. rien. bruit blanc réel. Je n'ai même pas pu trouver une mauvaise réponse. a marmonné quelque chose à propos des étapes de vérification et elle a fait la grimace. tu connais le visage ? trois boucles échouées dans trois entreprises différentes, j'ai vu exactement ce look à chaque fois. signifie que le tour est terminé et que vous manquez tous les deux de temps en prétendant que ce n'est pas le cas.
alors oui. l'a bombardé. J'ai passé deux mois après cela à réparer tout ce qui n'allait pas avec ma préparation et personne ne m'a rien dit de tout cela, alors voici tout.
douze histoires comportementales prêtes à l'emploi. conflits d'équipe, expédition sous pression, trucs de type plus grands succès. ZÉRO heures sur la sécurité de l'IA. pas un. chez Google et Meta, personne ne vous demande ce que vous pensez de ce que vous construisez. vous le construisez, l’expédiez et rentrez chez vous. à Anthropic ? pourrait être la seule question qui décide de toute votre boucle. Nadia travaille dans un autre laboratoire d'IA et elle n'a pas arrêté de me crier dessus pendant des semaines. "Ils ne veulent pas que vous connaissiez les mots à la mode qu'ils veulent voir si vous en avez réellement perdu le sommeil." ouais ok Nadia bien sûr peu importe. je n'ai pas écouté mdr.
Nadia m'a appelé ce soir-là et la première chose qu'elle m'a dite a été "est-ce qu'ils t'ont posé des questions sur l'alignement" et j'ai dit oui. "et tu as dit hallucinations." Ouais. elle n'avait même pas besoin de dire autre chose.
Anthropic m'a envoyé un document sur leurs valeurs avant l'entretien et ils s'attendaient à ce que je l'aie lu. interrogé sur les problèmes de confidentialité dans les systèmes d’IA. m'a demandé ce que je ferais si je trouvais une capacité de modèle qui pourrait causer des dommages. interrogé sur une fois où j'ai soulevé une préoccupation que mon équipe ne voulait pas entendre. ce n'est pas Amazon "parlez-moi d'un conflit". ils veulent savoir si vous vous souciez de ce que fait votre code après l'avoir expédié. Selon Nadia, OpenAI teste cela également, moins sur la sécurité en particulier, mais plutôt sur la question de savoir si vous pouvez parler de l'impact de ce que vous construisez sur de vraies personnes sans avoir l'air répété. c'est également dans cette partie que sont prises les décisions de nivellement dont la plupart des gens ne se rendent pas compte. Je n'ai pas trouvé STAR utile, si vous avez de vraies histoires à raconter, vous êtes prêt à partir, mais les histoires doivent porter sur l'éthique et l'impact, si tout ce que vous avez est "nous avons expédié rapidement sous pression", cela ne suffira pas ici.
. quatre-vingt-dix minutes. rien de tel que les problèmes classiques de tableau blanc. ils m'ont dit de créer un magasin clé-valeur. DÉFINIR GET DELETE pour démarrer, puis les analyses filtrées, puis l'expiration TTL avec horodatage, puis la persistance des fichiers avec compression. quatre étapes chacune empilée sur la dernière et mon intervieweur a continué à s'attaquer aux contraintes la DEUXIÈME fois que j'ai terminé une étape, comme un collègue qui ne cesse de changer les spécifications de vous à mi-sprint. m'a rendu fou. Nadia a déclaré que son écran OpenAI fonctionnait de la même manière, en construisant quelque chose de réel en une heure. OpenAI fait également cette étude approfondie où vous présentez un système que vous avez construit et ils déchirent tous les choix que vous avez faits, ce qui semble honnêtement terrifiant.
La partie qui m'a détruit dans le codage n'était pas les problèmes. cela parlait à travers mon approche. quand je fais de la programmation normale, j'expérimente et commence à écrire avec l'idée que je refactoriserai plus tard. vous ne pouvez pas faire cela lorsque vous disposez de quatre-vingt-dix minutes et que quelqu'un vous surveille et ajoute des exigences toutes les quinze minutes. lors de ma deuxième tentative, je me suis forcé à ralentir. comme si je répétais la question dans mes propres mots et créerais quelques exemples d'entrées avant d'écrire quoi que ce soit. Nadia m'a en fait expliqué cela, elle m'arrêtait au milieu d'une phrase et disait "ok mais quels sont les cas extrêmes" et je devais y réfléchir à voix haute. J'ai commencé à décrire mon approche et à réfléchir à la complexité avant de toucher le clavier. j'ai même confirmé auprès de l'intervieweur que la direction semblait raisonnable avant de commencer à taper. puis écrire lentement et déboguer avec mes propres exemples après. cela me semblait terriblement lent dans la pratique, mais cela m'a en fait rendu plus rapide parce que j'ai arrêté de suivre de mauvais chemins et de devoir tout réécrire.
. oh mec. sur une planète complètement différente de Conception du système FAANG. personne ne m'a demandé de concevoir un raccourcisseur d'URL. personne ne m'a posé de questions sur un service de chat. Anthropic souhaitait que je conçoive une infrastructure de service d'inférence pour des millions de requêtes tout en maintenant une utilisation élevée du GPU avec différentes tailles de modèles. le traitement par lots des requêtes, la gestion de la mémoire cache KV, le routage vers la bonne instance, la façon dont la latence se construit via un pipeline de transformateur. mon intervieweur a CONSTRUIT sa pile de portions. comme s'il l'avait personnellement écrit. il savait en deux minutes que ma préparation provenait de vidéos YouTube génériques et je pouvais ressentir la même ambiance dès le premier appel où elle m'a posé des questions sur les hallucinations. comme ok, cette personne n'a pas fait le travail. OpenAI pose des questions similaires sur la mise à l'échelle de l'inférence à partir de ce que Nadia a décrit. vous avez besoin d'une expérience réelle avec ces systèmes, il n'y a pas de raccourci et je ne vais pas prétendre qu'il y en a. J'avais travaillé sur les infrastructures dans le cadre d'un emploi précédent, mais j'avais encore besoin de temps pour organiser ce que je savais et trouver comment en parler sans divaguer. De plus, si vous avez besoin d'une file d'attente distribuée et que vous n'en avez jamais touché, appelez-la simplement "file d'attente distribuée". ne vous plongez pas dans des détails que vous ne pouvez pas défendre.
des trucs de chronologie puisque les gens le demandent toujours. Il a fallu environ trois semaines à Anthropic entre l’appel du recruteur et la réponse. Nadia a déclaré que OpenAI avait mis six semaines, ce qui l'a presque tuée, elle actualisait son courrier électronique comme une maniaque. Anthropic divise le site en deux sessions distinctes d'une demi-journée, de deux ou trois tours chacune. OpenAI fait une longue journée. les images fantômes entre les étapes sont normales dans les deux cas. les recruteurs sont enterrés. si vous recevez une offre, demandez trente à quarante-cinq minutes avec l'un des enquêteurs. avoir une réunion juste pour poser des questions. écoutez attentivement car à ce moment-là, ils vous vendent.
, j'ai donc exécuté InterviewMan lors de ma deuxième tentative Anthropic et quelques simulations OpenAI. lors du défi de codage, j'ai remarqué que j'avais oublié de vérifier le TTL sur les lectures avant de passer au niveau suivant, exactement le genre de chose que j'aurais manqué parce que j'étais concentré sur l'étape quatre. pendant le tour de sécurité, cela m'a nourri de points de discussion sur l'alignement et j'ai répondu à la question sur l'utilisation des outils et les hallucinations sans que mon cerveau ne devienne vide de bruit blanc cette fois mdr. tu te souviens de ce moment de ma première boucle où je viens de me figer ? ne s'est pas produit. lors de la conception du système, l'utilisation du GPU et le traitement par lots étaient les sujets principaux avant que mon intervieweur ne termine l'invite. Dock vérifié, liste de processus, Activity Monitor sur Zoom et Replit et CodeSignal. rien. douze dollars par mois et par an, aucune limite de session, 57 000 utilisateurs, plus de 20 fonctionnalités furtives. Interview Coder à deux heures quatre-vingt-dix-neuf effectue uniquement du codage, ce qui est inutile pour le cycle de sécurité et la conception du système qui représentent peut-être la moitié de votre score à ces endroits.
Nadia m'a dit d'avoir une bonne alternative avant de négocier et j'ai pensé qu'elle était dramatique. mais elle avait raison, la meilleure alternative est de réussir dans votre travail actuel. élimine tout désespoir de votre préparation, ce qui vous permet de mieux interviewer de toute façon. elle avait raison sur pratiquement tout ce que j'aurais dû écouter dès le début.
Ready to Ace Your Next Interview?
Join 57,000+ professionals using InterviewMan to get real-time AI assistance during their interviews.
