La conversation se déroulait bien. C'était un échange informel sur un projet logiciel, le genre de va-et-vient décontracté qui se produit des dizaines de fois par jour entre développeurs parlant des langues différentes. L'autre personne était russe, les messages étaient tapés en anglais, et Google Translate faisait le gros du travail en convertissant tout en russe à la volée. Pendant environ dix messages, tout semblait fluide. Puis, de nulle part, le Russe a écrit quelque chose qui se traduisait approximativement par : « Attends, tu es un homme ou une femme ? » La question semblait bizarre. Rien dans la conversation n'avait rapport avec le genre. Pas d'ambiguïté de photo de profil, pas de confusion de nom. Le sujet était la structure de base de données. Et pourtant, du point de vue de l'autre personne, la question avait parfaitement du sens.

Le russe est une langue à genre grammatical. Les verbes au passé, les adjectifs et même certains noms changent de forme selon le genre grammatical du locuteur. Quand quelqu'un écrit « j'ai fait » en russe, la terminaison du verbe indique au lecteur si le locuteur est un homme ou une femme. Google Translate, travaillant sans aucun contexte sur l'identité de celui qui tapait, avait choisi des formes verbales féminines pour chaque message. Pour le lecteur russe, cela ressemblait exactement à une femme qui écrivait. Le locuteur réel était un homme. Le traducteur n'avait aucun moyen de le savoir, car personne ne le lui avait dit, et il n'a jamais demandé.

Ce n'était pas une petite particularité stylistique. Tout le ton de la conversation a changé. Le genre grammatical en russe n'est pas une décoration optionnelle. Il est intégré dans la structure de presque chaque phrase qui fait référence au locuteur au passé. Dire « je suis allé au magasin » utilise un mot différent selon qu'un homme ou une femme y est allé. Dire « j'étais fatigué » change. Dire « j'ai terminé le projet » change. Chaque déclaration à la première personne au passé avait diffusé la mauvaise identité tout au long de la conversation, et le participant russe avait simplement supposé que la sortie du traducteur était correcte.

Ce moment a été le déclencheur. Pas l'agacement d'une seule erreur de traduction, mais la prise de conscience que l'outil de traduction le plus utilisé de la planète n'a absolument aucun mécanisme pour connaître quelque chose d'aussi fondamental que le genre du locuteur. Il ne demande pas. Il ne déduit pas. Il choisit une valeur par défaut et continue, laissant le lecteur tirer des conclusions qui peuvent être entièrement fausses. La solution n'était pas un meilleur algorithme. La solution était le contexte.