A conversa estava indo bem. Era um bate-papo informal sobre um projeto de software, o tipo de troca descontraída que acontece dezenas de vezes por dia entre desenvolvedores que falam idiomas diferentes. A outra pessoa era russa, as mensagens estavam sendo digitadas em inglês, e o Google Translate fazia o trabalho pesado de converter tudo para o russo em tempo real. Por cerca de dez mensagens, tudo parecia fluir bem. Então, do nada, o russo digitou algo que traduzido livremente era: "Espera, você é homem ou mulher?" A pergunta pareceu bizarra. Nada na conversa tinha a ver com gênero. Não havia ambiguidade na foto de perfil, nenhuma confusão de nome. O assunto era estrutura de banco de dados. E, no entanto, do ponto de vista da outra pessoa, a pergunta fazia total sentido.

O russo é um idioma com gênero gramatical. Verbos no passado, adjetivos e até certos substantivos mudam de forma dependendo do gênero gramatical do falante. Quando alguém escreve "eu fiz" em russo, a terminação do verbo diz ao leitor se o falante é homem ou mulher. O Google Translate, trabalhando com zero contexto sobre quem estava digitando, havia escolhido formas verbais femininas para cada mensagem. Para o leitor russo, parecia exatamente como se uma mulher estivesse escrevendo. O falante real era homem. O tradutor não tinha como saber disso, porque ninguém disse, e ele nunca perguntou.

Isso não foi uma pequena peculiaridade estilística. O tom inteiro da conversa mudou. Gênero gramatical em russo não é decoração opcional. Está embutido na estrutura de quase toda frase que se refere ao falante no passado. Dizer "eu fui à loja" usa uma palavra diferente dependendo de se um homem ou uma mulher foi. Dizer "eu estava cansado" muda. Dizer "eu terminei o projeto" muda. Cada declaração em primeira pessoa no passado havia transmitido a identidade errada durante toda a conversa, e o participante russo simplesmente havia assumido que a saída do tradutor estava correta.

Aquele momento foi o gatilho. Não irritação com uma única tradução errada, mas a percepção de que a ferramenta de tradução mais usada do planeta não tem absolutamente nenhum mecanismo para saber algo tão fundamental quanto o gênero do falante. Não pergunta. Não infere. Escolhe um padrão e segue em frente, deixando o leitor tirar conclusões que podem estar completamente erradas. A solução não era um algoritmo melhor. A solução era contexto.