Konversationen gick bra. Det var en informell chatt om ett mjukvaruprojekt, den typen av informellt utbyte som sker dussintals gånger om dagen mellan utvecklare som talar olika språk. Den andra personen var rysk, meddelandena skrevs på engelska och Google Translate skötte det tunga arbetet med att konvertera allt till ryska i realtid. Under ungefär tio meddelanden kändes allt smidigt. Sedan, helt plötsligt, skrev ryssen något som löst översatt löd: "Vänta, är du man eller kvinna?" Frågan verkade bisarr. Ingenting i konversationen hade med kön att göra. Det fanns ingen profilbildstvetydighet, ingen namnförvirring. Ämnet var databasstruktur. Och ändå, ur den andra personens perspektiv, var frågan helt logisk.

Ryska är ett grammatiskt könsbaserat språk. Verb i förfluten tid, adjektiv och till och med vissa substantiv ändrar form beroende på talarens grammatiska kön. När någon skriver "jag gjorde" på ryska berättar verbändelsen för läsaren om talaren är man eller kvinna. Google Translate, som arbetade med noll kontext om vem som skrev, hade valt feminina verbformer för varje enskilt meddelande. För den ryska läsaren såg det exakt ut som om en kvinna skrev. Den faktiska talaren var man. Översättaren hade inget sätt att veta detta, eftersom ingen berättade det, och den frågade aldrig.

Detta var ingen liten stilistisk egenhet. Hela tonen i konversationen förändrades. Grammatiskt kön på ryska är inte valfri dekoration. Det är inbakat i strukturen av nästan varje mening som hänvisar till talaren i förfluten tid. Att säga "jag gick till affären" använder ett annat ord beroende på om en man eller kvinna gick. Att säga "jag var trött" förändras. Att säga "jag avslutade projektet" förändras. Varje enda förstapersonsuttryck i förfluten tid hade sänt ut fel identitet genom hela konversationen, och den ryska deltagaren hade helt enkelt antagit att översättarens output var korrekt.

Det ögonblicket var utlösaren. Inte irritation över en enskild felöversättning, utan insikten att det mest använda översättningsverktyget på planeten absolut saknar mekanism för att veta något så grundläggande som talarens kön. Det frågar inte. Det härleder inte. Det väljer en standard och går vidare, och lämnar läsaren att dra slutsatser som kan vara helt felaktiga. Lösningen var inte en bättre algoritm. Lösningen var kontext.