Samtalen gikk fint. Det var en uformell chat om et programvareprosjekt, den typen uformell frem-og-tilbake som skjer titalls ganger daglig mellom utviklere som snakker forskjellige språk. Den andre personen var russisk, meldingene ble skrevet på engelsk, og Google Translate tok seg av det tunge arbeidet med å konvertere alt til russisk i sanntid. I omtrent ti meldinger føltes alt glatt. Så, helt ut av det blå, skrev russeren noe som løst oversatt lød: «Vent, er du mann eller kvinne?» Spørsmålet virket bisart. Ingenting i samtalen hadde noe med kjønn å gjøre. Det var ingen profilbilde-tvetydighet, ingen navneforvirring. Temaet var databasestruktur. Og likevel, fra den andre personens perspektiv, ga spørsmålet fullstendig mening.

Russisk er et grammatisk kjønnsspråk. Verb i fortid, adjektiver og til og med visse substantiv endrer form avhengig av talerens grammatiske kjønn. Når noen skriver «jeg gjorde» på russisk, forteller verbets endelse leseren om taleren er mann eller kvinne. Google Translate, som arbeidet med null kontekst om hvem som skrev, hadde valgt feminine verbformer for hver eneste melding. For den russiske leseren så det nøyaktig ut som om en kvinne skrev. Den faktiske taleren var mann. Oversetteren hadde ingen mulighet til å vite dette, fordi ingen fortalte den det, og den spurte aldri.

Dette var ikke en liten stilistisk detalj. Hele tonen i samtalen endret seg. Grammatisk kjønn på russisk er ikke valgfri dekorasjon. Det er innebygd i strukturen til nesten enhver setning som refererer til taleren i fortid. Å si «jeg gikk til butikken» bruker et annet ord avhengig av om en mann eller kvinne gikk. Å si «jeg var sliten» endrer seg. Å si «jeg fullførte prosjektet» endrer seg. Hver eneste førstepersonsutsagn i fortid hadde sendt ut feil identitet gjennom hele samtalen, og den russiske deltakeren hadde simpelthen antatt at oversettelsesverktøyets output var korrekt.

Det øyeblikket var utløseren. Ikke irritasjon over en enkelt feiloversettelse, men erkjennelsen av at det mest brukte oversettelsesverktøyet på planeten absolutt ingen mekanisme har for å vite noe så grunnleggende som talerens kjønn. Det spør ikke. Det utleder ikke. Det velger en standard og går videre, og overlater leseren til å trekke konklusjoner som kan være helt feil. Løsningen var ikke en bedre algoritme. Løsningen var kontekst.