Rozmowa przebiegała dobrze. To był nieformalny czat o projekcie programistycznym, tego rodzaju nieformalna wymiana zdań, która między programistami mówiącymi różnymi językami odbywa się dziesiątki razy dziennie. Druga osoba była Rosjaninem, wiadomości pisane były po angielsku, a Google Translate wykonywał ciężką pracę konwersji wszystkiego na rosyjski w locie. Przez około dziesięć wiadomości wszystko wydawało się gładkie. Potem, znienacka, Rosjanin napisał coś, co w luźnym tłumaczeniu brzmiało: „Czekaj, jesteś mężczyzną czy kobietą?" Pytanie wydawało się dziwaczne. Nic w rozmowie nie miało nic wspólnego z płcią. Nie było żadnej niejednoznaczności zdjęcia profilowego, żadnego pomieszania imion. Tematem była struktura bazy danych. A mimo to z perspektywy drugiej osoby pytanie miało doskonały sens.

Rosyjski to język z rodzajem gramatycznym. Czasowniki w czasie przeszłym, przymiotniki, a nawet niektóre rzeczowniki zmieniają formę w zależności od rodzaju gramatycznego mówiącego. Kiedy ktoś pisze po rosyjsku „zrobiłem", końcówka czasownika mówi czytelnikowi, czy mówiący jest mężczyzną czy kobietą. Google Translate, pracujący z zerowym kontekstem na temat tego, kto pisał, wybrał żeńskie formy czasowników dla każdej pojedynczej wiadomości. Dla rosyjskiego czytelnika wyglądało to dokładnie tak, jakby pisała kobieta. Rzeczywisty nadawca był mężczyzną. Tłumacz nie miał jak tego wiedzieć, bo nikt mu nie powiedział, a on nigdy nie zapytał.

To nie była drobna stylistyczna osobliwość. Cały ton rozmowy się zmienił. Rodzaj gramatyczny w rosyjskim nie jest opcjonalną dekoracją. Jest wbudowany w strukturę niemal każdego zdania odnoszącego się do mówiącego w czasie przeszłym. Powiedzenie „poszedłem do sklepu" używa innego słowa w zależności od tego, czy poszedł mężczyzna czy kobieta. Powiedzenie „byłem zmęczony" się zmienia. Powiedzenie „ukończyłem projekt" się zmienia. Każda pojedyncza wypowiedź w pierwszej osobie w czasie przeszłym nadawała niewłaściwą tożsamość przez całą rozmowę, a rosyjski uczestnik po prostu zakładał, że wynik tłumacza jest poprawny.

Ten moment był wyzwalaczem. Nie irytacja z powodu jednego błędnego tłumaczenia, ale świadomość, że najszerzej używane narzędzie tłumaczeniowe na planecie nie ma absolutnie żadnego mechanizmu do poznania czegoś tak podstawowego jak płeć mówiącego. Nie pyta. Nie wywnioskuje. Wybiera wartość domyślną i idzie dalej, pozostawiając czytelnikowi wyciąganie wniosków, które mogą być zupełnie błędne. Rozwiązaniem nie był lepszy algorytm. Rozwiązaniem był kontekst.