Rus se mě zeptal, jestli jsem muž nebo žena, kvůli Google Překladači

Konverzace probíhala naprosto v pořádku. Byl to neformální chat o softwarovém projektu, ten typ neformální výměny zpráv, který se mezi vývojáři mluvícími různými jazyky odehrává desítkykrát denně. Druhý člověk byl Rus, zprávy se psaly v angličtině a Google Překladač dělal tu těžkou práci s převodem všeho do ruštiny za pochodu. Asi po deseti zprávách všechno působilo hladce. Pak, zčistajasna, Rus napsal něco, co se volně přeložilo jako: „Počkej, jsi muž nebo žena?" Otázka působila bizarně. Nic v konverzaci nemělo nic společného s pohlavím. Nebyla tam žádná nejednoznačnost profilové fotky, žádný zmatek ohledně jména. Téma byla struktura databáze. A přesto z pohledu druhého člověka otázka dávala naprostý smysl.

Ruština je rodový jazyk. Slovesa v minulém čase, přídavná jména a dokonce některá podstatná jména mění tvar podle gramatického rodu mluvčího. Když někdo napíše „udělal jsem" v ruštině, koncovka slovesa řekne čtenáři, zda je mluvčí muž nebo žena. Google Překladač, pracující s nulovým kontextem o tom, kdo píše, zvolil ženské tvary sloves pro každou jedinou zprávu. Pro ruského čtenáře to vypadalo přesně tak, jako by psala žena. Skutečný mluvčí byl muž. Překladač to neměl jak vědět, protože mu to nikdo neřekl a on se nikdy nezeptal.

Nebylo to drobné stylistické zvláštnosti. Celý tón konverzace se změnil. Gramatický rod v ruštině není volitelná ozdoba. Je zakořeněn ve struktuře téměř každé věty, která odkazuje na mluvčího v minulém čase. Říct „šel jsem do obchodu" používá jiné slovo podle toho, zda šel muž nebo žena. Říct „byl jsem unavený" se mění. Říct „dokončil jsem projekt" se mění. Každé jediné vyjádření v první osobě v minulém čase vysílalo špatnou identitu po celou konverzaci a ruský účastník jednoduše předpokládal, že výstup překladače je správný.

Ten moment byl spouštěčem. Ne podráždění z jednoho špatného překladu, ale uvědomění si, že nejpoužívanější překladatelský nástroj na planetě nemá absolutně žádný mechanismus pro zjištění něčeho tak základního, jako je pohlaví mluvčího. Neptá se. Neodvozuje. Vybere výchozí hodnotu a jde dál, přičemž čtenáři ponechá vyvozovat závěry, které mohou být zcela chybné. Řešením nebyl lepší algoritmus. Řešením byl kontext.

Rus se mě zeptal, jestli jsem muž nebo žena, kvůli Google Překladači

Proč gramatický rod ničí strojový překlad

Co kontextové kategorie skutečně dělají s překladem

Konverzace, která málem zničila obchodní vztah

Za hranice rodu: celý rozsah chybějícího kontextu

Často kladené otázky

Zvládá Google Překladač gramatický rod správně

Existuje bezplatný AI překladač s kontextovými nastaveními

Co je kontextový překlad a proč je důležitý

Které jazyky vyžadují gramatický rod v překladu

Mohou AI překladače nahradit lidské překladatele pro rodové jazyky

Jaká je nejlepší alternativní aplikace ke Google Překladači

Štítky

Dostupné také v: