Egy orosz megkérdezte, hogy férfi vagyok-e vagy nő, a Google Fordító miatt

A beszélgetés jól haladt. Egy szoftverprojektről szóló kötetlen csevegés volt, az a fajta informális üzenetváltás, ami naponta tucatszor megtörténik különböző nyelveket beszélő fejlesztők között. A másik személy orosz volt, az üzeneteket angolul gépelték, és a Google Fordító végezte a nehéz munkát, mindent oroszra fordítva menet közben. Körülbelül tíz üzeneten keresztül minden simának tűnt. Aztán a semmiből az orosz írt valamit, ami szabadon fordítva így hangzott: „Várj, férfi vagy vagy nő?" A kérdés furcsának tűnt. Semmi a beszélgetésben nem kapcsolódott a nemhez. Nem volt profilkép-kétértelműség, névbeli zavar sem. A téma adatbázis-struktúra volt. Mégis a másik személy szemszögéből a kérdés tökéletesen értelmes volt.

Az orosz nyelvtani nemekkel rendelkező nyelv. A múlt idejű igék, melléknevek és még bizonyos főnevek is megváltoztatják alakjukat a beszélő nyelvtani nemétől függően. Amikor valaki oroszul azt írja, hogy „csináltam", az ige végződése megmondja az olvasónak, hogy a beszélő férfi vagy nő. A Google Fordító, amely nulla kontextussal dolgozott arról, hogy ki gépel, minden egyes üzenethez nőnemű igealakokat választott. Az orosz olvasó számára pontosan úgy nézett ki, mintha nő írna. A valódi beszélő férfi volt. A fordítónak nem volt módja ezt megtudni, mert senki nem mondta el neki, és soha nem is kérdezte.

Ez nem apró stilisztikai furcsaság volt. A beszélgetés egész hangvétele megváltozott. Az oroszban a nyelvtani nem nem opcionális díszítés. A múlt idejű beszélőre utaló szinte minden mondat szerkezetébe bele van építve. Az „elmentem a boltba" más szót használ attól függően, hogy férfi vagy nő ment. A „fáradt voltam" változik. A „befejeztem a projektet" változik. Minden egyes egyes szám első személyű múlt idejű kijelentés rossz identitást sugárzott az egész beszélgetés során, és az orosz résztvevő egyszerűen feltételezte, hogy a fordító kimenete helyes.

Az a pillanat volt a kiváltó ok. Nem bosszúság egyetlen rossz fordítás miatt, hanem annak felismerése, hogy a bolygó legelterjedtebb fordítóeszköze abszolút semmilyen mechanizmussal nem rendelkezik ahhoz, hogy megtudjon valami olyan alapvetőt, mint a beszélő neme. Nem kérdez. Nem következtet. Választ egy alapértéket és továbbmegy, az olvasóra hagyva, hogy következtetéseket vonjon le, amelyek teljesen tévesek lehetnek. A megoldás nem jobb algoritmus volt. A megoldás a kontextus volt.

Egy orosz megkérdezte, hogy férfi vagyok-e vagy nő, a Google Fordító miatt

Miért teszi tönkre a nyelvtani nem a gépi fordítást

Mit csinálnak valójában a kontextuskategóriák a fordítással

A beszélgetés, amely majdnem tönkretett egy üzleti kapcsolatot

A nemen túl: a hiányzó kontextus teljes terjedelme

Gyakran ismételt kérdések

Helyesen kezeli a Google Fordító a nyelvtani nemet

Létezik ingyenes AI fordító, amely támogatja a kontextusbeállításokat

Mi a kontextustudatos fordítás és miért fontos

Mely nyelvek igényelnek nyelvtani nemet a fordításban

Helyettesíthetik az AI fordítók az emberi fordítókat nemekkel rendelkező nyelveknél

Melyik a legjobb alternatív alkalmazás a Google Fordítóhoz

Címkék

Elérhető még: