A beszélgetés jól haladt. Egy szoftverprojektről szóló kötetlen csevegés volt, az a fajta informális üzenetváltás, ami naponta tucatszor megtörténik különböző nyelveket beszélő fejlesztők között. A másik személy orosz volt, az üzeneteket angolul gépelték, és a Google Fordító végezte a nehéz munkát, mindent oroszra fordítva menet közben. Körülbelül tíz üzeneten keresztül minden simának tűnt. Aztán a semmiből az orosz írt valamit, ami szabadon fordítva így hangzott: „Várj, férfi vagy vagy nő?" A kérdés furcsának tűnt. Semmi a beszélgetésben nem kapcsolódott a nemhez. Nem volt profilkép-kétértelműség, névbeli zavar sem. A téma adatbázis-struktúra volt. Mégis a másik személy szemszögéből a kérdés tökéletesen értelmes volt.
Az orosz nyelvtani nemekkel rendelkező nyelv. A múlt idejű igék, melléknevek és még bizonyos főnevek is megváltoztatják alakjukat a beszélő nyelvtani nemétől függően. Amikor valaki oroszul azt írja, hogy „csináltam", az ige végződése megmondja az olvasónak, hogy a beszélő férfi vagy nő. A Google Fordító, amely nulla kontextussal dolgozott arról, hogy ki gépel, minden egyes üzenethez nőnemű igealakokat választott. Az orosz olvasó számára pontosan úgy nézett ki, mintha nő írna. A valódi beszélő férfi volt. A fordítónak nem volt módja ezt megtudni, mert senki nem mondta el neki, és soha nem is kérdezte.
Ez nem apró stilisztikai furcsaság volt. A beszélgetés egész hangvétele megváltozott. Az oroszban a nyelvtani nem nem opcionális díszítés. A múlt idejű beszélőre utaló szinte minden mondat szerkezetébe bele van építve. Az „elmentem a boltba" más szót használ attól függően, hogy férfi vagy nő ment. A „fáradt voltam" változik. A „befejeztem a projektet" változik. Minden egyes egyes szám első személyű múlt idejű kijelentés rossz identitást sugárzott az egész beszélgetés során, és az orosz résztvevő egyszerűen feltételezte, hogy a fordító kimenete helyes.
Az a pillanat volt a kiváltó ok. Nem bosszúság egyetlen rossz fordítás miatt, hanem annak felismerése, hogy a bolygó legelterjedtebb fordítóeszköze abszolút semmilyen mechanizmussal nem rendelkezik ahhoz, hogy megtudjon valami olyan alapvetőt, mint a beszélő neme. Nem kérdez. Nem következtet. Választ egy alapértéket és továbbmegy, az olvasóra hagyva, hogy következtetéseket vonjon le, amelyek teljesen tévesek lehetnek. A megoldás nem jobb algoritmus volt. A megoldás a kontextus volt.
🌐AI fordító
Fordíts, fogalmazz át, javíts és magyarázz szövegeket 105+ nyelven. Többcélú fordítás, egyéni kontextusok és kijelölési műveletek.
✓ 105+ nyelv✓ Fordítás, átfogalmazás, javítás✓ Egyéni kontextusok✓ Többcélú
Miért teszi tönkre a nyelvtani nem a gépi fordítást
Az angol olyan nyelv, amely nagyrészt elkerüli a nyelvtani nemet a mindennapi beszédben. Az „I went" az „I went", függetlenül attól, hogy ki beszél. Az „I was happy" nem változik a beszélő személyazonosságától függően. Ez megkönnyíti az angolul beszélők számára, hogy elfelejtsék: a világ legtöbb fő nyelve nem így működik. Az orosz, arab, héber, hindi, francia, spanyol, portugál, német, lengyel, cseh és tucatnyi más nyelv mind különböző mértékben kódolja a nemet a nyelvtanába.
A gépi fordítás problémája egyértelmű. Amikor a forrásszöveg angol, nincsenek nem-jelölők, amelyeket ki lehetne nyerni. Az „I was surprised" mondat nulla információt ad a fordítónak arról, hogy hím- vagy nőnemű alakot használjon a célnyelven.
Ez nem szélsőséges eset. Egyedül az orosznak több mint 250 millió beszélője van. Az arabnak több mint 300 millió. A spanyolnak több mint 500 millió.
A YEB Translate-ban megvalósított megoldás fogalmilag szinte zavarba ejtően egyszerű. A fordítási beállításokban elérhető kontextuskategóriák között az egyik a beszélő neme. Egyszeri beállítása utasítja az AI modellt, hogy a helyes nemi alakokat használja minden kimenetben.
Mit csinálnak valójában a kontextuskategóriák a fordítással
A beszélő neme a tíz kontextuskategória egyike, amelyek alakítják, hogyan készíti az AI a fordításait. A teljes készlet lefedi az iparágat, célközönséget, formalitási szintet, regisztert, hangnemet, célt, szakterminológiát, a beszélő nemét, regionális változatot és témát. Minden kategóriának több lehetősége van. Összesen ez a tíz kategória 117 egyedi opciót tartalmaz.
Ezen felül 22 nyelvi beállítás van 78 opcióval, amelyek az egyes nyelvekre jellemző nyelvi részleteket szabályozzák. Például hogy formális vagy informális megszólítást használjunk-e azokban a nyelvekben, amelyek különbséget tesznek a kettő között.
Mindezek a beállítások egyetlen kontextusláncba tömörülnek, amely minden fordítási kérést kísér. Az AI modell ezt a kontextust olvassa el, mielőtt feldolgozná a forrásszöveget. Az AI szövegfordító oldal konkrét példákon mutatja be, mennyire különbözhetnek a kimenetek.
A beszélgetés, amely majdnem tönkretett egy üzleti kapcsolatot
Visszatérve az eredeti orosz beszélgetéshez, a következmények túlmutattak egy kínos pillanatnál. A másik fél tíz üzenetet töltött azzal, hogy mentális képet építsen arról, kivel beszél, és ez a kép téves volt.
Kötetlen csevegésben ez vicces történet. Üzleti kontextusban valóban káros lehet. Képzeljük el, hogy partneri javaslatot küldünk arabul, ahol az igealakod azt sugallják, hogy a feladó nő, miközben férfi.
Ugyanez az elv vonatkozik az ügyfélszolgálati interakciókra, jogi kommunikációra, orvosi levelezésre és minden olyan helyzetre, ahol a beszélő személyazonossága számít. Egy megfelelő Google Fordító alternatívának kezelnie kell ezt, ami azt jelenti, hogy a felhasználónak kontrollt adunk a kontextus felett.
A nemen túl: a hiányzó kontextus teljes terjedelme
A nyelvtani nem a kontextushiba legláthatóbb példája a fordításban, de korántsem az egyetlen. Gondoljunk a formalitásra. Japánban az udvariasság szintje annyira változhat, hogy ugyanaz a mondat különböző formalitási szinteken fordítva szinte semmilyen szókincset nem oszt meg. A német megkülönbözteti a „du"-t és a „Sie"-t. A francia a „tu"-t és a „vous"-t. A spanyol a „tú"-t és az „usted"-et.
A szakmai zsargon egy másik terület, ahol a kontextus elengedhetetlen. A „protokoll" szó mást jelent az orvostudományban, mást a hálózatokban és megint mást a diplomáciában.
A YEB Translate használati útmutatója lefedi a teljes beállítási folyamatot. A kontextusrendszer az a hiányzó darab, amely az AI-nak megadja az intelligens döntésekhez szükséges információt.
Gyakran ismételt kérdések
Helyesen kezeli a Google Fordító a nyelvtani nemet
A Google Fordító nem kérdezi meg és nem veszi figyelembe a beszélő nemét. Angolról nyelvtani nemmel rendelkező nyelvekre fordítva alapértelmezés szerint azt az alakot választja, amely leggyakrabban fordult elő a tréningadataiban.
Létezik ingyenes AI fordító, amely támogatja a kontextusbeállításokat
YEB Translate használat alapú kreditmodellt alkalmaz előfizetés helyett. Kreditek csak akkor fogynak, amikor szöveget ténylegesen feldolgoznak.
Mi a kontextustudatos fordítás és miért fontos
A kontextustudatos fordítás azt jelenti, hogy az AI modell a fordítás előtt információt kap a beszélőről, a közönségről, az iparágról, a formalitási szintről és más tényezőkről.
Mely nyelvek igényelnek nyelvtani nemet a fordításban
A világ legtöbb széles körben beszélt nyelve használ nyelvtani nemet bizonyos mértékig. Orosz, arab, héber, hindi, francia, spanyol, portugál, olasz, német, lengyel, cseh és sok más.
Helyettesíthetik az AI fordítók az emberi fordítókat nemekkel rendelkező nyelveknél
Az AI fordítók kiváló eredményeket produkálhatnak nemekkel rendelkező nyelveken, ha megfelelő kontextust kapnak.
Melyik a legjobb alternatív alkalmazás a Google Fordítóhoz