Tíz kontextkategória, amely megismertetlenül megváltoztatja a fordítást
Vegyünk egy egyszerű angol mondatot: "We need to close this quickly." Most fordítsuk le németre. Kontextus nélkül egy fordítási eszköz valami generikusat és technikailag helytelen fordítást fog készíteni. Az ige választása semleges lesz, a formalitás valahol középen helyezkedik el, és a hangnem lapos. Most adjunk hozzá kontextust: ez egy jogi csapat, amely szerződés-tárgyalást vitat meg. A német kimenet megváltozik. A "close" egy specifikus jogi kifejezéssé válik az egyezmény megkötésére. A formalitás formális regiszterre vált. Az "quickly" által jelzett sürgősség német jogi nyelvezet segítségével fejeződik ki. Ugyanaz a forrásnyelvi szöveg, teljesen eltérő kimenet.
Most változtassunk meg ismét a kontextuson. Ugyanez a mondat, de ezúttal egy szoftverfejlesztő csapattól származik, amely egy hibajegyet vitat meg. A német fordítás ismét megváltozik. A "close" most az olyan projektmenedzsment-eszközökben használt technikai kifejezésre térképez. A regiszter félig formálisra csökken. A szókincs összhangban van azzal, ahogyan a német fejlesztők ténylegesen beszélnek a standupokon és a Slack-csatornákon. A mondat angolul továbbra is ugyanazt jelenti. A német verziói semmire sem hasonlítanak, és nem is kellene, mert teljesen eltérő helyzeteket írnak le.
Ez a kontextus nélküli fordítás alapvető problémája. A forrásnyelvi szöveg homályos, és a fordító ezt a homályosságot találgatásokkal oldja meg. Néha a találgatás helyes. Gyakran olyan kimenetet hoz létre, amely nyelvtanilag helyes, de szemantikailag rossz, olyan szöveg, amely technikailag a helyes dolgot mondja, de oly módon, ahogy egyetlen anyanyelvi beszélő sem használná azt az adott helyzetben. A YEB Translate tíz kontextkategóriája pontosan azért létezik, hogy kiküszöbölje ezt a találgatást. Mindegyik olyan információt nyújt az AI modellnek, amely szükséges a jobb választásokhoz, és együtt az általános gépi kimenetet olyan szöveggé alakítják, amely úgy hangzik, mintha azt írta volna valaki, aki ténylegesen megérti a helyzetet.
Iparág, közönség és cél
Az első három kategória bármilyen fordítási kontextus alapjaként szolgál. Az iparág azt jelzi az AI modellnek, hogy milyen területhez tartozik a szöveg, amely közvetlenül szabályozza a technikai szókincs kiválasztását. Az olyan szó, mint a "protocol" egy orvosi kontextusban teljesen eltérő szókincscsaládat indít el, mint az "protocol" egy hálózatozási kontextusban vagy egy diplomáciai kontextusban. Az iparág beállítása nélkül az AI azt a jelentést választja, amelyet leggyakrabban látta az edzésadatok között, amely a "protocol" esetében általában az információtechnológiára alapértelmezett. Állítsa az iparágu egészségügyre, és a kimenet automatikusan a helyes orvosi terminológiát használja.
A közönség meghatározza, hogy ki olvassa majd a lefordított szöveget. Az olyan műszaki dokumentum, amely mérnökökhöz szól, más szókincscsalád és más háttérismereteket feltételez, mint ugyanez az információ az fejlesztőcsapat belső specifikációs dokumentumaként. A termékleírás a fogyasztók számára egyszerűbb nyelvezetet és meggyőzőbb keretet használ, mint az fejlesztőcsapat belső specifikációs dokumentuma. A közönség kategória nem módosítja azt, amit elmondanak. Ez módosítja azt, hogy hogyan mondják, hangtalanítva az összetettséget, a szakkifejezés sűrűségét és a feltételezett ismereteket az olvasó várható szintjéhez igazodva.
A cél a szöveg mögött lévő szándékot rögzíti. Ez az informáló tartalom, amely tanítani szándékszik? Persuasív tartalom, amely eladni szándékszik? Útmutatási tartalom, amely útmutatásai szándékszik? Jogi tartalom, amely kötelezni szándékszik? Mindegyik cél különböző nyelvészeti mintákat aktivál a kimenetben. A persuasív szöveg németül más mondatszerkezeteket használ, mint az informáló szöveg. Az olyan jogi francia nyelv, amely teljesen hiányzik a beszélgetési franciából. A cél kategória azt jelzi az AI modellnek, hogy nem csak az, amit a szöveg mond, hanem amit meg akar valósítani, és a kimenet a cél nyelvben tükrözi ezt a szándékot.
Ez a három kategória egyedül drámai módon eltérő kimeneteket hoz létre, ha változik. Az "improving performance" (teljesítményfejlesztés) така mondat, amely az egészségügyi közönséghez való fordítása informáló céllal klinikai, mérlegelő nyelvezetet hoz létre. Ugyanez a mondat a marketing közönséghez való fordítása persuasív céllal dinamikus, előnyösségre összpontosított nyelvezetet hoz létre. Az AI fordító funkcióoldal ezeknek a különbségeknek az egymás melletti példáit mutatja meg mindannak, aki szeretné látni az ellentétet.
Formalitás, regiszter és hangnem
A formalitás talán a legláthatóbb hatású kategória, különösen az olyan nyelvek esetében, amelyek formális és informális beszédrendszerrel rendelkeznek. A formalitás első szintjére való beállítás alkalmi, rövidített kimenetet hoz létre, amely úgy hangzik, mint egy üzenet a barátok között. Az ötödik szintre való beállítás precíz, strukturált kimenetet hoz létre, amely olyan hangzik, mint egy jogi szerződés vagy az hivatalos államigazgatási levelezés. Az olyan útmutató a szakmaias hangzáshoz való átfogalmazásról azt vizsgálja meg, hogy a formalitás hogyan lép kölcsönhatásba az átfogalmazással, de a fordításban a hatás még kifejezettebb, mert sok nyelvnek teljesen külön szókincscsalád és nyelvtani szerkezete van a formalitás különböző szintjein.
A japán a legdramatikusabb példa. A nem hivatalos japán és a formális japán közötti különbség olyan jelentős, hogy egy mondat az első formalitási szinten csak a gyöker igékkel oszthat meg az ötödik szintű ekvivalenst. Mindegyik igéforma vége megváltozik. A számnév vagy a szubsztantivum megváltozik. A részecskék megváltoznak. Az honorifikus előtagok megjelennek vagy eltűnnek. Egy fordítási eszköz, amely nem veszi figyelembe a formalitást a japánban, lényegében véletlenszerű kimenetet készít a formalitási spektrumon, amely azt jelenti, hogy az esetek nagyjából fele nem megfelelően alkalmi lesz egy üzleti kontextushoz, vagy szükségtelenül merev lesz egy baráti beszélgetéshez.
A regiszter a formalitás mellett működik, de nem azonos vele. A regiszter egy adott társadalmi kontextusban használt nyelvészeti változatosságot írja le. Tudományos regiszter, műszaki regiszter, újságírói regiszter, irodalmi regiszter. Mindegyik saját konvencióit követi a mondatszerkezethez, szókincshez és retorikai eszközökhöz. Az olyan szöveg, amely tudományos regiszterben fordított, passzív szerkezeteket, óvatos nyelvezetet és hivatkozásbarát kifejezéseket használ. Ugyanez a szöveg az újságírói regiszterben aktív hangot, rövidebb mondatokat és közvetlen attribúciót használ. A formalitás azt szabályozza, hogy mennyire udvarias vagy alkalmi a szöveg. A regiszter azt szabályozza, hogy milyen típusú szövegnek hangzik.
A hangnem hozzáadja az érzelmi réteget. Semleges, optimista, sürgős, óvatos, empátikus, mérvadó. A hangnem kategória szavakincs választást befolyásol a konnotáció szintjén. Az "The deadline is approaching" (a határidő megközelít) semleges hangnemben lapos marad. Egy sürgős hangnemben a szókincs olyan szavak felé tolódik, amelyek nyomást és sürgősséget közvetítenek. Egy óvatos hangnemben puhábbá, óvatoskodóbbá, diplomáciasibbá válik. A hangnem az a kategória, amely legközvetlenebb hatással van arra, hogy az olvasó hogyan érzi magát a szöveg tekintetében, és ha félresiklódik, egy szimpatikus üzenetnek hidegnek hangozhat, vagy egy szakmai frissítésnek pánikosnak.
Tartomány, nem, változat és tantárgy
A fennmaradó négy kategória olyan specifikus dolgokat kezel, amelyeket az első hat nem tud lefedni. A tartomány terminológia azt szabályozza, hogy az AI mely speciális szókincs-halmazokból merít. Ez szemcsésebb, mint az iparág. Az információtechnológiai iparágban a tartomány felhő-számítástechnika, mobil fejlesztés, kiberbiztonsági vagy adattudományi lehet. Mindegyik saját szakzsargonnal, saját akronimaj konvenciókkal és a saját kifejezéscsaláddal rendelkezik, amely olyan specifikus jelentéssel rendelkezik, amely különbözik a mindennapi használatától.
A beszélő neme, ahogyan az oroszországi nemutasítóban vitatják, olyan nyelvekben szabályozza a nyelvtani nemet, amelyek ezt megkövetelik. Ez nem választható az olyan nyelvek számára, mint az orosz, arab, héber, hindi és sok más, ahol a múlt idő igék és melléknevei a beszélő nemével kell egyezniük. Ennek a kategóriának az egyszer való beállítása biztosítja az konzisztens és helyes nemet jelöléseket az egész kimenetben.
A területi változat azt szabályozza, hogy a célanyelv melyik változatát készítsük. Brit vagy amerikai angol. Brazíliai vagy európai portugál. Egyszerűsített vagy hagyományos kínai. Latin-amerikai vagy Ibériai spanyol. Ez a kategória a 22 nyelvspecifikus beállítással együtt működik, hogy biztosítsa, hogy a kimenet megfelel a szándékolt közönség régiójának konvencióinak, beleértve az helyesírást, szókincsot és idiomatikus kifejezéseket. Az brit vs amerikai angol útmutató ezt részletesen tárgyalja a leggyakrabban kért változat párosítása számára.
A tantárgy a tématerületi kontextust biztosítja, amely segít feloldani a homályosságot. Amikor több kategória egyidejűleg van beállítva, az AI modell egy gazdag kontextus karakterláncot kap, amely minden döntését irányítja a fordítás során. Az összes tíz kategória kombinációja, 117 egyedi opciójával, egy kontextus ujjlenyomatot hoz létre, amely elég specifikus ahhoz, hogy a forditások a konkrét helyzetekre szabottak legyenek az általános közelítések helyett.
Mit jelentenek gyakorlatban a 117 lehetőség
A szám nagynak hangzik, de gyakorlatban a rendszer úgy van kialakítva, hogy a legtöbb felhasználónak csak néhány kategóriát kell beállítania egy adott feladathoz. Az API-dokumentumot fordító fejlesztő az iparágu technológiára, a tartomány szoftverfejlesztésre, a formalitás három szintre, és a regiszter technikai regiszterre állíthatja be. Ez négy beállítás, talán harminc másodperc a konfigurációhoz, és az eredményül kapott fordítások az egész munkamenet során helyes technikai terminológiát, megfelelő formalitást és professzionális regisztert használnak.
A kampány másolatát fordító marketing-szakember az iparágu marketingre, a közönség fogyasztóra, a célt persuazívra, a hangnem optimistára, és a formalitás második szintjére állíthatja be. Öt beállítás, még mindig egy perc alatti konfigurációban, és az munkamenet során minden fordítás tükrözi ezeket a választásokat. Az felhasználási útmutató lépésről lépésre végigvezetett a konfigurációs folyamaton.
A 117 lehetőség a tíz kategóriához nem célja az egyszerre történő alkalmazása. Célja az valódi felhasználók által tapasztalatot szituációk teljes körének lefedésére. Egy jogi fordítónak más opciói vannak szüksége, mint egy közösségi média-managernek. Egy orvosi kutatónak más opciói vannak szüksége, mint egy utazási bloggernek. A rendszer elegendő szemcsésséget biztosít az összes ilyen felhasználási eset kiszolgálásához anélkül, hogy minden felhasználónak meg kellene értenie minden lehetőséget. Állítsa be a kategóriákat, amelyek az adott feladathoz szükségesek, hagyja a többit az alapértelmezetteken, és az AI modell beépíti az összes kontextust, amelyet megkap.
Amit ez alapvetően másnak tesz az általános fordítástól, hogy az AI nem készít egy alapértelmezett fordítást, majd módosítja azt. A kontextus a kimenetből a nagyon kezdettől alakítja. A szavakincs, a mondatszerkezet, a terminológia, a regiszter és a formalitás mind a kontextus alapján vannak meghatározva, mielőtt az fordítás első szava létrehozódna. Ez az oka annak, hogy a kimenet a különböző kontextusbeállításokkal olyan drámai módon eltérőnek tűnhet. Ez nem ugyanaz a fordítás, amely módosítódik. Ez egy másik fordítás, amely a szégen nélkül, egy teljesen eltérő korlátozások szerint keletkezik.
Gyakran Feltett Kérdések
Mi a kontextustudatos gépi fordítás
A kontextustudatos gépi fordítás olyan megközelítés, ahol az AI modell információt kaphat a beszélőről, közönségről, iparágról, formalitási szintről, hangnemről és egyéb tényezőkről a fordítás elkészítése előtt. Ez a kontextus a kimenetben a szavakincsot, nyelvtant és regisztert alakítja, olyan fordításokat hoz létre, amelyek konkrét helyzetekhez vannak szabottak az általános egy-a-mindenki helyett.
Hány kontextusbeállítást biztosít a YEB Translate
A YEB Translate 10 kontextkategóriát biztosít 117 egyedi opciójával, plusz 22 nyelvspecifikus beállítást 78 opciójával. A kategóriák közé tartozik az iparág, közönség, formalitás, regiszter, hangnem, cél, tartomány terminológia, beszélő neme, területi változat és tantárgy. A felhasználók általában 3-5 kategóriát állítanak be munkaülés közben.
Rosszabb fordításokat lehet-e termelni a kontextusbeállítások, ha helytelenül vannak beállítva
A rossz kontextus beállítása a fordítást egy nem megfelelő irányba tolhatja. Például a marketing szöveghez az orvosi iparág kontextusának beállítása olyan klinikai terminológiát vezet be, amely helytelenül hangzik. Azonban az beállítások alapértelmezetteken tartása csak általános kimenetet hoz létre, amely az olyan fordítási eszközök által termeltetésnek felel meg, amely nélkül nem használ kontextust. A nem használt beállítások legrosszabb esete semleges, nem káros.
Van-e kontextusbeállítások ingyenes AI fordító
A YEB Translate a fizetés-per-use jóváírási modellt használja az előfizetés helyett. Az összes kontextkategória minden kérés alapján elérhető a premium rétegek nélkül. A jóváírások csak akkor merülnek fel, ha a szöveg valójában feldolgozódik, és az nem használt jóváírások végtelenül továbbvítődik. Ez megfizethetőbb az előfizetési eszközöknél az olyan alkalmi felhasználók számára, akik továbbra is kontextus-tudatos kimenetre van szükségük.
Hogyan hasonlít össze a kontextustudatos fordítás a DeepL vagy a Google Translate-vel
A DeepL és a Google Translate folyékony kimenetet hoz létre, de minimális vezérlést biztosít a kontextus felett. Egyikük sem biztosít iparág, hangnem, beszélő neme vagy tartomány terminológia beállításait. Az eredmény általános fordítások, amelyek nyelvtanilag helyesek lehetnek, de rossz terminológiát, nem megfelelő formalitást vagy helytelen nemi formákat használhatnak. A kontextustudatos fordítás kitöltse ezeket a szakadékokat azáltal, hogy az AI modellnek az információt biztosítja, amely szükséges a célzott választásokhoz. Az DeepL összehasonlítás ezt részletesen lebontva.
A kontextusbeállítások működnek-e az összes nyelvpárosításhoz
A kontextusbeállítások bármilyen nyelvpárosításra vonatkoznak. Egyes kategóriák hat nyelvekhez hatékonyabbak, mint mások. A beszélő neme legfontosabb az olyan nemi nyelvek számára, mint az orosz és az arab. A formalitás a legerősebb hatással van a japán, koreai és német nyelvekhez. A területi változat kritikus az olyan nyelvek számára, amelyekben vannak nagy dialektusos hasítások, mint a portugál és a kínai. A rendszer az kontextus interpretálódása alapján úgy igazítódik a célanyelv alapján.