Vezmite si jednoduchú anglickú vetu: "We need to close this quickly." Teraz ju preložte do nemčiny. Bez akéhokoľvek kontextu bude nástroj na preklad produkovať niečo generické a technicky správne. Výber slovesa bude neutrálny, formalita bude niekde v strede a tón bude plochý. Teraz pridajte kontext: toto je právny tím diskutujúci o vyjednávaní zmluvy. Nemecký výstup sa zmení. "Close" sa stane špecifickým právnym termínom na uzavretie dohody. Formalita sa zmení na formálny register. Naliehavosť implikovaná "quickly" sa vyjadruje prostredníctvom slovného zásobia, ktoré by skutočne používal nemecký právnik. Rovnaký zdrojový text, úplne odlišný výstup.

Teraz zmeňte kontext znova. Tá istá veta, ale tentoraz pochádza z tímu vývoja softvéru, ktorý diskutuje o zatvorení lístku s chybou. Nemecký preklad sa znova posúva. "Close" sa teraz mapuje na technický termín používaný v nástrojoch na riadenie projektov. Register klesne na poloformal. Slovné zásobie sa zhoduje s tým, ako nemeckí vývojári skutočne hovoria v stand-upoch a Slack kanáloch. Veta v angličtine stále znamená to isté. Nemecké verzie vyzerajú úplne inak a nemali by byť, pretože opisujú úplne odlišné situácie.

Toto je základný problém s prevodom bez kontextu. Zdrojový text je nejedoznačný a prekladateľ túto nejedoznačnosť rieši odhadovaním. Niekedy je odhad správny. Často to produkuje výstup, ktorý je gramaticky správny, ale sémanticky mimo, text, ktorý technicky hovorí správnu vec, ale hovorí to spôsobom, ktorý by nikdy nepoužil žiaden pôvodný hovoriaci v tej konkrétnej situácii. Desať kategórií kontextu v YEB Translate existuje presne na to, aby sa eliminoval tento odhad. Každá z nich poskytuje modelu AI informácie, ktoré potrebuje na lepšie rozhodnutia, a spolu transformujú generické strojové výstupy do textu, ktorý sa javí tak, ako keby bol napísaný niekým, kto skutočne rozumie situácii.

Odvetvie, publikum a účel

Prvé tri kategórie tvoria základ akéhokoľvek kontextu prekladu. Odvetvie hovorí modelu, do akej oblasti text patrí, čo priamo kontroluje výber technickej terminológie. Slovo ako "protocol" v medicínskom kontexte spúšťa úplne odlišné slovné zásobie ako "protocol" v sieťovom kontexte alebo diplomatickom kontexte. Bez nastavenia odvetvia model vyberie to, ktoré má v trénovacích údajoch najpočastnejšie, čo pre "protocol" zvyčajne štandardne vyberie technológiu. Nastavte odvetvie na zdravotníctvo a výstup automaticky použije správnu medicínsku terminológiu.

Publikum špecifikuje, kto bude preložený text čítať. Technický dokument určený inžinierom používa odlišné slovné zásobie a predpokladá iné základné znalosti ako tie isté informácie napísané pre všeobecné publikum. Popis produktu pre spotrebiteľov používa jednoduchší jazyk a presvedčavejšie rámce ako interný špecifikačný dokument pre vývojársky tím. Kategória publika nemení to, čo sa hovorí. Mení to, ako sa to hovorí, prispôsobovaniu komplexnosti, hustote žargónu a predpokladanej úrovni vedomostí očakávanej úrovni čitateľa.

Účel zachytáva úmysel za textom. Je toto informatívny obsah určený na vzdelávanie? Presvedčavý obsah určený na predaj? Poučný obsah určený na vedenie? Právny obsah určený na viazanie? Každý účel aktivuje rozdielne jazykové vzory vo výstupe. Presvedčavý text v nemčine používa odlišné vetné štruktúry ako informatívny text. Právne francúzštiny dodržiavajú konvencie, ktoré sú úplne neprítomné v konverzačnej francúzštine. Kategória účelu hovorí modelu nielen to, čo text hovorí, ale aj to, čo sa snaží dosiahnuť, a výstup odráža túto úmysel v cieľovom jazyku.

Tieto tri kategórie samy osebe produkujú dramaticky odlišné výstupy, keď sa zmenia. Veta o "zlepšovaní výkonnosti" preložená pre zdravotnícke publikum s informatívnym účelom generuje klinický, vyvážený jazyk. Tá istá veta preložená pre marketingové publikum s presvedčavým účelom generuje dynamický, orientovaný na výhody jazyk. Funkcia stránka nástroja AI prekladateľa ukazuje vedľa seba príklady týchto rozdielov pre každého, kto chce vidieť kontrast z prvej ruky.

Formalita, register a tón

Formalita je možno najvýraznejšia kategória, najmä pre jazyky s formálnymi a neformálnymi systémami adresovania. Nastavenie formality na úroveň jeden produkuje príležitostný, skrátený výstup, ktorý sa javí ako textová správa medzi priateľmi. Nastavenie na úroveň päť produkuje presný, štruktúrovaný výstup, ktorý sa javí ako právna zmluva alebo úradný vládny spis. Sprievodca o prepísaní profesionality skúma, ako formalita interaguje s preformulovaním, ale pri preklade je efekt ešte výraznější, pretože mnohé jazyky majú úplne separátne slovné zásobie a gramatické štruktúry pre rôzne úrovne formality.

Japončina je najdramatickejší príklad. Rozdiel medzi príležitostnou japončinou a formálnou japončinou je taký významný, že veta na úrovni formality jedna by mohla zdieľať iba koreňové slovesá so svojím ekvivalentom úrovne päť. Každé slovesné skončenie sa zmení. Zámená sa zmenia. Čiastice sa zmenia. Počestniacke predpony sa objavia alebo zmiznú. Nástroj na preklad, ktorý nezohľadňuje formalitu v japončine, v podstate produkuje náhodné výstupy na spektre formality, čo znamená, že zhruba v polovici prípadov bude výsledok nevhodne príležitostný v obchodnom kontexte alebo zbytočne stuhnutý v priateľskej konverzácii.

Register funguje paralelne s formality, ale nie je jej identický. Register popisuje jazykovú odrodu používanú v špecifickom sociálnom kontexte. Akademický register, technický register, novinársky register, literárny register. Každá má svoje konvencie pre vetné štruktúry, slovné zásobie a rétorické zariadenia. Text preložený v akademickom registri používa pasívne konštrukcie, vetu zmierňujúce jazykovú prípady a frázovanie prívečné citáciám. Rovnaký text v novinárskom registri používa aktívny hlas, kratšie vety a priamu atribúciu. Formalita kontroluje, ako zdvorilosť alebo príležitosť zvuk text. Register kontroluje, aký druh textu to znie.

Tón pridáva emočnú vrstvu. Neutrálny, optimistický, naliehavý, opatrný, empatický, autoritatívny. Kategória tónu ovplyvňuje výber slova na úrovni konotácie. "The deadline is approaching" v neutrálnom tóne zostáva plochý. V naliehavom tóne sa slovné zásobie posúva k slovám, ktoré sprostredkovávajú tlak a bezprostrednosť. V opatrnom tóne sa stáva mäkšie, vyhradené, viac diplomatické. Tón je kategória, ktorá najdirektnejšie ovplyvňuje, ako sa čitateľ cítia k textu, a získavanie ho nesprávne môže urobiť súcitný odkaz znej studenému alebo profesionálnu aktualizáciu pánu panického.

Doména, pohlavie, variant a predmet

Zostávajúce štyri kategórie riešia špecifiká, ktoré prvé šesť nemôžu pokryť. Terminológia domény kontroluje, z ktorej sady špecializovaného slovného zásobia model čerpá. Toto je viac granulárne ako odvetvie. V technologickom odvetví by doména mohla byť cloud computing, mobilný vývoj, kybernetická bezpečnosť alebo veda o údajoch. Každá má svoju žargón, své vlastné konvencie akronymov a svoj vlastný súbor termínov, ktoré majú špecifické značenia odlišné od ich každodenného použitia.

Pohlavie hovoriaceho, ako je diskutované v sprievodcovi pohlavím ruštiny, kontroluje gramatické pohlavie v jazykoch, ktoré si to vyžadujú. Toto nie je voliteľné pre jazyky ako ruština, arabčina, hebrejčina, hindčina a mnohé ďalšie, kde sa minulosť slovesá a prídavné mená musia zhodovať s pohlavím hovoriacého. Nastavenie tejto kategórie raz zabezpečí konzistentnú a správnu pohlavie značky v celom výstupe.

Regionálny variant kontroluje, ktorá verzia cieľového jazyka bude vyprodukovaná. Britská alebo americká angličtina. Brazílska alebo európska portugalčina. Zjednodušená alebo tradičná čínština. Latinoamerická alebo pyrenejská španielčina. Táto kategória funguje s 22 jazykovo špecifickými nastaveniami, aby sa zabezpečilo, že výstup zodpovedá konvenčným úmluvm určitého regiónu cieľového publika vrátane pravopisu, slovného zásobia a idiomatických výrazov. Sprievodca britská vs americká angličtina sa týka tejto problematiky podrobne pre najčastejšie požadovanú variantnú dvojicu.

Predmet poskytuje tematický kontext, ktorý pomáha vyriešiť nejedoznačnosť. Keď sú nastavené všetky kategórie súčasne, model AI dostane bohatý kontextový reťazec, ktorý riadi každé rozhodnutie, ktoré robí počas prekladu. Kombinácia všetkých desiatich kategórií s ich 117 jednotlivými možnosťami vytvárajú kontextový odtlačok prstov, ktorý je dosť špecifický na to, aby sa vytvárali preklady prispôsobené presným situáciám, a nie generické aproximácie.

Čo 117 možností v praxi skutočne znamená

Číslo znie veľké, ale v praxi je systém navrhnutý tak, aby väčšina používateľov musela nastaviť iba niekoľko kategórií na akúkoľvek danú úlohu. Vývojár prekladajúci dokumentáciu API by mohol nastaviť odvetvie na technológiu, doménu na vývoj softvéru, formalitu na úroveň tri a register na technický. To sú štyri nastavenia, možno tridsa sekúnd konfigurácie, a výsledné preklady používajú správnu technickú terminológiu, príslušnú formalitu a profesionálny register v celej relácii.

Marketingový profesionál prekladajúci kampanný kópiu by mohol nastaviť odvetvie na marketing, publikum na spotrebiteľov, účel na presvedčavý, tón na optimistický a formalitu na úroveň dva. Päť nastavení, stále nižšie ako minútu konfigurácie, a každý preklad v relácii odráža tieto voľby. Sprievodca sprievodcom používaní prechádzajú procesom konfigurácie krok za krokom.

117 možností naprieč desiatimi kategóriami nie je určené na to, aby sa všetko používalo súčasne. Sú určené na pokrytie celého rozsahu situácií, s ktorými sa stretávajú skutoční používatelia. Právny prekladateľ potrebuje iné možnosti ako manager sociálnych médií. Zdravotnícky výskumný pracovník potrebuje iné možnosti ako cestovný blogger. Systém poskytuje dostatočnú granularitu na to, aby slúžil všetkým týmto prípadom bez toho, aby od každého používateľa požadoval, aby pochopil každú možnosť. Nastavte kategórie, ktoré sú dôležité pre danú úlohu, nechajte zvyšok v predvolenom nastavení, a model AI začlení všetok kontext, ktorý dostane.

To, čo to robí zásadne odlišným od generického prekladu, je to, že model neprodukovať默认 preklad a potom ho upraviť. Kontext formuje výstup od samého začiatku. Výber slov, vetná štruktúra, terminológia, register a formalita sú všetko určené kontextom pred tým, ako je vygenerované prvé slovo prekladu. Toto je dôvod, prečo može výstup vyzerať tak dramaticky inak s rôznymi nastaveniami kontextu. Nie je to rovnaký preklad prispôsobovaný. Ide o iný preklad vytváraný od nuly, vedený úplne inému súboru obmedzení.

Často kladené otázky

Čo je kontextové uvedomenie strojového prekladu

Kontextové uvedomenie strojového prekladu je prístup, v ktorom model AI dostane informácie o hovoriaceho, publiku, odvetví, úrovni formality, tóne a ďalších faktoroch pred vytvorením prekladu. Tento kontext formuje výber slova, gramatiku a register vo výstupe, čím produkuje preklady prispôsobené špecifickým situáciám, a nie generické všeobecné výsledky.

Koľko kontextových nastavení ponúka YEB Translate

YEB Translate poskytuje 10 kontextových kategórií so 117 jednotlivými možnosťami, plus 22 jazykovo špecifických nastavení s 78 možnosťami. Kategórie zahŕňajú odvetvie, publikum, formalitu, register, tón, účel, terminológiu domény, pohlavie hovoriacich, regionálny variant a predmet. Používatelia zvyčajne nastavujú 3 až 5 kategórií na reláciu.

Môžu nastavenia kontextu produkovať horší preklad, ak sú nastavené nesprávne

Nastavenie nesprávneho kontextu môže zatlačiť preklad v nevhodnom smere. Napríklad nastavenie zdravotníckeho odvetvia kontext na marketingovom texte zavádza klinickú terminológiu, ktorá sa javí mimo miesta. Avšak opustenie nastavení v predvolenom nastavení jednoducho produkuje generický výstup, čo je ekvivalentné tomu, čo iné nástroje na preklad produkujú bez akéhokoľvek kontextu. Najhorší prípad nepoužitých nastavení je neutrálny, nie škodlivý.

Existuje bezplatný AI prekladateľ s nastaveniami kontextu

YEB Translate používa model s platbou za použitie, a nie predplateným modelom. Všetky kategórie kontextu sú dostupné na každej požiadavke bez prémiových úrovní. Kredity sa spotrebúvajú iba v prípade, keď sa text skutočne spracuje, a nepoužité kredity sa neurčitejšie prenášajú dopredu. Toto je cenovo dostupnejšie ako nástroje s predplatným pre príležitostných používateľov, ktorí stále potrebujú kontextové uvedomenie výstup.

Ako sa kontextové uvedomenie prekladu porovnáva s DeepL alebo Google Translate

DeepL a Google Translate produkujú plynulý výstup, ale ponúkajú minimálnu kontrolu nad kontextom. Ani jeden neposkytuje nastavenia pre odvetvie, tón, pohlavie hovoriacich alebo terminológiu domény. Výsledok sú generické preklady, ktoré sú gramaticky správne, ale môžu používať nesprávnu terminológiu, nevhodnú formalitu alebo nesprávne pohlavie formuláre. Kontextové uvedomenie prekladu vyplní tieto medzery poskytnutím modelu AI informácií, ktoré potrebuje na vykonávanie zameraných volieb. Porovnanie DeepL porovnanie toto rozpisuje podrobne.

Fungujú nastavenia kontextu pre všetky jazykové páry

Nastavenia kontextu sa vzťahujú na akýkoľvek jazykový pár. Niektoré kategórie sú pre určité jazyky vplyvnejšie ako iné. Pohlavie hovoriacich je najdôležitejšie pre jazyky pohlavie ako ruština a arabčina. Formalita má najsilnejší efekt v japončine, kórejčine a nemčine. Regionálny variant je kritický pre jazyky s veľkými dialektálnymi rozdeleniami ako portugalčina a čínština. Systém upravuje svoju kontextovú interpretáciu na základe cieľového jazyka.