Merrni një fjali të thjeshtë në anglisht: "We need to close this quickly." Tani përkthejeni në gjermanisht. Pa asnjë kontekst, një mjet përkthimi do të prodhojë diçka të përgjithshme dhe teknikisht të saktë. Zgjedhja e fjalës do të jetë neutrale, formaliteti do të jetë diku në mes, dhe toni do të jetë i sheshtë. Tani shtoni kontekstin: ky është një ekip ligjor që diskuton për negocimin e një kontrate. Dalja në gjermanisht ndryshon. "Close" bëhet një term i veçantë ligjor për përfundimin e një marrëveshjeje. Formaliteti zhvendoset në regjistrin zyrtar. Urgjenca e nënkuptuar nga "quickly" shprehet përmes fjalorive që një jurist gjerman do të përdorte në të vërtetë. I njëjti tekst burimor, dalje plotësisht e ndryshme.

Tani ndryshoni kontekstin përsëri. I njëjta fjali, por këtë herë vjen nga një ekip zhvillimi softuerit që diskuton për mbylljen e një kartele defekti. Përkthimi në gjermanisht zhvendoset përsëri. "Close" tani harton në termin teknik të përdorur në mjetet e menaxhimit të projekteve. Regjistri bie në gjysmë-zyrtar. Fjaloriu rreshtohet me atë se si zhvilluesi gjermanik flet në standupe dhe kanalet e Slack-ut. Fjalia aktualisht do të thotë e njëjta gjë në anglisht. Versionet gjermane të saj duken aspak të ngjashme, dhe nuk duhet të duken, sepse ato përshkruajnë situata plotësisht të ndryshme.

Ky është problemi themelor me përkthimin pa kontekst. Teksti burimor është i paqartë, dhe përkthyesi zgjidh atë paqartësi me hamendje. Ndonjëherë hamendje është e duhur. Shpesh prodhon dalje që është gramatikisht e saktë, por semantikisht e pasaktë, tekst që teknikisht thotë gjënë e duhur, por e thotë atë në një mënyrë që asnjë folës nativo nuk do të përdorte kurrë në atë situatë të veçantë. Dhjetë kategoritë konteksti në YEB Translate ekzistojnë posaçërisht për të eleminuar këtë hamendjesje. Secila jep modelit AI informacionin që ka nevojë për të marrë vendime më të mira, dhe së bashku transformojnë daljen gjenerike të makines në tekst që lexohet sikur të ishte shkruar nga dikush që në të vërtetë e kupton situatën.

Industria, Audiencat dhe Qëllimi

Tri kategoritë e para formojnë themelin e çdo konteksti përkthimi. Industria tregon modelit se në cilin fushë përket teksti, e cila direktisht kontroller zgjedhjen e fjalorit teknik. Një fjalë si "protocol" në kontekstin mjekësor shkakton fjalorin plotësisht të ndryshëm se "protocol" në kontekstin e rrjetezimit ose në kontekstin diplomatik. Pa cilësimin e industrisë, modeli zgjedh cilin sens ka parë më shpesh në të dhënat e trajnimit, e cila për "protocol" zakonisht parazgjedh teknologjinë. Vendosni industrinë në shëndetësi, dhe dalja përdor terminologjinë mjekësore të saktë automatikisht.

Audiencat specifikojnë se kush do të lexojë tekstin e përkthyer. Një dokument teknik i caktuar për inxhinier përdor fjalorin e ndryshëm dhe supozon njohuritë e ndryshme të sfondit sesa i njëjti informacion i shkruar për audiencat e përgjithshme. Një përshkrim produkti për konsumatorët përdor gjuhën më të thjeshtë dhe kornizim më të bindshëm sesa një dokument i brendshëm i specifikimit për ekipin e zhvillimit. Kategoria e audiencat nuk ndryshon atë që thuhet. Ajo ndryshon se si thuhet, duke përshtatur kompleksitetin, dendësinë e argovës, dhe njohuritë e supozuara për të përputhur nivelin e pritur të lexuesit.

Qëllimi kap qëllimin prapa tekstit. A është ky përmbajtje informative e synuar për të arsimuar? Përmbajtje bindëse e synuar për të shitur? Përmbajtje instruksionale e synuar për të udhëzuar? Përmbajtje ligjore e synuar për të lidhur? Çdo qëllim aktivizon modele të ndryshme gjuhësore në dalje. Teksti bindës në gjermanisht përdor struktura të ndryshme fjalie sesa teksti informativ. Frengjishtja ligjore ndjek konventa që janë plotësisht mungesa në frenchishten e bisedës. Kategoria e qëllimit e tregon modelit jo vetëm atë që thotë teksti, por atë që ai po përpiqet të arrijë, dhe dalja pasqyron atë qëllim në gjuhën e synuar.

Këto tre kategori vetëm prodhojnë daljet dramatikisht të ndryshme kur ndryshojnë. Një fjali për "zëndësimin e performancës" e përkthyer për një audiencat e shëndetësisë me një qëllim informativ gjeneron gjuhën klinike, të matur. I njëjta fjali e përkthyer për audiencat e marrketimit me një qëllim bindës gjeneron gjuhën dinamike, të përqendruar në përfitime. Faqja e veçorit të përkthyesit AI tregon shembuj të këtyre ndryshimeve anash për cilindo që dëshira të shohë kontrastin në të parën dorën.

Formaliteti, Regjistri dhe Toni

Formaliteti është ndoshta kategoria më menjëherë ndikimi, veçanërisht për gjuhët me sisteme zyrare dhe joformale të adresimit. Vendosja e formalitetit në nivelin një prodhon dalje njëmend të shpejtë, të shkurtuar që lexohet si një mesazh teksti ndërmjet miqve. Vendosja e tij në nivelin pesë prodhon dalje të saktë, të strukturuar që lexohet si një kontratë ligjore ose korrespondencë zyrare qeveritare. Udhëzuesi mbi riformulimin për profesionalizmin eksploron se si formaliteti ndërvepron me ripërmbledhjen, por në përkthim, efekti është edhe më i theksuar sepse shumë gjuhë kanë struktura plotësisht të ndryshme fjalorike dhe gramatikore për nivele të ndryshme formaliteti.

Japonishtja është shembulli më dramatik. Ndryshimi ndërmjet japoneses dhe japoneses formale është kaq domethënës që një fjali në nivelin e formalitetit një mund të ndarë vetëm rrënjët e foljes me ekuivalentin e tij të nivelit pesë. Çdo përfundim i folje ndryshon. Zëvendësimet ndryshojnë. Grimcat ndryshojnë. Parashtesa honorifike shfaqen ose zhduken. Një mjet përkthimi që nuk llogarit formalitetin në japonisht esenciaalisht prodhon dalje të rastit në spektrin e formalitetit, e cila do të thotë përafërsisht gjysma e kohës rezultati do të jetë në mënyrë të papërshtatshme njëmend për një kontekst biznesi ose pasionisht i ngurtë për një bisedë miqësore.

Regjistri vepron krahas formalitetit, por nuk është identik me atë. Regjistri përshkruan varietetin gjuhësor të përdorur në kontekst të veçantë shoqëror. Regjistri akademik, regjistri teknik, regjistri gazetaresk, regjistri letrar. Secila ka konventat e veta për strukturën e fjalive, fjalorin, dhe pajisjet rhetorike. Një tekst i përkthyer në regjistrin akademik përdor konstruksionet pasive, gjuhën hedging, dhe formulimin të miqësisht për citime. I njëjti tekst në regjistrin gazetaresk përdor zërin aktiv, fjali më të shkurta, dhe atribujimin e drejtpërdrejtë. Formaliteti kontrollon sa kohezive ose njëmend duket teksti. Regjistri kontrollon se çfarë lloji i tekstit duhet të duket.

Toni shton shtresën emocionale. Neutral, optimist, urgjent, i kujdesshëm, empatik, autoritar. Kategoria e tonit ndikon zgjedhjen e fjalës në nivelin e konnotacion. "The deadline is approaching" në një ton neutral mbetet i sheshtë. Në një ton urgjent, fjaloriu zhvendoset drejt fjalëve që përcjellnin presion dhe menjëherë. Në një ton të kujdesshëm, ajo bëhet më e butë, hedging, më diplomatike. Toni është kategoria që më drejtpërdrejtë ndikon se si lexuesi ndjehet për tekstin, dhe ta gabim atë mund ta bëjë një mesazh simpatik të tingëllojë i ftohtë ose një përditësim profesional të duket në panik.

Domeni, Gjinia, Varianti dhe Subjekti i Lëndës

Katër kategoritë e mbetura trajtonin specifikë që gjashtë e para nuk mund ta mbulojnë. Terminologjia e domenës kontrollon se cili grup fjalorit i specializuar modeli nxirret. Ky është më granular se industria. Brenda industrisë së teknologjisë, domeni mund të jetë kompjuteri në re, zhvillim mobile, kibersiguria, ose shkencat e të dhënave. Secila ka argovën e vete, konventat e akronimit të vete, dhe një grup i termash që kanë kuptime të veçanta të ndryshme nga përdorimi i tyre i përditshëm.

Gjinia e folësit, siç diskutohet në Udhëzuesin e gjinisë në rusisht, kontrollon gjinitë gramatikore në gjuhë që kërkojnë atë. Kjo nuk është opsionale për gjuhë si rusishte, arabe, hebraike, hinde, dhe shumë të tjera ku mbishenjat e kohës së kaluar dhe përshkrimet duhet të pajtoheshin me gjinitë e folësit. Vendosja e këtyre kategorisë një herë siguron shënjesat e konsistenta dhe të sakta të gjinisë gjatë të gjithë prodhimit.

Varianti rajonal kontrollon se cili version i gjuhës së synuar të prodhojë. Anglezi britanik ose amerikan. Portugalia braziliane ose europiane. Kinez i thjeshtuar ose tradicional. Spanjolia e Amerikës Latine ose të Paninzulës. Kjo kategori funksionon me 22 cilësimet specifike të gjuhës për të siguruar që dalja përputhet me konventat e audiencat të synuara të rajonit, përfshirë drejtshkrimin, fjalorin, dhe shprehjet idiomatike. Udhëzuesi britanik vs amerikan në anglisht mbuloni këtë në detaj për palën e ndryshores më të kërkuar zakonisht.

Subjekti i lëndës jep kontekstin tematik që ndihmon për të zgjidhur paqartësinë. Kur vendoset cilësimet e shumta njëkohësisht, modeli AI merr një varg konteksti të pasur që udhëzon çdo vendim që ai merr gjatë përkthimit. Kombinimi i të dhjetë kategorive, me 117 opsionet individuale të tyre, krijon një shtypje të kontekstit që është e caktuar mjaftueshëm për të prodhuar përkthime të përshtatura për situata të sakta sesa përafrime gjenerike.

Çfarë 117 Opsione Aktualisht Do Të Thotë Në Praktikë

Numri duket i madh, por në praktikë sistemi është projektuar në mënyrë që shumica e përdoruesve vetëm kanë nevojë për të vendosur disa kategori për çdo detyrë. Një zhvillues që përkthyen dokumentacionin e API-t mund të vendosë industrinë në teknologji, domenë në zhvillim softuerik, formaliteti në nivelin tre, dhe regjistrin në teknik. Katër cilësime, ndoshta tridhjetë sekonda të konfigurimit, dhe përkthimet që rezulton përdorin terminologjinë e saktë të teknologjisë, formalitetin e përshtatshëm, dhe regjistrin profesional gjatë i gjithë seancës.

Një profesional i marrketimit që përkthyen kopjen e fushatës mund të vendosë industrinë në marrketim, audiencat në konsumator, qëllimin në bindës, tonin në optimist, dhe formalitetin në nivelin dy. Pesë cilësime, aktualisht ende nën një minutë të konfigurimit, dhe çdo përkthim në seancën pasqyron ato zgjedhje. Udhëzuesi i përdorimit shkon përmes procesit të konfigurimit hap pas hapi.

Opsionet 117 në dhjetë kategori nuk janë synuar për të gjithë të përdoret njëkohësisht. Ata janë synuar për të mbuluar diapazonin e plotë të situatave që përdorues të vërtetë përballojnë. Një përkthyes ligjor ka nevojë për opsione të ndryshme sesa një menaxher i mediave shoqërore. Një hulumtues mjekësor ka nevojë për opsione të ndryshme sesa një blogger i udhëtimit. Sistemi jep granularitetin e mjaftueshëm për të shërbyer të gjitha këtyre rasteve të përdorimit pa kërkuar çdo përdorues për të kuptuar çdo opsion. Vendosni kategoritë që kanë rëndësi për detyrën në dorën, lini të tjera në parazgjedhjet e tyre, dhe modeli AI përfshin cilado kontekst që merr.

Ajo që bën këtë në mënyrë fundamentale të ndryshme nga përkthimi gjenerik është se modeli nuk prodhon një përkthim parazgjedhjeje dhe pastaj e rregullon atë. Konteksti formon daljen nga shumë në fillim. Zgjedhja e fjalës, struktura e fjalive, terminologjia, regjistri, dhe formaliteti përfundohen të gjithë nga konteksti përpara fjalës e parë e përkthimit është gjeneruar. Kjo është pse dalja mund të duket kaq dramatikisht e ndryshme me cilësime të ndryshme të kontekstit. Nuk është e njëjta përkthim që rregullohet. Ajo është një përkthim i ndryshëm që gjenerohet mbi të tjera, udhëzuar nga një grup plotësisht të ndryshme të kufizimeve.

Pyetjet e Shpeshta

Çfarë është përkthimi i makines ndërgjegjës ndaj kontekstit

Përkthimi i makines ndërgjegjës ndaj kontekstit është një qasje ku modeli AI merr informacion për folësin, audiencat, industrinë, nivelin e formalitetit, tonin, dhe faktorë të tjerë përpara se të gjenerojë përkthimin. Ky kontekst formon zgjedhjen e fjalës, gramatikën, dhe regjistrin në dalje, duke prodhuar përkthime të përshtatura për situata të veçanta sesa rezultate të përgjithshme një-madhësia-përshtat-të-gjithë.

Sa cilësimet e kontekstit bën YEB Translate t'i ofrojë

YEB Translate jep 10 kategoritë konteksti me 117 opsione individuale, plus 22 cilësimet specifike të gjuhës me 78 opsione. Kategoritë përfshijnë industrinë, audiencat, formalitetin, regjistrin, tonin, qëllimin, terminologjinë e domenës, gjinitë e folësit, variatin rajonale, dhe subjektin e lëndës. Përdoruesit zakonisht vendosin 3 deri në 5 kategori për seancë.

A mund të cilësimet e kontekstit të prodhojnë përkthime më të këqija nëse vendosen në mënyrë të pasaktë

Vendosja e kontekstit të pasaktë mund ta shtyjë përkthimin në një drejtim të papërshtatshëm. Për shembull, vendosja e kontekstit të industrisë medicale për një tekst marrketimi do të fusin terminologjinë klinike që ndjehet jashtë vendi. Megjithatë, lënia e cilësimeve në parazgjedhjet e tyre thjesht prodhon dalje gjenerike, e cila është ekuivalente me atë që mjete të tjera të përkthimit të prodhojnë pa asnjë kontekst. Rasti më i keq për cilësimet e papërdorura është neutral, jo i dëmshëm.

A ka një përkthyese AI të lirë me cilësimet e kontekstit

YEB Translate përdor një model krediti me pagesë-për-përdorim sesa një abonime. Të gjitha kategoritë e kontekstit janë k në dispozicion në çdo kërkesë pa nivelit premium. Krediti konsumohen vetëm kur teksti përkuq përkthehet, dhe kredite e papërdorura mbajnë përpara pafundësisht. Kjo e bën atë më të përballueshëm sesa mjete të abonimit për përdorues të rastit që aktualisht kanë nevojë për dalje të ndërgjegjës ndaj kontekstit.

Si përkthimi i ndërgjegjës ndaj kontekstit krahasohej me DeepL ose Google Translate

DeepL dhe Google Translate prodhojnë dalje të rrjedhshme, por ofrojnë kontroll minimal mbi kontekstin. Asnjëra nuk jep cilësimet për industrinë, tonin, gjinitë e folësit, ose terminologjinë e domenës. Rezultati është përkthime gjenerike që janë gramatikisht të saktë, por mund të përdorin terminologji të pasaktë, formaliteti i papërshtatshëm, ose forma gjerësinëse të pasaktë. Përkthimi i ndërgjegjës ndaj kontekstit plotëson këto boshllëqe duke e dhënë modelit AI informacionin që ka nevojë për të marrë zgjedhje të synuara. Krahasimi DeepL e zbërthen këtë në detaj.

A bëjnë cilësimet e kontekstit punë për të gjitha çiftet e gjuhëve

Cilësimet e kontekstit zbatohen për çdo pairr gjuhe. Disa kategori janë më ndikimi për disa gjuhë sesa të tjera. Gjinia e folësit më rëndësi për gjuhë të gjinisur si rusishte dhe arabe. Formaliteti ka efektin më të fortë në japonisht, koreanisht, dhe gjermanisht. Varianti rajonal është kritik për gjuhë me ndaja dialektale të mëdha si portugalia dhe kinezi. Sistemi përshtatet interpretacion i kontekstit të tij bazuar në gjuhën e synuar.