Ti kontekstkategorier som endrer en oversettelse totalt

Ta en enkel engelsk setning: "We need to close this quickly." Oversett den til tysk. Uten noen kontekst, vil et oversettelsesverktøy produsere noe generisk og teknisk korrekt. Verbvalget vil være nøytralt, formaliteten vil være et sted i midten, og tonen vil være flat. Legg nå til kontekst: dette er et juridisk team som diskuterer forhandlinger om en kontrakt. Det tyske resultatet endres. "Close" blir et spesifikt juridisk begrep for å avslutte en avtale. Formaliteten skifter til formelt register. Hastigheten som antydes av "quickly" uttrykkes gjennom ordforråd som en tysk advokat faktisk ville bruke. Samme kildetekst, helt annerledes resultat.

Endre nå konteksten igjen. Samme setning, men denne gangen kommer den fra et programvareutviklingsteam som diskuterer lukking av en feilrapport. Den tyske oversettelsen skifter igjen. "Close" kartlegges nå til det tekniske begrepet som brukes i prosjektstyringsverktøy. Registeret faller til semi-formelt. Ordforrådet justeres til hvordan tyske utviklere faktisk snakker i standups og Slack-kanaler. Setningen betyr fortsatt det samme på engelsk. De tyske versjonene ser ikke ut til å ligne hverandre i det hele tatt, og det burde de ikke, fordi de beskriver helt forskjellige situasjoner.

Dette er kjerneproblemmet med kontekstfri oversettelse. Kildeteksten er tvetydig, og oversettelsen løser denne tvetydigheten ved å gjette. Noen ganger er gjetningen riktig. Ofte produserer den resultat som er grammatikalsk korrekt, men semantisk feil, tekst som teknisk sett sier det riktige, men sier det på en måte som ingen morsmålstalende ville noen gang bruke i den aktuelle situasjonen. De ti kontekstkategoriene i YEB Translate eksisterer spesifikt for å eliminere dette gjetteriet. Hver enkelt gir AI-modellen informasjonen den trenger for å ta bedre valg, og sammen transformerer de generisk maskinell utgang til tekst som leses som om den var skrevet av noen som faktisk forstår situasjonen.

Industri, publikum og formål

De tre første kategoriene danner grunnlaget for enhver oversettelseskontekst. Industri forteller modellen hvilket felt teksten tilhører, som direkte kontrollerer valg av teknisk ordforråd. Et ord som "protokoll" i en medisinsk sammenheng utløser helt annerledes ordforråd enn "protokoll" i en nettverkskontekst eller en diplomatisk kontekst. Uten industriinnstillingen velger modellen hvilken betydning som helst som den har sett oftest i treningsdata, som for "protokoll" vanligvis er standard for teknologi. Still inn industrien til helsevesen, og resultatet bruker den korrekte medisinske terminologien automatisk.

Publikum spesifiserer hvem som vil lese den oversatte teksten. Et teknisk dokument rettet mot ingeniører bruker annet ordforråd og antar annen bakgrunnskunnskap enn den samme informasjonen skrevet for et generelt publikum. En produktbeskrivelse for forbrukere bruker enklere språk og mer overbevisende framing enn et internt spesifikasjonsdokument for utviklingsteamet. Publikumskategorien endrer ikke det som sies. Det endrer hvordan det sies, justerer kompleksitet, jargontetthet og antatt kunnskap for å samsvare med forventet nivå for leseren.

Formål fanger intensjonen bak teksten. Er dette informativt innhold ment for å utdanne? Overbevisende innhold ment for å selge? Instruksjonalt innhold ment for å guide? Juridisk innhold ment for å binde? Hvert formål aktiverer andre språkmønster i resultatet. Overbevisende tekst på tysk bruker andre setningsstrukturer enn informativ tekst. Juridisk fransk følger konvensjoner som er helt fraværende fra samtalespråk. Formålskategorien forteller modellen ikke bare hva teksten sier, men hva den forsøker å oppnå, og resultatet gjenspeiler denne intensjonen på målspråket.

Disse tre kategoriene alene produserer dramatisk forskjellige resultater når de varieres. En setning om "forbedring av ytelse" oversatt for et helsepublikum med et informativt formål genererer klinisk, målt språk. Den samme setningen oversatt for et markedsføringspublikum med et overbevisende formål genererer dynamisk, fordelsfokusert språk. Siden AI-oversetterfunksjonen viser side-ved-side eksempler på disse forskjellene for alle som ønsker å se kontrastene med egne øyne.

Formalitet, register og tone

Formalitet er kanskje den mest umiddelbar påvirkningskategorien, spesielt for språk med formelle og uformelle adresseringssystemer. Å sette formalitet til nivå en produserer casual, forkortet utgang som leses som en tekstmelding mellom venner. Å sette den til nivå fem produserer presis, strukturert utgang som leses som en juridisk kontrakt eller offisiell offentlig korrespondanse. Guiden om omformulering for profesjonalisme utforsker hvordan formalitet samhandler med omformulering, men i oversettelse er effekten enda mer uttalte fordi mange språk har helt separate ordforråd og grammatikalske strukturer for forskjellige formalitetsnivåer.

Japansk er det mest dramatiske eksemplet. Forskjellen mellom uformelt japansk og formelt japansk er så betydelig at en setning på formalitetsnivå en kanskje bare deler rotverbene med ekvivalenten på nivå fem. Hver verbending endres. Pronomenene endres. Partiklene endres. Ærbødige prefikser vises eller forsvinner. Et oversettelsesverktøy som ikke tar hensyn til formalitet på japansk produserer i hovedsak tilfeldig utgang på formalitetsspekteret, som betyr at omtrent halvparten av tiden vil resultatet være upassende uformelt for en forretningskontekst eller unødvendig stivt for en vennlig samtale.

Register opererer sammen med formalitet, men er ikke identisk med den. Register beskriver den språklige varianten som brukes i en spesifikk sosial kontekst. Akademisk register, teknisk register, journalistisk register, litterært register. Hver har sine egne konvensjoner for setningsstruktur, ordforråd og retoriske enheter. En tekst oversatt i akademisk register bruker passive konstruksjoner, vakslende språk og sitatvennlig formulering. Den samme teksten i journalistisk register bruker aktivt språk, kortere setninger og direkte attribusjon. Formalitet kontrollerer hvor høflig eller uformelt teksten høres ut. Register kontrollerer hva slags tekst det høres ut til å være.

Tone legger til det emosjonelle laget. Nøytral, optimistisk, hastende, varsom, empatisk, autoritativ. Tonekategorien påvirker ordvalg på konnotasjonsnivået. "The deadline is approaching" i en nøytral tone forblir flat. I en hastende tone skifter ordforrådet mot ord som formidler press og umiddelbarhet. I en varsam tone blir det mykere, vakslende, mer diplomatisk. Tone er kategorien som most direkte påvirker hvordan leseren føler om teksten, og å få den galt kan gjøre en medfølende melding som høres kald ut eller en profesjonell oppdatering som høres panisk ut.

Domene, kjønn, variant og emne

De fire gjenværende kategoriene håndterer spesifikasjoner som de første seks ikke kan dekke. Domene-terminologi kontrollerer hvilket spesialisert ordforrådsett modellen trekker fra. Dette er mer granulært enn industri. Innenfor teknologiindustrien kan domenet være cloud computing, mobilutvikling, cybersikkerhet eller datavitskap. Hver har sitt eget ordspråk, sine egne akronymkonvensjoner og sitt eget sett med vilkår som har spesifikke betydninger som er forskjellige fra deres daglige bruk.

Talerkjønn, som diskutert i Russisk kjønnguiden, kontrollerer grammatikalsk kjønn i språk som krever det. Dette er ikke valgfritt for språk som russisk, arabisk, hebraisk, hindi og mange andre hvor fortidsformer og adjektiver må samsvare med talerens kjønn. Å sette denne kategorien en gang sikrer konsistent og riktig kjønnsmerkering gjennom hele resultatet.

Regional variant kontrollerer hvilken versjon av målspråket som skal produseres. Britisk eller amerikansk engelsk. Brasiliansk eller europeisk portugisisk. Forenklet eller tradisjonell kinesisk. Latinamerikansk eller Iberia spansk. Denne kategorien fungerer med de 22 språkspesifikke innstillingene for å sikre at resultatet samsvarer med konvensjonene til det tiltenkte publikumets region, inkludert stavemåte, ordforråd og idiomatiske uttrykk. Britisk vs amerikansk engelsk guiden dekker dette i detalj for det mest etterspurte variantparet.

Emne gir det tematiske konteksten som hjelper til med å løse tvetydighet. Når flere kategorier settes samtidig, mottar AI-modellen en rik kontekststreng som veileder alle beslutninger under oversettelse. Kombinasjonen av alle ti kategorier, med deres 117 individuelle alternativer, skaper et kontekstfingeravtrykk som er spesifikt nok til å produsere oversettelser tilpasset nøyaktige situasjoner i stedet for generiske tilnærminger.

Hva 117 alternativer faktisk betyr i praksis

Antallet høres stort ut, men i praksis er systemet utformet slik at de fleste brukere bare trenger å sette et fåtall kategorier for en hvilken som helst oppgave. En utvikler som oversetter API-dokumentasjon kan sette industri til teknologi, domene til programvareutvikling, formalitet til nivå tre og register til teknisk. Det er fire innstillinger, kanskje tretti sekunder med konfigurasjon, og de resulterende oversettelsene bruker korrekt teknisk terminologi, passende formalitet og profesjonelt register gjennom hele sesjonen.

En markedsføringsprofesjonell som oversetter kampanjekopi kan sette industri til markedsføring, publikum til forbrukere, formål til overbevisende, tone til optimistisk og formalitet til nivå to. Fem innstillinger, fortsatt under ett minutt med konfigurasjon, og hver oversettelse i sesjonen reflekterer disse valgene. Bruksguiden går gjennom konfigurasjonen trinn for trinn.

De 117 alternativene på tvers av ti kategorier er ikke ment å alle brukes samtidig. De er ment å dekke hele spekteret av situasjoner som virkelige brukere møter. En juridisk oversetter trenger andre alternativer enn en sosiale mediers manager. En medisinsk forsker trenger andre alternativer enn en reiseblogger. Systemet gir nok granularitet til å betjene alle disse brukstilfellene uten å kreve at hver bruker forstår hvert alternativ. Sett kategoriene som betyr noe for oppgaven, la resten være på standardene, og AI-modellen inkorporerer uansett hvilken kontekst den mottar.

Det som gjør dette fundamentalt annerledes enn generisk oversettelse er at modellen ikke produserer en standardoversettelse og deretter justerer den. Konteksten former resultatet fra helt fra begynnelsen. Ordvalg, setningsstruktur, terminologi, register og formalitet bestemmes alle av konteksten før det første ordet i oversettelsen blir generert. Dette er hvorfor resultatet kan se så dramatisk annerledes ut med forskjellige kontekstinnstillinger. Det er ikke samme oversettelse som blir justert. Det er en annen oversettelse som blir generert fra scratch, guidet av et helt annet sett med begrensninger.

Ofte stilte spørsmål

Hva er kontekstvær maskinoversettelse

Kontekstvær maskinoversettelse er en tilnærming hvor AI-modellen mottar informasjon om taleren, publikum, industri, formalitetsnivå, tone og andre faktorer før oversettelsen genereres. Denne konteksten former ordvalg, grammatikk og register i resultatet, og produserer oversettelser tilpasset spesifikke situasjoner i stedet for generiske en-størrelse-passer-alle resultater.

Hvor mange kontekstinnstillinger tilbyr YEB Translate

YEB Translate gir 10 kontekstkategorier med 117 individuelle alternativer, pluss 22 språkspesifikke innstillinger med 78 alternativer. Kategorier inkluderer industri, publikum, formalitet, register, tone, formål, domene-terminologi, talerkjønn, regional variant og emne. Brukere setter vanligvis 3 til 5 kategorier per sesjon.

Kan kontekstinnstillinger produsere dårligere oversettelser hvis de settes feil

Å sette feil kontekst kan presse oversettelsen i en upassende retning. For eksempel vil setting av medisinsk industrikontext for en markedsføringstekst introdusere klinisk terminologi som føles utenfor plass. Imidlertid produserer det å la innstillinger være på standardene rett og slett generisk resultat, som er ekvivalent med det andre oversettelsesverktøy produserer uten noen kontekst. Verste tilfelle for ubrukte innstillinger er nøytral, ikke skadelig.

Er det en gratis AI-oversetter med kontekstinnstillinger

YEB Translate bruker en betaling-per-bruk kredittmodell i stedet for et abonnement. Alle kontekstkategorier er tilgjengelige på hver forespørsel uten premiumtrinน. Kreditter forbrukes bare når tekst faktisk behandles, og ubrukte kreditter overføres på ubestemt tid. Dette gjør det rimeligere enn abonnementstverktøy for tilfeldige brukere som fortsatt trenger kontekstvær resultat.

Hvordan sammenligner kontekstvær oversettelse med DeepL eller Google Translate

DeepL og Google Translate produserer flytende resultat, men tilbyr minimal kontroll over kontekst. Ingen av dem gir innstillinger for industri, tone, talerkjønn eller domene-terminologi. Resultatet er generiske oversettelser som er grammatikalsk korrekte, men kan bruke feil terminologi, upassende formalitet eller ukorrekt kjønnede former. Kontekstvær oversettelse fyller disse gapene ved å gi AI-modellen informasjonen den trenger for å ta målrettede valg. DeepL-sammenligningen bryter dette ned i detalj.

Fungerer kontekstinnstillinger for alle språkpar

Kontekstinnstillinger gjelder for alle språkpar. Noen kategorier er mer påvirkende for visse språk enn andre. Talerkjønn betyr mest for kjønnede språk som russisk og arabisk. Formalitet har den sterkeste effekten på japansk, koreansk og tysk. Regional variant er kritisk for språk med store dialektale splitter som portugisisk og kinesisk. Systemet tilpasser kontekstfortolkningen basert på målspråket.