Ti kontekst-kategorier, der forandrer en oversættelse helt

Tag en simpel engelsk sætning: "We need to close this quickly." Oversæt den til tysk. Uden nogen kontekst vil et oversættelsesværktøj producere noget generisk og teknisk korrekt. Verbvalget vil være neutralt, formaliteten vil være et sted i midten, og tonen vil være flad. Tilføj nu kontekst: det er et juridisk team, der diskuterer en kontraktforhandling. Det tyske output ændrer sig. "Close" bliver et specifikt juridisk begreb for at afslutte en aftale. Formaliteten skifter til formelt register. Hastigheden, der antydes af "quickly", bliver udtrykt gennem ordforråd, som en tysk jurist faktisk ville bruge. Samme kildetekst, helt forskellige output.

Ændre nu konteksten igen. Samme sætning, men denne gang kommer den fra et softwareudviklingsteam, der taler om at lukke en fejlbillet. Den tyske oversættelse skifter igen. "Close" mapper nu til det tekniske ord, der bruges i projektledelseværktøjer. Registeret falder til semi-formelt. Ordforrådet tilpasses til, hvordan tyske udviklere faktisk taler i standups og Slack-kanaler. Sætningen betyder stadig det samme på engelsk. De tyske versioner af den ser ikke ud på samme måde, og det bør de ikke, fordi de beskriver helt forskellige situationer.

Dette er kerneproblem med kontekst-fri oversættelse. Kildeteksten er tvetydig, og oversætteren løser denne tvetydighed ved at gætte. Nogle gange er gættet rigtigt. Ofte producerer det output, der er grammatisk korrekt, men semantisk forkert, tekst, der teknisk siger det rigtige, men siger det på en måde, som ingen modersmålstaler nogensinde ville bruge i den særlige situation. De ti kontekst-kategorier i YEB Translate eksisterer specifikt for at eliminere denne gætteri. Hver enkelt giver AI-modellen den information, den har brug for at træffe bedre valg, og sammen transformerer de generisk maskinoutput til tekst, der læses, som om den var skrevet af en person, der faktisk forstår situationen.

Industri, publikum og formål

De første tre kategorier danner grundlaget for enhver oversættelses-kontekst. Industri fortæller modellen, hvilket felt teksten tilhører, hvilket direkte styrer valget af teknisk ordforråd. Et ord som "protocol" i en medicin-kontekst udløser helt anderledes ordforråd end "protocol" i en netværks-kontekst eller en diplomatisk kontekst. Uden industri-indstillingen vælger modellen, hvilket betydning den har set oftest i træningsdata, som for "protocol" normalt bliver standard til teknologi. Sæt industrien til sundhedsvæsen, og outputtet bruger automatisk den korrekte medicinske terminologi.

Publikum specificerer, hvem der vil læse den oversatte tekst. Et teknisk dokument rettet mod ingeniører bruger anderledes ordforråd og antager anderledes baggrundsviden end de samme oplysninger skrevet til et generelt publikum. En produktbeskrivelse for forbrugere bruger simpelt sprog og mere overbevisende indramning end et internt specifikationsdokument til udviklingsteamet. Publikum-kategorien ændrer ikke, hvad der bliver sagt. Det ændrer, hvordan det bliver sagt, og justerer kompleksitet, jargon-tæthed og antaget viden for at passe læserens forventede niveau.

Formål fanger hensigten bag teksten. Er dette informativt indhold beregnet til at uddanne? Overbevisende indhold beregnet til at sælge? Instruktionsindhold beregnet til at guide? Juridisk indhold beregnet til at binde? Hvert formål aktiverer forskellige sproglige mønstre i outputtet. Overbevisende tekst på tysk bruger anderledes sætningsstrukturer end informativ tekst. Juridisk fransk følger konventioner, der er helt fraværende i samtalefransk. Formål-kategorien fortæller modellen ikke blot, hvad teksten siger, men hvad den forsøger at opnå, og outputtet afspejler denne hensigt på målsproget.

Disse tre kategorier alene producerer dramatisk anderledes output, når de varieres. En sætning om "improving performance" oversat til et sundhedsvæsens publikum med et informativt formål genererer klinisk, målt sprog. Den samme sætning oversat til et marketingpublikum med et overbevisende formål genererer dynamisk, fordel-fokuseret sprog. Siden med AI oversætter-funktion viser side-ved-side eksempler på disse forskelle for alle, der ønsker at se kontrasten første hånd.

Formalitet, register og tone

Formalitet er måske den mest umiddelbar påvirkende kategori, især for sproger med formelle og uformelle adressesystemer. Indstilling af formalitet til niveau et producerer uformelt, forkortet output, der læses som en tekstbesked mellem venner. Indstilling af det til niveau fem producerer præcist, struktureret output, der læses som en juridisk kontrakt eller officiel regeringskorrespondance. Vejledningen om omformulering for professionalisme udforsker, hvordan formalitet interagerer med omformulering, men i oversættelse er effekten endnu mere udtalt, fordi mange sprog har helt separate ordforråd og grammatiske strukturer for forskellige formalitetniveauer.

Japansk er det mest dramatiske eksempel. Forskellen mellem uformelt japansk og formelt japansk er så betydelig, at en sætning på formalitet niveau et måske kun deler rodroden med sin niveau fem-ækvivalent. Alle verbendelser ændres. Pronomenerne ændres. Partiklerne ændres. Æres-præfikser optræder eller forsvinder. Et oversættelsesværktøj, der ikke tager hensyn til formalitet på japansk, producerer i det væsentlige tilfaldigt output på formalitetsspektret, hvilket betyder, at det grå halvdelen af tiden vil resultatet være upassende uformelt for en forretningssammenhæng eller unødvendig stivt for en venskabelig samtale.

Register opererer ved siden af formalitet, men er ikke identisk med det. Register beskriver det sproglige varietet, der bruges i en bestemt social sammenhæng. Akademisk register, teknisk register, journalistisk register, litterært register. Hver har sine egne konventioner for sætningsstruktur, ordforråd og retorik. En tekst oversat i akademisk register bruger passive konstruktioner, modererende sprog og citeringsvenlige fremstilling. Den samme tekst i journalistisk register bruger aktiv stemme, kortere sætninger og direkte henvisning. Formalitet kontrollerer, hvor høflig eller uformelt teksten lyder. Register kontrollerer, hvilken slags tekst det lyder som.

Tone tilføjer det emotionelle lag. Neutral, optimistisk, presserende, forsigtig, empatisk, autoritativ. Tone-kategorien påvirker ordvalg på konnotationsniveauet. "The deadline is approaching" i en neutral tone forbliver flad. I en presserende tone skifter ordforrådet mod ord, der formilder tryk og øjeblikkeligbed. I en forsigtig tone bliver det blødere, modereret, mere diplomatisk. Tone er den kategori, der mest direkte påvirker, hvordan læseren føler om teksten, og at få det forkert kan få en sympatisk besked til at lyde kold eller en professionel opdatering til at lyde panisk.

Domæne, køn, variant og emne

De resterende fire kategorier håndterer detaljer, som de første seks ikke kan dække. Domæne-terminologi kontrollerer, hvilket specialiseret ordforråds sæt modellen trækker fra. Dette er mere granuleret end industri. Inden for teknologi-industrien kan domænet være cloud computing, mobil udvikling, cybersikkerhed eller data science. Hver har sit eget jargon, sine egne akronym-konventioner og sit eget sæt af ord, der har specifikke betydninger anderledes fra deres hverdagsbrug.

Talemandens køn, som diskuteret i russisk køn-vejledningen, kontrollerer grammatisk køn på sproger, der kræver det. Dette er ikke valgfrit for sproger som russisk, arabisk, hebraisk, hindi og mange andre, hvor tiden for fortid og adjektiver skal stemme overens med talemandens køn. Indstilling af denne kategori en gang sikrer konsistente og korrekte køn-markører gennem hele outputtet.

Regional variant kontrollerer, hvilken version af målsproget der skal produceres. Britisk eller amerikansk engelsk. Brasiliansk eller europæisk portugisisk. Simplificeret eller traditionel kinesisk. Latinamerikansk eller Iberisk spansk. Denne kategori arbejder med de 22 sprogets specifikke indstillinger for at sikre, at outputtet matcher de tilsigtede publikummets områdes konventioner, herunder stavning, ordforråd og idiomatiske udtryk. Britisk vs amerikansk engelsk vejledningen dækker dette i detaljer for det mest almindeligt ønskede variant par.

Emne giver den topiske kontekst, der hjælper med at løse tvetydighed. Når flere kategorier sættes samtidigt, modtager AI-modellen en rig kontekst-streng, der styrer hver beslutning, den træffer under oversættelsen. Kombinationen af alle ti kategorier, med deres 117 individuelle muligheder, skaber en kontekst-fingeraftryk, der er specifikt nok til at producere oversættelser skræddersyet til nøjagtige situationer snarere end generiske tilnærmelser.

Hvad 117 muligheder faktisk betyder i praksis

Tallet høres stort ud, men i praksis er systemet designet, så de fleste brugere kun behøver at indstille et par kategorier for hver given opgave. En udvikler, der oversætter API-dokumentation, kan indstille industri til teknologi, domæne til softwareudvikling, formalitet til niveau tre og register til teknisk. Det er fire indstillinger, måske tredive sekunder konfiguration, og de resulterende oversættelser bruger korrekt teknisk terminologi, passende formalitet og professionel register gennem hele sessionen.

En marketingprofessionel, der oversætter kampagnekopi, kan indstille industri til marketing, publikum til forbrugere, formål til overbevisende, tone til optimistisk og formalitet til niveau to. Fem indstillinger, stadig under et minut konfiguration, og hver oversættelse i sessionen afspejler disse valg. Brugervejledningen guider gennem konfigurationsprocessen trin for trin.

De 117 muligheder på tværs af ti kategorier er ikke beregnet til at alle blive brugt samtidigt. De er beregnet til at dække det fulde spektrum af situationer, som rigtige brugere møder. En juridisk oversætter har brug for andre muligheder end en social media-leder. En medicinsk forsker har brug for andre muligheder end en rejseblogger. Systemet giver nok granularitet til at betjene alle disse brugssituationer uden at kræve, at hver bruger forstår hver mulighed. Indstil de kategorier, der betyder noget for den aktuelle opgave, lad resten være på deres standard, og AI-modellen inkorporerer alt kontekst, den modtager.

Det, der gør dette fundamentalt anderledes fra generisk oversættelse, er, at modellen ikke producerer en standard-oversættelse og derefter justerer den. Konteksten former outputtet fra allerede fra starten. Ordvalg, sætningsstruktur, terminologi, register og formalitet bestemmes alle af konteksten, før det første ord af oversættelsen genereres. Dette er, hvorfor outputtet kan se så dramatisk anderledes ud med forskellige kontekst-indstillinger. Det er ikke den samme oversættelse, der justeres. Det er en helt anden oversættelse, der genereres fra bunden, vejledt af et helt anderledes sæt af begrænsninger.

Ofte stillede spørgsmål

Hvad er kontekst-bevidst maskinoversættelse

Kontekst-bevidst maskinoversættelse er en tilgang, hvor AI-modellen modtager information om taleren, publikum, industri, formalitetsniveau, tone og andre faktorer før generering af oversættelsen. Denne kontekst former ordvalg, grammatik og register i outputtet, producerende oversættelser skræddersyet til specifikke situationer snarere end generiske one-size-fits-all resultater.

Hvor mange kontekst-indstillinger tilbyder YEB Translate

YEB Translate giver 10 kontekst-kategorier med 117 individuelle muligheder, plus 22 sprogets specifikke indstillinger med 78 muligheder. Kategorier inkluderer industri, publikum, formalitet, register, tone, formål, domæne terminologi, talemandens køn, regional variant og emne. Brugere indstiller typisk 3 til 5 kategorier per session.

Kan kontekst-indstillinger producere værre oversættelser, hvis de sættes forkert

Indstilling af den forkerte kontekst kan skubbe oversættelsen i en upassende retning. For eksempel vil indstilling af medicin industri-kontekst for en marketing-tekst introducere klinisk terminologi, der føles udenfor rammer. Men hvis man lader indstillingerne være på deres standard, producerer man blot generisk output, som svarer til, hvad andre oversættelsesværktøjer producerer uden nogen kontekst. Det værste tilfælde for ubrugt indstillinger er neutral, ikke skadelig.

Findes der en gratis AI-oversætter med kontekst-indstillinger

YEB Translate bruger en pay-per-use kredit-model snarere end et abonnement. Alle kontekst-kategorier er tilgængelige på hver anmodning uden præmium-niveauer. Kreditter forbruges kun, når tekst faktisk behandles, og ubrugt kreditter overføres uendeligt. Dette gør det mere overkommeligt end abonnements-værktøjer for tilfældig brugere, der stadig har brug for kontekst-bevidst output.

Hvordan sammenligner kontekst-bevidst oversættelse med DeepL eller Google Translate

DeepL og Google Translate producerer flydende output, men tilbyder minimal kontrol over kontekst. Hverken tilbyder indstillinger for industri, tone, talemandens køn eller domæne terminologi. Resultatet er generisk oversættelser, der er grammatisk korrekte, men kan bruge forkert terminologi, upassende formalitet eller forkert kønnede former. Kontekst-bevidst oversættelse udfylder disse huller ved at give AI-modellen den information, den har brug for at træffe målrettede valg. DeepL-sammenligningen bryder dette ned i detaljer.

Virker kontekst-indstillinger for alle sprogspar

Kontekst-indstillinger gælder for ethvert sprogspar. Nogle kategorier er mere påvirkende for bestemte sproger end andre. Talemandens køn betyder mest for kønnede sproger som russisk og arabisk. Formalitet har den stærkeste effekt på japansk, koreansk og tysk. Regional variant er kritisk for sproger med store dialektale opdelinger som portugisisk og kinesisk. Systemet tilpasser sin kontekst-fortolkning baseret på målsproget.