Kymmenen kontekstikategoriaa, jotka muuttavat käännöksen täysin
Ota yksinkertainen englanninkielinen lause: "We need to close this quickly." Käännä se nyt saksaksi. Ilman mitään kontekstia käännöstyökalu tuottaa jotain geneeristä ja teknisesti oikein. Verbin valinta on neutraali, muodollisuus on jonkin verran keskellä ja sävy on tasainen. Lisää nyt konteksti: tämä on oikeustiimi, joka neuvottelee sopimuksesta. Saksankielinen tuotos muuttuu. "Close" muuttuu erityiseksi oikeustermiksi sopimuksen saattamiseksi päätökseen. Muodollisuus siirtyy muodolliselle rekisterille. "Quickly"-sanan implisiitti kiireellisyys ilmaistaan sanastolla, jota saksalainen lakimies todella käyttäisi. Sama lähdekieli, täysin erilainen tuotos.
Vaihda nyt kontekstia uudelleen. Sama lause, mutta tämä kerta se tulee ohjelmistokehityskiintä, joka keskustelee ohje-tiketin sulkemisesta. Saksankielinen käännös siirtyy jälleen. "Close" kartoitetaan nyt tekniikalle käytettyyn termiin projektinhallintavälineissä. Rekisteri laskee puoliviralliseksi. Sanasto on linjassa sen kanssa, kuinka saksalaiset kehittäjät todella puhuvat standuppeissa ja Slack-kanavissa. Lause tarkoittaa silti samaa asiaa englanniksi. Saksankieliset versiot siitä eivät näytä lainkaan samanlaisilta, eikä niiden pitäisikään, koska ne kuvaavat täysin erilaisia tilanteita.
Tämä on kontekstin ilman käännöksen perusongelma. Lähdekieli on epäselvä, ja kääntäjä ratkaisee kyseisen epäselvyyden arvailemalla. Joskus arvaus on oikea. Usein se tuottaa tuloksen, joka on kieliopillisesti oikea mutta semanttisesti väärä, teksti, joka teknisesti sanoo oikean asian, mutta sanoo sen tavalla, jota mikään äidinkielinen puhuja ei koskaan käyttäisi kyseisessä tilanteessa. Kymmenen kontekstikategoriaa YEB Translate-palvelussa ovat olemassa erityisesti tämän arvailun poistamiseksi. Jokainen niistä antaa tekoälymallia tietoa, jota se tarvitsee paremman valinnan tekemiseksi, ja yhdessä ne muuntavat geneerisen koneen ulostulon tekstiksi, joka lukee kuin jonkun, joka todella ymmärtää tilanteen, kirjoittama.
Teollisuus, yleisö ja tarkoitus
Kolme ensimmäistä kategoriaa muodostavat minkä tahansa käännöskontekstin perustan. Teollisuus kertoo mallille, mihin alaan teksti kuuluu, mikä suoraan ohjaa teknisen sanaston valintaa. Sana kuten "protokolla" lääketieteellisessä yhteydessä laukaisee täysin erilaisen sanaston kuin "protokolla" verkon tai diplomaattisissa yhteyksissä. Ilman teollisuusasetusta malli valitsee, mikä merkitys on näkynyt useimmiten koulutustiedoissa, mikä "protokollassa" yleensä oletuksena on teknologia. Aseta teollisuus terveydenhuoltoon, ja tuotos käyttää automaattisesti oikeaa lääketieteellistä terminologiaa.
Yleisö määrittää, kuka lukee käännettyä tekstiä. Tekninen asiakirja, joka on tarkoitettu insinöörille, käyttää erilaista sanastoa ja olettaa erilaisen taustatiedon kuin sama tieto, joka on kirjoitettu suurelle yleisölle. Tuotekuvaus kuluttajille käyttää yksinkertaisempaa kieltä ja enemmän persuasiivista kehystä kuin sisäinen tekniikan kehitystiimin asiakirja. Yleisökategoria ei muuta sitä, mitä sanotaan. Se muuttaa tapaa, jolla se sanotaan, ja säätää monimutkaisuuden, jargonin tiheyden ja oletetun tiedon lukijan odotettavaan tasoon.
Tarkoitus kuvaa tekstin takana olevan tarkoituksen. Onko tämä informatiivista sisältöä opetukseksi? Persuasiivinen sisältö myyntiin? Ohjaava sisältö ohjeistukseksi? Oikeudellinen sisältö sitoakseen? Jokainen tarkoitus aktivoi erilaisia kielellisiä malleja tuotoksessa. Persuasiivinen teksti saksaksi käyttää erilaisia lauserakenteita kuin informatiivinen teksti. Juridinen ranska noudattaa sopimuksia, jotka ovat täysin poissa keskustelusta ranskasta. Tarkoituskategoria kertoo mallille, ei vain sitä, mitä teksti sanoo, vaan mitä se yrittää saavuttaa, ja tuotos heijastaa kyseistä tarkoitusta kohdekielellä.
Nämä kolme kategoriaa yksin tuottavat dramaattisesti erilaisia tuloksia vaihdettaessa. Lause "suorituskyvyn parantamisesta" käännetty terveydenhuoltokatsauksia varten informatiivisen tarkoituksen kanssa tuottaa kliinistä, mitattua kieltä. Sama lause käännetty markkinointiyleisölle persuasiivisen tarkoituksen kanssa tuottaa dynaamista, hyödyihin keskittyvää kieltä. Tekoälyn kääntäjäominaisuuksien sivu näyttää nämä erot rinnakkain kahdelle puolelle kelle tahansa, joka haluaa nähdä kontrastin.
Muodollisuus, rekisteri ja sävy
Muodollisuus on ehkä välittömimmin vaikuttava kategoria, erityisesti kielille, joissa on muodolliset ja epävirallisten osoitteiden järjestelmät. Muodollisuuden asettaminen tasolle yksi tuottaa rennon, lyhennetyn tuotoksen, joka lukee kuin tekstiviesti ystävien välillä. Sen asettaminen tasolle viisi tuottaa tarkka, rakenneltu tuotos, joka lukee kuin juridinen sopimus tai virallinen valtion kirjeenvaihto. Opas ammattilaisemman ääneen sanomiseen tutkii, kuinka muodollisuus on vuorovaikutuksessa uudelleensanomisessa, mutta käännöksessä vaikutus on vielä selvempi, koska monilla kielillä on täysin erilliset sanastot ja kieliopilliset rakenteet eri muodollisuustasoille.
Japani on dramaattisin esimerkki. Ero satunnaisen japanin ja muodollisen japanin välillä on niin merkittävä, että lause muodollisuuden tasolla yksi voisi jakaa vain juuriverbit sen viiden tason kanssa. Jokainen verbin päätös muuttuu. Pronominit muuttuvat. Hiukkaset muuttuvat. Kunniaksi etuliitteet ilmestyvät tai katoavat. Käännöstyökalu, joka ei ota huomioon muodollisuutta japanissa, tuottaa oleellisesti satunnaiset ulostulot muodollisuuden spektrillä, mikä tarkoittaa, että karkeasti puolet ajasta tulos on sopimattomasti satunnainen liiketoimintakontekstissa tai tarpeettoman jäykkä ystävälliselle keskustelulle.
Rekisteri toimii muodollisuuden rinnalla, mutta se ei ole identtinen siihen. Rekisteri kuvaa tietyn yhteiskunnallisen kontekstin kielellisiä lajikkeita. Akateeminen rekisteri, tekninen rekisteri, toimittajarekisteri, kirjallinen rekisteri. Kullakin on omat sopimuksensa lauserakenteelle, sanastolle ja retorisisille laitteille. Akateemisen rekisterin käännös käyttää passiivisia rakenteita, suojaavaa kieltä ja lainaamisen kannalta ystävällistä ilmaisua. Sama teksti journalistirekisterissa käyttää aktiivista ääntä, lyhyempiä lauseita ja suoraa attribuutiota. Muodollisuus ohjaa, kuinka kohtelias tai rento teksti kuulostaa. Rekisteri ohjaa, millainen teksti kuulostaa.
Sävy lisää emotionaalisen kerroksen. Neutraali, optimistinen, kiireellinen, varovainen, empaattinen, auktoritatiivinen. Sävykategoria vaikuttaa sanavalintaan konnotaatiotasolla. "The deadline is approaching" neutraalissa sävyssä pysyy tasaisena. Kiireellisessä sävyssä sanasto siirtyy kohti sanoja, jotka välittävät painetta ja välittömyyttä. Varovaisessa sävyssä siitä tulee pehmeämpi, suojattu, diplomaattisempi. Sävy on kategoria, joka vaikuttaa suoraan siihen, miten lukija kokee tekstin, ja väärä saaminen voi tehdä myötätuntoisen viestin kylmäksi tai ammattillisen päivityksen paniikkinäköiseksi.
Alue, sukupuoli, muunnelma ja aihepiiri
Loput neljä kategoriaa käsittelevät yksityiskohtia, joita kuusi ensimmäistä eivät voi kattaa. Toimialue-terminologia ohjaa, mistä erikoistuneen sanaston joukosta malli piirtää. Tämä on hienointa kuin teollisuus. Teknologiateollisuuden sisällä toimialue voi olla pilvipalvelut, mobiilisovelluskehitys, kyberturvallisuus tai datatieteen. Kullakin on oma jargonsa, omansa lyhennekäytännöt ja oma joukko termejä, joilla on erityisiä merkityksiä poiketen niiden jokapäiväisestä käytöstä.
Puhujan sukupuoli, kuten käsitellään venäjän sukupuolioppaassa, ohjaa kieliopillisen sukupuolen kieliä, jotka vaativat sen. Tämä ei ole valinnainen kielille kuten venäjä, arabia, heprea, hindi ja monet muut, joissa menneisen ajan verbit ja adjektiivit täytyy sopeutua puhujan sukupuoleen. Tämän kategorian asettaminen kerran varmistaa yhdenmukaisen ja oikean sukupuolen merkitsijät koko tuotoksen läpi.
Alueellinen muunnelma ohjaa, mitä versiota kohdelista tuottaa. Brittiläinen tai amerikkalainen englanti. Brasilialainen tai eurooppalainen portugali. Yksinkertaistettu tai perinteinen kiina. Latinalainen tai Pyrenean espanja. Tämä kategoria toimii 22 kielihehtisen asetuksen kanssa varmistaakseen, että tuotos vastaa tarkoitetun yleisön alueen sopimuksia, mukaan lukien oikeinkirjoitus, sanasto ja idiomatiset lausekkeet. Brittiläinen vs amerikkalainen englantiopas kattaa tämän yksityiskohtaisesti useimmin pyydetyn muunnosparin osalta.
Aihepiiri tarjoaa aihekohtaisen kontekstin, joka auttaa ratkaisemaan epäselvyyden. Kun useita kategorioita asetetaan samanaikaisesti, tekoälymallia vastaanotetaan rikas kontekstijono, joka ohjaa jokaista päätöstään käännösprosessin aikana. Kaikkien kymmenen kategorian yhdistelmä niiden 117 yksittäisen vaihtoehdon kanssa luo kontekstisormenjäljen, joka on tarpeeksi spesifinen tuottamaan käännöksiä, jotka on räätälöity tarkkoihin tilanteisiin geneeristen likiarvojen sijasta.
Mitä 117 vaihtoehtoa todella tarkoittaa käytännössä
Numero kuulostaa suurelta, mutta käytännössä järjestelmä on suunniteltu niin, että useimmat käyttäjät tarvitsevat vain muutaman kategorian asettamisen mille tahansa tehtävälle. Kehittäjä, joka kääntää API-dokumentaatiota, saattaa asettaa teollisuuden teknologiaksi, toimialuetta ohjelmistokehitykseksi, muodollisuus kolmeksi tasoksi ja rekisterin tekniseksi. Se on neljä asetusta, ehkä kolmekymmentä sekuntia konfiguraatiota, ja tuloksena olevat käännökset käyttävät oikeaa teknistä terminologiaa, asianmukaista muodollisuutta ja ammatillista rekisteriä koko istunnon läpi.
Markkinointiammattilainen, joka kääntää kampanjasi kopiota, saattaa asettaa teollisuuden markkinoinniksi, yleisön kuluttajiksi, tarkoituksen persuasiiviseksi, sävy optimistiseksi ja muodollisuus tasolle kaksi. Viisi asetusta, silti alle minuutin konfiguraatio, ja jokainen käännös istunnossa heijastaa näitä valintoja. Käyttöopas käy läpi konfiguraatioprosessin vaihe vaiheelta.
117 vaihtoehtoa kymmenen kategorian poikki eivät ole tarkoitettu käytettäväksi kaikki samanaikaisesti. Ne on tarkoitettu kattamaan koko valikoima tilanteita, joita todelliset käyttäjät kohtaavat. Oikeudellisen kääntäjän tarvitsee erilaisia vaihtoehtoja kuin sosiaalisen median johtajalla. Lääketieteen tutkija tarvitsee erilaisia vaihtoehtoja kuin matkapakinabloggeri. Järjestelmä tarjoaa tarpeeksi rakenneisuutta palvelemaan kaikki nämä käyttötapauksia ilman, että jokaisen käyttäjän tarvitse ymmärtää jokaista vaihtoehtoa. Aseta kategoriat, jotka ovat tärkeitä kyseiselle tehtävälle, jätä loput niiden oletuksiin, ja tekoälymallia sisältää mitä tahansa kontekstia, jonka se vastaanottaa.
Mitä tekee tämän perusteellisesti eroaa geneerisestä käännöksestä, että malli ei tuota oletusarvoa käännöstä ja muokkaa sitä sitten. Konteksti muodostaa tuotoksen aivan alusta alkaen. Sanavalinta, lauserakenne, terminologia, rekisteri ja muodollisuus määritetään kaikki kontekstin avulla ennen kuin käännöksen ensimmäinen sana luodaan. Tämä on syy, miksi tuotos voi näyttää niin dramaattisesti erilaiselta eri kontekstiasetus-asetuksilla. Se ei ole sama käännös, jota kehitetään. Se on erilainen käännös, joka luodaan alusta alkaen, ohjattuna täysin erilaisista rajoituksista.
Usein kysytyt kysymykset
Mikä on kontekstia tukeva konekääntäminen
Kontekstia tukeva konekääntäminen on lähestymistapa, jossa tekoälymallia vastaanotetaan tieto puhujasta, yleisöstä, teollisuudesta, muodollisuuden tasosta, sävy ja muista tekijöistä ennen käännöksen luomista. Tämä konteksti muodostaa sanavalintaa, kielioppia ja rekisteriä tuotoksessa, tuottaen käännöksiä, jotka on räätälöity erityisille tilanteille geneerisen yhden koon sopii kaikelle tuloksia sijasta.
Kuinka monta konteksti-asetusta YEB Translate tarjoaa
YEB Translate tarjoaa 10 kontekstikategoriaa 117 yksittäisellä vaihtoehdolla, plus 22 kielihehtisella asetusta 78 vaihtoehdolla. Kategoriat sisältävät teollisuuden, yleisön, muodollisuuden, rekisterin, sävy, tarkoituksen, toimialue-terminologian, puhujan sukupuolen, alueellisen muunnelman ja aihepiirien. Käyttäjät tyypillisesti asettavat 3-5 kategoriaa istunnolla.
Voivatko konteksti-asetukset tuottaa huonompia käännöksiä, jos ne asetetaan väärin
Väärän kontekstin asettaminen voi työntää käännöksen sopimattomaan suuntaan. Esimerkiksi lääketieteen teollisuus-kontekstin asettaminen markkinointitekstille tuo kliinistä terminologiaa, joka tuntuu paikastaan. Kuitenkin asetusten jättäminen oletuksiin tuottaa vain geneeristä tulosta, mikä vastaa sitä, mitä muut käännöstyökalut tuottavat ilman mitään kontekstia. Pahin tapaus käyttämättömille asetuksille on neutraali, ei haitallinen.
Onko olemassa ilmaista tekoäly kääntäjä konteksti asetuksilla
YEB Translate käyttää maksullista käyttöä luottoa mallissa niin tilauksen sijasta. Kaikki kontekstikategoriat ovat saatavilla jokaisella pyynnöllä ilman premium-tasoja. Luottoja kulutetaan vain silloin, kun teksti todella käsitellään, ja käyttämättömät luotot siirtyvät eteenpäin määräämättömästi. Tämä tekee siitä edullisemman kuin tilaus-työkalut satunnaisille käyttäjille, jotka silti tarvitsevat kontekstia tukevaa tulosta.
Miten kontekstia tukeva käännös verrataan DeepL:ään tai Google Käännökseen
DeepL ja Google Käännös tuottavat sujuvaa tulosta, mutta tarjoavat minimaalisen hallinnan kontekstin yli. Kumpikaan ei tarjoa asetuksia teollisuudelle, sävy, puhujan sukupuoli tai toimialue-terminologia varten. Tuloksena on geneerisiä käännöksiä, jotka ovat kieliopillisesti oikein, mutta saattavat käyttää väärää terminologiaa, sopimattonta muodollisuutta tai virheellisiä sukupuolimuotoja. Kontekstia tukeva käännös täyttää nämä aukot antamalla tekoälymallia tietoa, jota se tarvitsee kohdistetuille valinnoille. DeepL vertailu erittelee tämän yksityiskohtaisesti.
Toimivatko konteksti-asetukset kaikille kielipareille
Konteksti-asetukset koskevat mitä tahansa kieliparaa. Jotkut kategoriat ovat vaikutukseltaan merkittävämpiä tietyille kielille kuin toisille. Puhujan sukupuoli on suurin merkitys sukupuolittuneille kielille kuten venäjä ja arabia. Muodollisuudella on vahvempi vaikutus japanissa, koreassa ja saksan kielellä. Alueellinen muunnelma on kriittinen kielille, joilla on suuria murteellisia jakoja, kuten portugali ja kiina. Järjestelmä mukauttaa sen kontekstin tulkintaa kohdekielen perusteella.