Väri vai väri ja miksi tekoälykäännös ilman kontekstia on järjetöntä
Jossain jaettuun kansioon on jäänyt dokumentti, jonka oli tarkoitus olla tuotekuvaus brittiläiselle yleisölle. Teksti oli alun perin kirjoitettu saksaksi, käännetty englanniksi käyttämällä yhtä suurimmista verkkopohjaisista käännöstyökaluista, ja toimitettu markkinointiryhmälle. Se näytti ensisilmäyksellä hyvälle. Kielioppi oli oikea, lauseet virtasivat kohtuullisen hyvin ja merkitys säilyi. Sitten joku Lontoosta huomautti asiasta. Dokumentissa käytettiin "color" -sanaa "colour" -sanan sijaan, "organize" -sanaa "organise" -sanan sijaan, "center" -sanaa "centre" -sanan sijaan ja "analyze" -sanaa "analyse" -sanan sijaan. Jokainen kirjoitusasun valinta noudatti amerikkalaisia käytäntöjä. Dokumentissa, joka oli tarkoitettu brittiläisille asiakkaille ja julkaistu .co.uk-verkkotunnuksella, tämä ei ollut hyväksyttävää.
Turhauttava osa ei ollut se, että käännös oli väärä. Turhauttava osa oli se, että ei ollut mitään keinoa kertoa työkalulle, mitä englannin versiota tuottaa. Google Translatessa on yksi vaihtoehto: englanti. DeepL:ssä on yksi vaihtoehto: englanti. Kumpikaan ei kysy, onko kohderyhmä Manchesterin vai New Yorkin lukija. Tuotos luodaan, variantti valitaan sen mukaan, mikä kuvio oli eniten harjoitustiedoissa, ja käyttäjä joutuu manuaalisesti etsimään ja korvaamaan jokaisen amerikkalaisen kirjoitusasun esiintymisen dokumentissa, jonka oli tarkoitus olla brittiläinen alusta alkaen.
Tämä saattaa kuulostaa pieneltä valitukselta. Brittiläisen ja amerikkalaisen englannin väliset kirjoitusasun erot ovat hyvin dokumentoituja ja suhteellisen ennustettavissa. Mutta erot menevät paljon pidemmälle kuin "ou":n vaihtaminen "o"-kirjaimeksi ja "ise" -paatteen "ize"-päätteeksi. Sanasto eroaa merkittävästi. "Boot" on tavaratila. "Bonnet" on konepelti. "Trousers" ovat housut, mutta "pants" ovat alusvaatteet. "Biscuits" ovat keksejä. "Chips" ovat ranskalaiset perunat, mutta "crisps" ovat perunalastut. "Flat" on asunto. "First floor" on itse asiassa toinen kerros. Nämä sanaston erot voivat todella hämmentää lukijoita, kun väärä variantti ilmestyy muutoin hyvin kirjoitettuun tekstiin.
Kaikille, jotka hallitsevat monikielisen sisällön, erityisesti verkkosivuja, sovelluksia tai markkinointimateriaaleja, joita on oltava sekä brittiläisellä että amerikkalaisella englanniksi, käännöstyökalujen varianttien hallinnan puute aiheuttaa todellista työtä. Jokainen käännetty dokumentti vaatii manuaalisen tarkistuskierroksen erityisesti varianttien epäsopivuuksien havaintsemiseksi ja korjaamiseksi. Tuo tarkistuskierros vie aikaa, maksaa rahaa ja on täysin välttävissä, jos käännöstyökaltu tietäisi, mitä varianttia tuottaa.
Sama kieli, erilaiset käytännöt, nolla hallintaa
Brittiläinen ja amerikkalainen englanti eivät ole ainoa pari, jolla on tämä ongelma, vaikka ne ovat yleisimmin kohdattavat. Portugali jakautuu Brasilian portugaliksi ja eurooppalaiseksi portugaliksi, eroin oikeinkirjoituksessa, kieliopissa, sanastossa ja jopa pronominien käytössä, jotka ovat merkittäviä tarpeeksi, jotta teksti tuntuu vieraalta toisen variantin lukijoille. Espanja vaihtelee latinamerikkalaisten ja Iberian käytäntöjen välillä, verbien muodoissa, slangeissa ja sanastossa, joissa on merkittäviä eroja. Ranskan kiellä on erilaiset käytännöt Ranskassa, Kanadassa, Belgiassa ja eri Afrikan valtioissa. Kiina jakautuu yksinkertaistettuihin ja perinteisiin merkkeihin, mikä ei ole vain oikeinkirjoitusero vaan kokonaan eri merkkisarja.
Jokaisessa näistä tapauksista väärän variantin tuottaminen ei ole pieni kosmeettinen ongelma. Brasilialainen lukija, jolle kohtaa eurooppalaista portugalia tuotekuvauksessa, huomaa sen välittömästi. Se aiheuttaa etäisyyden tunnetta, ikään kuin yritys ei välittänyt tarpeeksi lokalisoimisesta. Liiketoiminnoissa, jotka yrittävät rakentaa luottamusta tietyille alueellisille markkinoille, tämän kaltainen epäsopivuus heikentää koko ponnistusta. Sisältö olisi yhtä hyvin voitu jättää kääntämättä, jos käännös sanoo "emme itse asiassa tunne markkinaasi".
YEB:n opas amerikkalaisesta englanniksi muuntamisesta brittiläiseksi englanniksi käsittelee asiaan liittyviä asetuksia. YEB Translate -sovelluksessa kielivariantti on yksi 22:sta kieliasetuksesta, joita on saatavilla kontekstijärjestelmässä. Kun englanti valitaan kohdekieleksi, käyttäjä voi määrittää amerikkalaisen, brittiläisen, australialaisen tai muun alueellisen variantin. Tekoälymallin saatuaan nämä asetukset osana kontekstisarjaa, se tuottaa tuloksen, joka johdonmukaisesti käyttää oikeaa kirjoitusasua, sanaston valintoja ja idimaattisia lausekkeita kyseiselle variantille. Ei tarvitse jälkimuokkauksen kieääntöä.
Sama mekanismi toimii jokaisen kieliparille, jolla on alueellisia variantteja. Brasilian vai eurooppalainen portugali. Latinamerikkalainen vai Iberian espanja. Yksinkertaistettu vai perinteinen kiina. Kanadan vai pääkaupunkiseudun ranska. Asetus tehdään kerran, säilyy koko istunnon ajan ja koskee jokaista tekstinpalaa, jota käsitellään istunnon aikana. Lokalisointia suuressa mittakaavassa hallitseville sisältöryhmille tämä poistaa kokonaisen laadunvarmistustyön kategorian.
Miksi harjoitustiedon puolueellisuus tekee tämän pahemmaksi kuin näyttää
Syy siihen, että useimmat käännöstyökalut suosivat amerikkalaista englantia, on suoraviivainen: internet sisältää enemmän amerikkalaisen englannin teksti kuin brittiläisen englannin teksti. Tekoälyn mallien harjoitustiedot kerätään ylivoimaisesti verkon sisällöstä, ja verkkosiällä hallitsevat amerikkalaiset julkaisut, amerikkalaiset yritykset ja amerikkalaiset käyttäjien tuottama teksti. Kun tekoälymallia opetetaan siitä, miltä "oikea" englanti näyttää, se oppii kokoelmasta, joka kallellaan on amerikkalainen oletuksena.
Tämä puolueellisuus ei ole tahallista, mutta se on jatkuvaa. Jopa silloin, kun käännöstyökaluja päivitetään uusemmilla malleilla, taustalla oleva datan jakauma ei ole muuttunut. Amerikkalainen englanti on edelleen enemmistövariantti harjoituskokoelmissa, mikä tarkoittaa, että oletustuotos jatkaa amerikkalaisen kallistumista riippumatta siitä, tarvitseeko käyttäjä brittiläistä, australialaista, etelä-afrikkalaista vai mitään muuta varianttia. Malli ei valitse amerikkalaista englantia, koska se olisi parempi. Se valitsee sen, koska se on nähnyt enemmän sitä.
Käyttäjille, jotka kääntävät muille kielille englanniksi, tämä luo näkymättömän ongelman. Tuotos näyttää oikealta, koska se on kieliopillisesti oikea. Lauseet järkevät. Sanasto on sopiva. Mutta variantti on väärä aiotun yleisön kannalta, ja ellei käyttäjä ole tarpeeksi perehtynyt molempiin varianteihin kaikkien erojen havaitsemiseksi, epäsopivuus pääsee läpi. Saksalainen markkinointijohtaja, joka kääntää tuotekopytä Yhdistyneen kuningaskunnan markkinoille, ei välttämättä huomaa, että "aluminum" pitäisi olla "aluminium" tai että "skeptical" pitäisi olla "sceptical". Nämä eivät ole virheitä, jotka kieliopintarkistajat merkitsevät, koska molemmat kirjoitusasut ovat kelvollisia. Ne ovat vain kelvollisia eri maissa.
YEB:n tekoälyn kääntäjän kontekstijärjestelmä käsittelee kielivarianti ensimmäisen luokan asetuksena sen sijaan, että se olisi jälkiajatus. Tämä on tärkeää, koska tekoälymallin säätää paitsi oikeinkirjoitus, myös sanaston, idiomien ja jopa lauserakenteen variantin perusteella. Brittiläinen englanti kallistuu hieman muodollisemmille rakentuksille liikeasioiden kirjoittamisessa. Amerikkalainen englanti käyttää suorempaa ilmaisua. Australialaisen englannin omia epävirallisia rekisterejä, jotka eroavat molemmista. Nämä ovat hienovaraisia eroja, joita ihmisen äidinkielenopiskelijaa tuottaa alitajuisesti, ja joita tekoälymallia voi tuottaa vain, kun sille kerrotaan, mitä varianttia kohteistaa.
Variantin väärän saamisen todellinen kustannus
Henkilökohtaisella sähköpostilla ei kukaan välitä siitä, onko "colour" vai "color" näkyvissä. Julkaistulla sisällöllä panokset ovat erilaiset. .co.uk-verkkosivusto, joka käyttää amerikkalaisia kirjoitusasuja kautta linjan, näyttää keskeneräiseltä. .com-verkkosivusto, joka on suunnattu australialaisille lukijoille brittiläisellä kirjoitusasulla, näyttää hieman sivulta. Nämä eivät ole dramaattisia epäonnistumisia. Ne ovat paperileikkauksia, jotka kertyvät ja luovat yleisen vaikutelman huolimattomuudesta.
Säännellyissä teollisuuden haaroissa varianttien johdonmukaisuus voi olla vaatimuskysymys. Brittiläiset oikeudelliset asiakirjat noudattavat brittiläisiä käytäntöjä. NHS:n lääketieteellinen kirjallisuus käyttää brittiläistä terminologiaa. Hallinnon julkaisut noudattavat tiukkoja tyylioppaita, joissa määritellään variantin käyttö yksittäisten sanojen tarkkuudella. Käännetyn asiakirjan lähettäminen, joka käyttää väärää varianttia näissä yhteyksissä, ei ole vain huolimaton. Se voi laukaista hylkäämisen tai muutosvaatimusten, joita viivyttävät kokonaisia projekteja.
Vertailu DeepL:iin korostaa tätä yhtenä niistä erityisistä alueista, joissa yleistarkoitukseliset käännöstyökalut pettävät. DeepL tuottaa erinomaisia käännöksiä sujuvuuden ja tarkkuuden kannalta, mutta siihen asti ei ole tarjonnut mitään tapaa määrittää, mitä englannin varianttia tuottaa. Käyttäjät, joilla oli brittiläinen englanti, joutuivat joko hyväksymään sen, mitä malli antoi heille, tai ajamaan erillisen muuntamisen jälkeen. Sama rajoitus on useimmissa markkinoilla olevista suurimmista tekoälykäännöstyökaluista.
Se, mikä erottaa kontekstilähestymistavan, on se, että variantin valinta tapahtuu ennen käännöstä, ei sen jälkeen. Tekoälymallia ei tuota amerikkalaista englannin tekstiä ja muuta sen sitten brittiläiseksi. Se tuottaa brittiläisen englannin tekstin alusta alkaen, valitsemalla oikeat sanat, oikean kirjoitusasun ja oikeat rakenteet aivan ensimmäisestä lauseesta. Tämä on pohjimmiltaan erilainen lähestymistapa kuin etsi-ja-korvaa-jälkikäsittely, ja se tuottaa tuloksia, jotka kuulostavat luonnollisesti kohdeltavassa variantissa sen sijaan, että ne tuntuvat amerikkalaisilta tekstiltä, joissa on ohut brittiläinen maalikerros.
Usein kysytyt kysymykset
Voiko Google Translate tuottaa erityisesti brittiläisen englannin
Google Translate tarjoaa "englannin" yksittäisenä kohdekielenä erottamatta brittiläistä, amerikkalaista, australialaista tai muita variantteja. Tuotos noudattaa yleensä amerikkalaisia käytäntöjä, koska mallin harjoitustiedot sisältävät enemmän amerikkalaista englantia. Ei ole asetusta, jonka avulla voi vaatia erityisesti brittiläistä englantia, joten käyttäjät, joilla on sitä tarvitse, joutuvat manuaalisesti tarkistamaan ja korjaamaan tuotoksen.
Mitkä ovat brittiläisen ja amerikkalaisen englannin sanaston pääerot
Oikeinkirjoituserojen, kuten "colour" vs "color" ja "organise" vs "organize", lisäksi sanaston erot sisältävät jokapäiväisiä sanoja. Brittiläinen "boot" on amerikkalainen "trunk". Brittiläinen "lift" on amerikkalainen "elevator". Brittiläinen "pavement" on amerikkalainen "sidewalk". Brittiläinen "flat" on amerikkalainen "apartment". Nämä erot vaikuttavat käännettyyn tekstiin, koska tekoälymallin on valittava yksi versio, ja ilman kontekstia, se valitsee sen, mikä ilmestyi useammin harjoitustiedoissa.
Onko olemassa ilmainen työkalu tekstin kääntämiseen verkossa brittiläisellä englanniksi
YEB Translate toimii maksua teksteistä -krediittimallilla, jossa krediittejä kulutetaan vain teksti käsiteltäessä. Kielivariantin asetus, mukaan lukien brittiläinen englanti, on saatavana jokaisessa käännöspyynnössä ilman premium-tasoa tai lisäkustannuksia.
Kuinka kontekstiin perustuva käännös käsittelee alueellisia kielivariintteja
Kontekstiin perustuva käännös sisältää kielivariantin yhtenä sen asetuksista. Ennen kuin tekoälymalli käsittelee lähdetekstin, se vastaanottaa tietoa siitä, mitä alueellista varianttia käyttää tuotoksessa. Tämä vaikuttaa oikeinkirjoitukseen, sanastoon, idiomeihin ja jopa lauserakenteeseen. Malli tuottaa tekstiä äidinkielellä pyydetyssä variantissa sen sijaan, että se kääntäisi oletusvarianteille ja muuntaisi sen jälkeen.
Mikä on paras Google Translatein vaihtoehto tarkoille käännöksille
Tarkkuus riippuu tietystä tarpeesta. Euroopan kielille, joissa on korkea sujuvuusvaatimus, DeepL on vahva vaihtoehto. Kontekstiin perustuviin käännöksiin, joiden on otettava huomioon sukupuoli, muodollisuus, alan terminologia ja alueelliset variantit, YEB:n tekoälykääntäjä tarjoaa hallintaa, joita muista työkaluista puuttuu. Täydellinen vertailu tekoälykäännöstyökaluista kertoo vahvuudet ja rajoitukset suurimmissa vaihtoehdoissa.
Onko brittiläinen vs amerikkalainen englanti tärkeä SEO:lle
Kyllä. Hakukäyttäytyminen eroaa alueittain. Yhdistyneen kuningaskunnan käyttäjät etsivät "colour palette" -sanoja, kun taas Yhdysvaltojen käyttäjät etsivät "color palette" -sanoja. Väärän variantin käyttäminen tarkoittaa, että sisältö ei välttämättä vastaa aiotun yleisön hakutermejä. Verkkosivustoissa, jotka on suunnattu tietyille englanninkielisille markkinoille, oikean variantin johdonmukainen käyttö parantaa sekä käyttäjien luottamusta että hakujen merkityksellisyyttä.