Razgovor je tekao u redu. Bio je to neformalni čet o softverskom projektu, ona vrsta opuštene razmene poruka koja se dešava desetine puta dnevno između programera koji govore različite jezike. Druga osoba je bila Rus, poruke su se pisale na engleskom, a Google Translate je obavljao težak posao konvertovanja svega na ruski u realnom vremenu. Tokom desetak poruka sve je delovalo glatko. Onda je, niotkuda, Rus napisao nešto što se slobodno prevedeno glasilo: „Čekaj, ti si muškarac ili žena?" Pitanje je delovalo bizarno. Ništa u razgovoru nije imalo veze sa polom. Nije bilo nejasnoće u profilnoj slici, nikakvog mešanja imena. Tema je bila struktura baze podataka. Pa ipak, iz perspektive druge osobe, pitanje je imalo potpun smisao.
Ruski je gramatički rodno obojen jezik. Glagoli u prošlom vremenu, pridevi i čak neki imenice menjaju oblik u zavisnosti od gramatičkog roda govornika. Kada neko napiše „uradio sam" na ruskom, nastavak glagola govori čitaocu da li je govornik muškarac ili žena. Google Translate, radeći sa nula konteksta o tome ko piše, izabrao je ženske glagolske oblike za svaku jednu poruku. Za ruskog čitaoca izgledalo je tačno kao da žena piše. Stvarni govornik je bio muškarac. Prevodilac nije imao način da to sazna, jer mu niko nije rekao, a nikada nije ni pitao.
To nije bila sitna stilistička osobenost. Ceo ton razgovora se promenio. Gramatički rod u ruskom nije opciona dekoracija. Ugrađen je u strukturu skoro svake rečenice koja se odnosi na govornika u prošlom vremenu. Reći „otišao sam u prodavnicu" koristi različitu reč u zavisnosti od toga da li je otišao muškarac ili žena. Reći „bio sam umoran" se menja. Reći „završio sam projekat" se menja. Svaka izjava u prvom licu u prošlom vremenu je emitovala pogrešan identitet tokom celog razgovora, a ruski učesnik je jednostavno pretpostavio da je izlaz prevodioca tačan.
Taj trenutak je bio okidač. Ne iritacija zbog jednog pogrešnog prevoda, već spoznaja da najkorišćeniji prevodilački alat na planeti apsolutno nema mehanizam za saznavanje nečega tako fundamentalnog kao što je pol govornika. Ne pita. Ne zaključuje. Bira podrazumevanu vrednost i nastavlja dalje, ostavljajući čitaoca da donosi zaključke koji mogu biti potpuno pogrešni. Rešenje nije bio bolji algoritam. Rešenje je bio kontekst.
🌐AI преводилац
Преведите, парафразирајте, исправите и објасните текст на 105+ језика. Превод на више језика, прилагођени контексти и акције селекције.
Engleski je jezik koji u velikoj meri izbegava gramatički rod u svakodnevnom govoru. „I went" je „I went" bez obzira ko govori. „I was happy" se ne menja na osnovu identiteta govornika. To govornicima engleskog olakšava da zaborave da većina velikih svetskih jezika ne funkcioniše na taj način. Ruski, arapski, hebrejski, hindi, francuski, španski, portugalski, nemački, poljski, češki i desetine drugih — svi kodiraju rod u svoju gramatiku u različitoj meri.
Problem za mašinski prevod je jednostavan. Kada je izvorni tekst na engleskom, nema rodnih markera za izdvajanje. Rečenica „I was surprised" daje prevodiocu nula informacija o tome da li koristiti muški ili ženski oblik na ciljnom jeziku. Ljudski prevodilac bi pitao ili bi znao iz prethodnog konteksta. Mašinski prevodilac bira oblik koji se češće pojavljivao u njegovim trening podacima.
Ovo nije granični slučaj koji pogađa šačicu nepoznatih jezičkih parova. Samo ruski ima preko 250 miliona govornika. Arapski preko 300 miliona. Španski preko 500 miliona. Hindi preko 600 miliona.
Šta kontekstualne kategorije zapravo rade sa prevodom
Pol govornika je jedna od deset kontekstualnih kategorija koje oblikuju način na koji AI proizvodi svoje prevode. Ceo set pokriva industriju, ciljnu publiku, nivo formalnosti, registar, ton, svrhu, terminologiju domena, pol govornika, regionalni varijant i temu. Svaka kategorija ima više opcija. Zajedno, ovih deset kategorija sadrži 117 individualnih opcija.
Pored toga, postoje 22 jezička podešavanja sa 78 opcija koja kontrolišu lingvističke detalje specifične za pojedinačne jezike. Stvari poput toga da li koristiti formalno ili neformalno obraćanje u jezicima koji prave razliku između ta dva. Da li preferirati latinicu ili ćirilicu na srpskom.
Sva ova podešavanja se spljošte u jedan kontekstualni niz koji prati svaki zahtev za prevod. AI model čita ovaj kontekst pre nego što obradi izvorni tekst. Rezultat nije generički prevod koji je slučajno gramatički tačan. Razlika između prevoda sa punim kontekstom i bez njega je često dramatična. Stranica AI tekstualni prevodilac prolazi kroz konkretne primere.
Razgovor koji je skoro uništio poslovni odnos
Vraćajući se na originalni ruski razgovor, posledice su se protezale izvan trenutka neprijatnosti. Osoba sa druge strane je provela deset poruka gradeći mentalnu sliku o tome sa kim razgovara, i ta slika je bila pogrešna. Kada se pojavilo pitanje o polu i izvršena korekcija, došlo je do primetnog resetovanja u razgovoru.
U neformalnom četu ovo je zabavna anegdota. U poslovnom kontekstu moglo bi biti zaista štetno. Zamislite slanje predloga za partnerstvo na arapskom gde glagolski oblici sugerišu da je pošiljalac žena kada je pošiljalac muškarac.
Isti princip važi za interakcije korisničke podrške, pravnu komunikaciju, medicinsku korespondenciju i svaku situaciju gde identitet govornika ima značaj. Prava alternativa za Google Translate mora da se nosi sa ovim davanjem korisniku kontrole nad kontekstom.
Izvan roda: pun obim nedostajućeg konteksta
Gramatički rod je najvidljiviji primer propusta konteksta u prevodu, ali daleko od jedinog. Razmotrite formalnost. U japanskom, nivo učtivosti kodiran u govoru može varirati toliko dramatično da ista rečenica, prevedena na različitim nivoima formalnosti, gotovo ne deli nikakav vokabular. Nemački razlikuje „du" i „Sie". Francuski ima „tu" i „vous". Španski ima „tú" i „usted".
Industrijski žargon je još jedna oblast gde je kontekst suštinski. Reč „protokol" znači nešto specifično u medicini, nešto drugo u umrežavanju i nešto potpuno drugačije u diplomaciji.
Vodič za korišćenje YEB Translate-a pokriva ceo proces podešavanja. Kontekstualni sistem je deo koji je uvek nedostajao. On ne čini AI pametnijim. On daje AI informacije potrebne za donošenje inteligentnih izbora.
Često postavljana pitanja
Da li Google Translate obrađuje gramatički rod ispravno
Google Translate ne pita i ne uzima u obzir pol govornika. Pri prevodu sa engleskog na jezike sa gramatičkim rodom kao što su ruski, arapski ili španski, podrazumevano bira oblik koji se najčešće pojavljivao u trening podacima.
Postoji li besplatni AI prevodilac koji podržava kontekstualna podešavanja
YEB Translate koristi model plaćanja po upotrebi sa kreditima umesto pretplate. Krediti se troše samo kada se tekst zaista obrađuje.
Šta je kontekstualni prevod i zašto je važan
Kontekstualni prevod znači da AI model prima informacije o govorniku, publici, industriji, nivou formalnosti i drugim faktorima pre nego što generiše prevod.
Koji jezici zahtevaju gramatički rod u prevodu
Većina široko govorenih svetskih jezika koristi gramatički rod u izvesnoj meri. Ruski, arapski, hebrejski, hindi, francuski, španski, portugalski, italijanski, nemački, poljski, češki i mnogi drugi.
Mogu li AI prevodioci da zamene ljudske prevodioce za jezike sa gramatičkim rodom
AI prevodioci mogu da proizvedu odlične rezultate u jezicima sa gramatičkim rodom kada dobiju odgovarajući kontekst.
Koja je najbolja alternativna aplikacija za Google Translate