Een Rus vroeg me of ik een man of vrouw ben vanwege Google Translate

Waarom grammaticaal geslacht machinevertaling breekt

Engels is een taal die grammaticaal geslacht grotendeels vermijdt in alledaagse spraak. "I went" is "I went" ongeacht wie er spreekt. "I was happy" verandert niet op basis van de identiteit van de spreker. Dit maakt het makkelijk voor Engelssprekenden om te vergeten dat de meeste grote talen ter wereld niet zo werken. Russisch, Arabisch, Hebreeuws, Hindi, Frans, Spaans, Portugees, Duits, Pools, Tsjechisch en tientallen andere coderen allemaal geslacht in hun grammatica in verschillende mate.

Het probleem voor machinevertaling is eenvoudig. Wanneer de brontekst Engels is, zijn er geen geslachtsmarkeringen te extraheren. De zin "I was surprised" geeft de vertaler nul informatie over of een mannelijke of vrouwelijke vorm in de doeltaal moet worden gebruikt. Een menselijke vertaler zou vragen, of zou het weten uit eerdere context. Een machinevertaler kiest de vorm die het vaakst voorkwam in de trainingsdata, wat voor de meeste talen standaard mannelijk is, hoewel niet altijd consistent. Google Translate is waargenomen wisselend tussen mannelijke en vrouwelijke vormen binnen een enkele alinea, waardoor tekst ontstaat die leest alsof de spreker halverwege het gesprek van geslacht veranderde.

Dit is geen randgeval dat een handvol obscure talenparen treft. Russisch alleen al heeft meer dan 250 miljoen sprekers. Arabisch heeft er meer dan 300 miljoen. Spaans heeft er meer dan 500 miljoen. Hindi heeft er meer dan 600 miljoen. In elk van deze talen klinkt verkeerd grammaticaal geslacht niet alleen onhandig. Het creëert echte verwarring over wie er spreekt en kan de geloofwaardigheid van het hele bericht ondermijnen. Een zakelijk voorstel dat de verkeerde geslachtsvormen gebruikt, komt in het beste geval slordig over en in het slechtste geval geautomatiseerd. Een persoonlijk bericht dat het geslacht van de spreker verkeerd identificeert, is actief misleidend.

De oplossing geïmplementeerd in YEB Translate is conceptueel bijna gênant eenvoudig, hoewel de uitvoering zorgvuldig ontwerp vereiste. Onder de contextcategorieën beschikbaar in de vertaalinstellingen is er een het geslacht van de spreker. Het eenmaal instellen vertelt het AI-model om de correcte geslachtsvormen te gebruiken in elke output, voor elke taal die het vereist. Er is geen noodzaak om het opnieuw te specificeren per zin of per alinea. De context blijft behouden gedurende de hele sessie, en de output leest alsof het geschreven is door of voor een persoon van het opgegeven geslacht vanaf het allereerste woord.

Wat contextcategorieën werkelijk doen met een vertaling

Het geslacht van de spreker is een van tien contextcategorieën die bepalen hoe de AI zijn vertalingen produceert. De volledige set omvat branche, doelgroep, formaliteitsniveau, register, toon, doel, domeinspecifieke terminologie, geslacht van de spreker, regionale variant en onderwerp. Elke categorie heeft meerdere opties. Branche alleen al biedt keuzes van technologie en financiën tot gezondheidszorg, juridisch, marketing, onderwijs en meer. Formaliteit bestrijkt vijf niveaus van extreem informeel tot zeer formeel. Samen bevatten deze tien categorieën 117 individuele opties die kunnen worden gemengd en gecombineerd om de exacte context van elke vertaaltaak te beschrijven.

Daarbovenop zijn er 22 taalinstellingen met 78 opties die taalkundige details specifiek voor individuele talen regelen. Zaken als of je formeel of informeel "jij/u" moet gebruiken in talen die onderscheid maken tussen de twee, wat bijna elke Europese taal is behalve Engels. Of je de voorkeur moet geven aan Latijns of Cyrillisch schrift in het Servisch. Of je vereenvoudigde of traditionele Chinese karakters moet gebruiken. Deze instellingen gaan niet over wat er gezegd wordt. Ze gaan over hoe het gezegd wordt, op een detailniveau dat generieke vertaaltools simpelweg niet bieden.

Al deze instellingen worden afgevlakt tot één enkele contextstring die elk vertaalverzoek vergezelt. Het AI-model leest deze context voordat het de brontekst verwerkt, wat betekent dat het de branche, het publiek, de toon, de formaliteit en ja, het geslacht van de spreker kent voordat het een enkel woord output produceert. Het resultaat is geen generieke vertaling die toevallig grammaticaal correct is. Het is een vertaling die klinkt alsof het geschreven is door iemand die de situatie, het publiek en de conventies van de doeltaal begrijpt. Het verschil tussen een vertaling met volledige context en een zonder is vaak zo dramatisch dat ze eruit zien alsof ze door compleet verschillende tools zijn geproduceerd. De pagina AI-tekstvertaler loopt specifieke voorbeelden door voor iedereen die benieuwd is hoe verschillend de outputs kunnen zijn.

Het gesprek dat bijna een zakelijke relatie ruïneerde

Terugkerend naar het oorspronkelijke Russische gesprek, reikten de gevolgen verder dan een moment van ongemak. De persoon aan de andere kant had tien berichten besteed aan het opbouwen van een mentaal beeld van met wie ze spraken, en dat beeld was verkeerd. Toen de geslachtsvraag opkwam en de correctie werd gemaakt, was er een merkbare reset in het gesprek. Geen vijandigheid, maar een herkalibratie. Het vertrouwen dat werd opgebouwd was licht beschadigd omdat het communicatiemedium valse informatie had geïntroduceerd.

In een informele chat is dit een grappige anekdote. In een zakelijke context kan het echt schadelijk zijn. Stel je voor dat je een partnerschapsvoorstel in het Arabisch stuurt waar de werkwoordsvormen suggereren dat de afzender een vrouw is terwijl de afzender een man is, of andersom. De ontvanger zegt misschien niets, maar zal het opmerken, en de indruk die achterblijft is dat de afzender ofwel de taal niet begrijpt waarin hij beweert te communiceren, ofwel vertaaltools van lage kwaliteit gebruikt. Geen van beide indrukken helpt bij het sluiten van een deal.

Hetzelfde principe geldt voor klantenservice-interacties, juridische communicatie, medische correspondentie en elke situatie waarin de identiteit van de spreker ertoe doet. In talen met grammaticaal geslacht is de identiteit van de spreker gecodeerd in de grammatica zelf. Die informatie verwijderen, of erger, verkeerd invullen, is geen neutrale handeling. Het vervormt het bericht actief. Een goed alternatief voor Google Translate moet hiermee om kunnen gaan, en ermee omgaan betekent de gebruiker controle geven over de context, niet proberen het te raden uit onvoldoende data.

Voorbij geslacht: de volledige reikwijdte van ontbrekende context

Grammaticaal geslacht is het meest zichtbare voorbeeld van contextfalen in vertaling, maar het is verre van het enige. Neem formaliteit. In het Japans kan het beleefdheidsnniveau gecodeerd in spraak zo dramatisch variëren dat dezelfde zin, vertaald op verschillende formaliteitsniveaus, bijna geen woordenschat deelt. Duits onderscheidt tussen "du" en "Sie" voor informele en formele aanspreking. Frans heeft "tu" en "vous". Spaans heeft "tú" en "usted". In elk geval communiceert het kiezen van het verkeerde formaliteitsniveau iets over de relatie tussen spreker en luisteraar, en dat iets kan volkomen onjuist zijn.

Vakjargon is een ander gebied waar context essentieel is. Het woord "protocol" betekent iets specifieks in de geneeskunde, iets anders in netwerken en weer iets anders in de diplomatie. "Engagement" in marketing verwijst naar gebruikersinteractiemetingen. In militaire context verwijst het naar gevechten. In persoonlijke context verwijst het naar een huwelijksaanzoek. Een vertaler die zonder branchecontext opereert, kiest de betekenis die zijn trainingsdata begunstigen, en als de brontekst uit een nichegebied komt, kan het resultaat compleet verkeerd zijn.

De handleiding voor het gebruik van YEB Translate behandelt het volledige installatieproces, inclusief hoe contextcategorieën te configureren voor specifieke werkstromen. Voor iedereen die de frustratie heeft ervaren van vertalingen die vaag correct klinken maar de bedoelde betekenis missen, is het contextsysteem het ontbrekende stuk. Het maakt de AI niet slimmer. Het geeft de AI de informatie die het nodig heeft om intelligente keuzes te maken — dezelfde informatie die een menselijke vertaler zou vragen voordat het werk begint.

Veelgestelde vragen

Behandelt Google Translate grammaticaal geslacht correct

Google Translate vraagt niet naar en houdt geen rekening met het geslacht van de spreker. Bij het vertalen uit het Engels naar talen met grammaticaal geslacht zoals Russisch, Arabisch of Spaans, kiest het standaard de vorm die het vaakst voorkwam in de trainingsdata. Dit kan ertoe leiden dat het verkeerde geslacht wordt gebruikt gedurende een heel gesprek, wat verwarring creëert voor de lezer en de identiteit van de spreker verkeerd weergeeft.

Is er een gratis AI-vertaler die contextinstellingen ondersteunt

YEB Translate gebruikt een betaal-per-gebruik kredietmodel in plaats van een abonnement. Credits worden alleen verbruikt wanneer tekst daadwerkelijk wordt verwerkt, en het contextsysteem met alle tien categorieën is beschikbaar bij elk verzoek. Er is geen apart prijsniveau voor contextbewuste vertaling.

Wat is contextbewuste vertaling en waarom is het belangrijk

Contextbewuste vertaling betekent dat het AI-model informatie ontvangt over de spreker, het publiek, de branche, het formaliteitsniveau en andere factoren voordat het de vertaling genereert. Deze informatie vormt woordkeuze, grammatica, toon en register in de output. Zonder context raadt het model al deze factoren, wat leidt tot vertalingen die technisch correct zijn maar vaak ongepast voor de werkelijke situatie.

Welke talen vereisen grammaticaal geslacht in vertaling

De meeste van de meest gesproken talen ter wereld gebruiken grammaticaal geslacht in enige mate. Russisch, Arabisch, Hebreeuws, Hindi, Frans, Spaans, Portugees, Italiaans, Duits, Pools, Tsjechisch en vele andere vereisen allemaal geslachtsovereenkomst in werkwoorden, bijvoeglijke naamwoorden of beide. Engels is de uitzondering in plaats van de regel, daarom zijn geslachtsproblemen in vertaling vaak onzichtbaar voor Engelssprekenden totdat iemand aan de andere kant erop wijst.

Kunnen AI-vertalers menselijke vertalers vervangen voor talen met grammaticaal geslacht

AI-vertalers kunnen uitstekende resultaten produceren in talen met grammaticaal geslacht wanneer ze de juiste context krijgen. De sleutel is het bieden van de context die een menselijke vertaler van nature zou vragen: wie spreekt, wie is het publiek, wat is het formaliteitsniveau en wat is het onderwerp. Zonder die context is AI-output in talen met grammaticaal geslacht onbetrouwbaar. Met die context is de output vaak niet te onderscheiden van professionele menselijke vertaling voor standaard zakelijke en persoonlijke communicatie.

Wat is de beste alternatieve app voor Google Translate

Het beste alternatief hangt af van wat Google Translate fout doet. Voor gebruikers die contextbewuste output nodig hebben met controle over geslacht, formaliteit en brancheterminologie, vult YEB's AI-tekstvertaler de gaten die Google open laat. Voor professionele vertaling op grote schaal bieden tools zoals DeepL sterke kwaliteit in Europese talen. De vergelijking van de 10 beste AI-vertaaltools biedt een gedetailleerd overzicht van sterke en zwakke punten van de belangrijkste opties.