Farbe oder Colour und warum KI-Übersetzung Sprachvarianten-Kontext benötigt

Irgendwo in einem gemeinsamen Ordner liegt ein Dokument, das eine Produktbeschreibung für ein UK-Publikum sein sollte. Der Text wurde ursprünglich auf Deutsch geschrieben, mit einem der großen Online-Übersetzungstools ins Englische übersetzt und dem Marketing-Team geliefert. Auf den ersten Blick sah es gut aus. Die Grammatik war korrekt, die Sätze flossen angemessen und die Bedeutung blieb erhalten. Dann meldete sich jemand aus London. Das Dokument verwendete "color" statt "colour", "organize" statt "organise", "center" statt "centre" und "analyze" statt "analyse". Jede einzelne Schreibweise folgte amerikanischen Konventionen. Für ein Dokument, das auf britische Kunden ausgerichtet ist und auf einer .co.uk-Domain veröffentlicht wird, war dies nicht akzeptabel.

Das Frustrierende war nicht, dass die Übersetzung falsch war. Das Frustrierende war, dass es keine Möglichkeit gab, dem Tool zu sagen, welche Version des Englischen produziert werden sollte. Google Translate hat eine einzige Option: Englisch. DeepL hat eine einzige Option: Englisch. Keines fragt, ob das Ziel ein Leser in Manchester oder ein Leser in Manhattan ist. Die Ausgabe wird generiert, die Variante wird nach dem Muster gewählt, das in den Trainingsdaten am häufigsten vorkommt, und der Benutzer muss manuell jede Instanz der amerikanischen Schreibweise in einem Dokument suchen und ersetzen, das von Anfang an britisch sein sollte.

Das mag wie eine kleinliche Beschwerde klingen. Schreibweise-Unterschiede zwischen britischem und amerikanischem Englisch sind gut dokumentiert und relativ vorhersehbar. Aber die Unterschiede gehen weit über das Austausch von "ou" gegen "o" und "ise" gegen "ize" hinaus. Der Wortschatz divergiert erheblich. Ein "boot" ist ein Kofferraum. Eine "bonnet" ist eine Motorhaube. "Trousers" sind Hosen, aber "pants" sind Unterwäsche. "Biscuits" sind Kekse. "Chips" sind Pommes frites, aber "crisps" sind Chips. Eine "flat" ist eine Wohnung. Der "first floor" ist tatsächlich der zweite Flur. Diese Wortschatz-Unterschiede können Leser wirklich verwirren, wenn die falsche Variante in einem ansonsten gut geschriebenen Text erscheint.

Für jeden, der mehrsprachige Inhalte verwaltet, besonders Websites, Apps oder Marketingmaterialien, die in britischem und amerikanischem Englisch existieren müssen, schafft die mangelnde Varianten-Kontrolle in Übersetzungstools echte Arbeit. Jedes übersetzte Dokument benötigt einen manuellen Überprüfungsdurchgang, um speziell Varianten-Unstimmigkeiten zu fangen und zu korrigieren. Dieser Überprüfungsdurchgang kostet Zeit, kostet Geld und ist völlig vermeidbar, wenn das Übersetzungstool einfach weiß, welche Variante produziert werden soll.

Farbe oder Colour und warum KI-Übersetzung ohne Kontext sinnlos ist

Gleiche Sprache, unterschiedliche Konventionen, keine Kontrolle

Warum Training-Daten-Voreingenommenheit dies schlimmer macht als es erscheint

Die echten Kosten, die Variante falsch zu bekommen

Auch verfügbar in: