Der er et dokument liggende i en delt mappe et sted, som skulle være en produktbeskrivelse til et engelsk publikum. Teksten var oprindeligt skrevet på tysk, oversat til engelsk ved hjælp af et af de vigtigste online oversættelsesværktøjer og leveret til marketingteamet. Det så fint ud ved første øjekast. Grammatikken var korrekt, sætningerne flød rimeligt godt, og betydningen blev bevaret. Derefter flaggede nogen i London det. Dokumentet brugte "color" i stedet for "colour," "organize" i stedet for "organise," "center" i stedet for "centre," og "analyze" i stedet for "analyse." Hvert eneste stavningsvalg fulgte amerikanske konventioner. For et dokument rettet mod britiske kunder, udgivet på et .co.uk-domæne, var dette ikke acceptabelt.

Den frustrerende del var ikke, at oversættelsen var forkert. Den frustrerende del var, at der ingen måde at fortælle værktøjet, hvilken version af engelsk der skulle produceres. Google Translate har en enkelt mulighed: English. DeepL har en enkelt mulighed: English. Ingen spørger, om målgruppen er en læser i Manchester eller en læser i Manhattan. Outputtet genereres, varianten vælges baseret på, hvilket mønster der forekom mest i træningsdataene, og brugeren får manuelt at søge og erstatte hver forekomst af amerikansk stavemåde i et dokument, der skulle have været britisk fra starten.

Dette lyder måske som en mindre klage. Stavningsforskelle mellem britisk og amerikansk engelsk er vel dokumenterede og relativt forudsigelige. Men forskellene går langt ud over at bytte "ou" til "o" og "ise" til "ize." Ordforrådet divergerer betydeligt. En "boot" er en kofanger. En "bonnet" er en motorhjelm. "Trousers" er bukser, men "pants" er underbukser. "Biscuits" er småkager. "Chips" er pommes frites, men "crisps" er chips. En "flat" er en lejlighed. "Første sal" er faktisk anden sal. Disse ordforrådsforskelle kan virkelig forvirre læserne, når den forkerte variant vises i en ellers velskrevet tekst.

For alle, der administrerer flersprogigt indhold, især websteder, apps eller marketingmaterialer, der skal findes i både britisk og amerikansk engelsk, skaber manglen på variantkontrol i oversættelsesværktøjer rigtig arbejde. Hvert oversat dokument har brug for en manuel gennemgangsprocedure specifikt for at fange og korrigere variantfejl. Denne gennemgangsprocedure tager tid, koster penge og er helt undgåelig, hvis oversættelsesværktøjet blot vidste, hvilken variant der skal produceres.