Det ligger et dokument i en delt mappe et sted som skulle vært en produktbeskrivelse for et UK-publikum. Teksten var opprinnelig skrevet på tysk, oversatt til engelsk ved hjelp av ett av de store nettbaserte oversettelsesverktøyene, og levert til markedsføringsteamet. Det så bra ut ved første øyekast. Grammatikken var riktig, setningene fløt rimelig godt, og betydningen var bevart. Så flagget noen i London det. Dokumentet brukte "color" i stedet for "colour," "organize" i stedet for "organise," "center" i stedet for "centre," og "analyze" i stedet for "analyse." Hver eneste stavemåtevalg fulgte amerikanske konvensjoner. For et dokument rettet mot britiske kunder, publisert på et .co.uk-domene, var dette ikke akseptabelt.

Den frustrerende delen var ikke at oversettelsen var feil. Den frustrerende delen var at det ikke var noen måte å fortelle verktøyet hvilken versjon av engelsk som skulle produseres. Google Translate har ett alternativ: Engelsk. DeepL har ett alternativ: Engelsk. Ingen spør om målet er en leser i Manchester eller en leser i Manhattan. Resultatet blir generert, varianten blir valgt av hvilket mønster som så ut til å være mest i treningsdataene, og brukeren må manuelt finne og erstatte hver instans av amerikansk stavemåte i et dokument som skulle vært britisk fra starten av.

Dette kan høres ut som en mindre klage. Stavemåteforskjeller mellom britisk og amerikansk engelsk er godt dokumentert og relativt forutsigbar. Men forskjellene går langt utover å bytte "ou" for "o" og "ise" for "ize." Ordforrådet avviker betydelig. En "boot" er en koffert. En "bonnet" er en panserkap. "Trousers" er bukser, men "pants" er undertøy. "Biscuits" er kjeks. "Chips" er pommes frites, men "crisps" er potetgull. En "flat" er en leilighet. "First floor" er egentlig andre etasje. Disse ordforrådsforskjellene kan genuint forvirre lesere når feil variant vises opp i en ellers velskrevet tekst.

For alle som administrerer flerspråklig innhold, spesielt nettsteder, apper eller markedsføringsmateriale som må eksistere på både britisk og amerikansk engelsk, skaper mangelen på variantkontroll i oversettelsesverktøy reelt arbeid. Hvert oversatt dokument trenger en manuell gjennomgangsporing spesielt for å fange og korrigere variantmismatches. Den gjennomgangen tar tid, koster penger, og er helt unødvendig hvis oversettelsesverktøyet bare visste hvilken variant som skulle produseres.