هناك مستند موجود في مجلد مشترك في مكان ما كان من المفروض أن يكون وصفًا للمنتج لجمهور بريطاني. تمت كتابة النص في الأصل باللغة الألمانية، وترجم إلى اللغة الإنجليزية باستخدام إحدى أدوات الترجمة الرئيسية عبر الإنترنت، وتم تسليمه لفريق التسويق. بدا جيدًا للوهلة الأولى. كانت القواعد النحوية صحيحة، وكانت الجمل تسير بشكل معقول، وتم الحفاظ على المعنى. ثم أشار شخص ما في لندن إلى ذلك. استخدم المستند "color" بدلاً من "colour"، و"organize" بدلاً من "organise"، و"center" بدلاً من "centre"، و"analyze" بدلاً من "analyse". كل اختيار إملائي واحد اتبع الاتفاقيات الأمريكية. بالنسبة لمستند موجه للعملاء البريطانيين، منشور على نطاق .co.uk، كان هذا غير مقبول.
الجزء الذي كان محبطًا لم يكن أن الترجمة كانت خاطئة. الجزء الذي كان محبطًا حقًا هو أنه لا توجد طريقة لإخبار الأداة بأي نسخة من اللغة الإنجليزية يجب إنتاجها. Google Translate لديه خيار واحد فقط: اللغة الإنجليزية. DeepL لديه خيار واحد فقط: اللغة الإنجليزية. لا أحد يسأل ما إذا كان المقصد هو القارئ في مانشستر أو قارئ في مانهاتن. يتم إنشاء الإخراج، ويتم اختيار المتغير حسب أي نمط ظهر في بيانات التدريب، ويحصل المستخدم على البحث اليدوي والاستبدال لكل مثيل من الإملاء الأمريكي في مستند كان من المفروض أن يكون بريطانيًا من البداية.
قد يبدو هذا وكأنه شكوى طفيفة. الاختلافات الإملائية بين اللغة الإنجليزية البريطانية والأمريكية موثقة جيدًا وسهلة التنبؤ نسبيًا. لكن الاختلافات تتجاوز بكثير استبدال "ou" بـ "o" و"ise" بـ "ize". يختلف القاموس بشكل كبير. "boot" هو صندوق السيارة. "bonnet" هو الغطاء. "Trousers" هي البنطال، لكن "pants" هي الملابس الداخلية. "Biscuits" هي البسكويت. "Chips" هي البطاطا المقلية، لكن "crisps" هي الرقائق. "flat" هي شقة. "first floor" هو في الواقع الطابق الثاني. هذه الاختلافات في المفردات يمكن أن تربك القارئين حقًا عندما يظهر المتغير الخاطئ في نص مكتوب بشكل جيد.
بالنسبة لأي شخص يدير محتوى متعدد اللغات، خاصة المواقع والتطبيقات والمواد التسويقية التي تحتاج إلى أن توجد باللغة الإنجليزية البريطانية والأمريكية، فإن عدم وجود التحكم في متغير اللغة في أدوات الترجمة ينشئ عملاً حقيقيًا. كل مستند مترجم يحتاج إلى عملية مراجعة يدوية محددة للتقاط وتصحيح عدم تطابق المتغيرات. تستغرق هذه المراجعة وقتًا وتكلفة، وتماما قابلة للتجنب إذا كانت أداة الترجمة ببساطة تعرف أي متغير يجب إنتاجه.
نفس اللغة، قوانين مختلفة، بدون تحكم
اللغة الإنجليزية البريطانية والأمريكية ليست الزوج الوحيد الذي يعاني من هذه المشكلة، على الرغم من أنهما الأكثر شيوعًا. تنقسم البرتغالية إلى البرتغالية البرازيلية والبرتغالية الأوروبية، مع اختلافات في الإملاء والقواعد النحوية والقاموس وحتى استخدام الضمائر التي كبيرة بما يكفي لجعل النص يبدو غريبًا على قارئي المتغير الآخر. تختلف اللغة الإسبانية بين الاتفاقيات اللاتينية الأمريكية وشبه الجزيرة، مع أشكال الأفعال والعامية والمفردات التي تختلف بشكل كبير. الفرنسية لديها اتفاقيات مميزة في فرنسا وكندا وبلجيكا والعديد من الدول الأفريقية. تنقسم اللغة الصينية إلى أحرف مبسطة وتقليدية، وهي ليست مجرد اختلاف إملائي بل مجموعة أحرف مختلفة تماما.
في كل من هذه الحالات، إنتاج المتغير الخاطئ ليس مشكلة تجميلية طفيفة. القارئ البرازيلي الذي يواجه الإملاء البرتغالي الأوروبي في وصف المنتج سيلاحظ ذلك على الفور. يخلق شعورًا بالمسافة، كما لو أن الشركة لم تهتم بما يكفي لتحلية المنتج محليًا. بالنسبة للشركات التي تحاول بناء ثقة في أسواق إقليمية محددة، فإن هذا النوع من عدم التطابق يقوض الجهد برمته. كان المحتوى قد يترك بدون ترجمة إذا كانت الترجمة تشير إلى "نحن في الواقع لا نعرف سوقك".
يغطي الدليل الخاص بالتحويل بين اللغة الإنجليزية الأمريكية والبريطانية على YEB الإعدادات المحددة المعنية. في YEB Translate، متغير اللغة هو واحد من 22 إعدادات لغة متاحة في نظام السياق. عند اختيار اللغة الإنجليزية كلغة الهدف، يمكن للمستخدم تحديد المتغيرات الإقليمية الأمريكية أو البريطانية أو الأسترالية أو غيرها. يتلقى نموذج الذكاء الاصطناعي هذا التفضيل كجزء من سلسلة السياق وينتج إخراجًا يستخدم بشكل ثابت اتفاقيات التهجئة الصحيحة واختيارات المفردات والتعابير الاصطلاحية لهذا المتغير. لا توجد حاجة إلى مرحلة تحرير لاحقة.
نفس الآلية تعمل لكل زوج من اللغات الذي يحتوي على متغيرات إقليمية. البرتغالية البرازيلية مقابل الأوروبية. الإسبانية اللاتينية الأمريكية مقابل شبه الجزيرة. الأحرف الصينية المبسطة مقابل التقليدية. الفرنسية الكندية مقابل العاصمة. يتم إجراء الإعداد مرة واحدة، ويستمر عبر الجلسة، وينطبق على كل جزء من النص المعالج أثناء تلك الجلسة. بالنسبة لفرق المحتوى التي تتعامل مع التوطين على نطاق واسع، فإن هذا يقضي على فئة كاملة من أعمال ضمان الجودة.
لماذا يجعل انحياز بيانات التدريب هذا أسوأ مما يبدو
السبب في أن معظم أدوات الترجمة تختار الإنجليزية الأمريكية هو واضح: الإنترنت يحتوي على المزيد من النصوص باللغة الإنجليزية الأمريكية من اللغة الإنجليزية البريطانية. تأتي بيانات التدريب لنماذج الذكاء الاصطناعي في الغالب من محتوى الويب، والمحتوى على الويب مهيمن عليه من قبل المنشورات الأمريكية والشركات الأمريكية والنصوص التي ينشئها المستخدمون الأمريكيون. عندما يتعلم نموذج الذكاء الاصطناعي كيفية "صحيح" اللغة الإنجليزية، فإنه يتعلم من مجموعة بيانات تنحاز إلى الأمريكية بشكل افتراضي.
هذا الانحياز ليس مقصودًا، لكنه مستمر. حتى عندما يتم تحديث أدوات الترجمة بنماذج أحدث، فإن توزيع البيانات الأساسي لم يتغير. تظل اللغة الإنجليزية الأمريكية هي المتغير الأغلبية في مجموعات بيانات التدريب، مما يعني أن الإخراج الافتراضي يستمر في الميل نحو الأمريكية بغض النظر عما إذا كان المستخدم يحتاج إلى البريطانية أو الأسترالية أو الأفريقية الجنوبية أو أي متغير آخر. النموذج لا يختار اللغة الإنجليزية الأمريكية لأنها أفضل. إنه يختارها لأنه رأى المزيد منها.
بالنسبة للمستخدمين الذين يترجمون إلى اللغة الإنجليزية من لغات أخرى، يخلق هذا مشكلة غير مرئية. يبدو الإخراج صحيحًا لأنه صحيح نحويًا. الجمل منطقية. القاموس مناسب. لكن المتغير خاطئ بالنسبة للجمهور المقصود، وما لم يكن المستخدم معروفًا بما يكفي بكلا المتغيرات للتقاط كل اختلاف، فإن عدم التطابق ينزلق من خلال. قد لا يلاحظ مدير التسويق الألماني الذي يترجم نسخة المنتج لسوق المملكة المتحدة أن "aluminum" يجب أن يكون "aluminium" أو أن "skeptical" يجب أن يكون "sceptical". هذه ليست أخطاء يشير إليها فاحصو القواعس النحوية لأن كلا الإملائين صحيحان. إنهم فقط صحيحون في دول مختلفة.
يعامل نظام السياق في مترجم الذكاء الاصطناعي من YEB متغير اللغة كإعداد من الدرجة الأولى بدلاً من فكرة لاحقة. هذا مهم لأن نموذج الذكاء الاصطناعي يضبط ليس فقط الإملاء بل اختيار المفردات والتعبيرات الاصطلاحية وحتى بنية الجملة بناءً على المتغير. تميل اللغة الإنجليزية البريطانية نحو إنشاءات رسمية قليلاً أكثر في الكتابة التجارية. تستخدم اللغة الإنجليزية الأمريكية عبارات أكثر مباشرة. اللغة الإنجليزية الأسترالية لها سجلها غير الرسمي الخاص بها الذي يختلف عن كلا. هذه اختلافات دقيقة ينتجها متحدث لغة أم بشري بشكل لا واعٍ، وأن نموذج الذكاء الاصطناعي يمكنه فقط إعادة إنتاجها عند إخباره بأي متغير يجب استهدافه.
التكلفة الحقيقية للحصول على المتغير بشكل خاطئ
بالنسبة لرسالة بريد إلكتروني شخصية، لا أحد يهتم بما إذا كان "colour" أو "color" يظهر. بالنسبة للمحتوى المنشور، تكون الرهانات مختلفة. موقع .co.uk يستخدم الإملاء الأمريكي في جميع أنحاء يبدو غير مصقول. موقع .com يستهدف قراء أستراليين بإملاء بريطاني يبدو قليلاً خاطئًا. هذه ليست فشل درامي. إنها جروح ورقية تتراكم وتخلق انطباعًا عامًا بالإهمال.
في الصناعات المنظمة، قد يكون اتساق المتغيرات مسألة امتثال. تتبع الوثائق القانونية في المملكة المتحدة الاتفاقيات البريطانية. تستخدم الأدبيات الطبية لـ NHS المصطلحات البريطانية. تتبع المنشورات الحكومية أدلة أسلوب صارمة تحدد استخدام المتغيرات حتى الكلمات الفردية. تقديم مستند مترجم يستخدم المتغير الخاطئ في هذه السياقات ليس مجرد إهمال. يمكنه أن يؤدي إلى طلبات الرفض أو المراجعة التي تؤخر المشاريع الكاملة.
يسلط المقارنة مع DeepL الضوء على هذا كواحد من المناطق المحددة حيث تقع أدوات الترجمة العامة. ينتج DeepL ترجمات ممتازة من حيث الطلاقة والدقة، لكن حتى وقت قريب لم يوفر طريقة لتحديد أي متغير اللغة الإنجليزية يجب إنتاجه. كان يتعين على المستخدمين الذين احتاجوا إلى اللغة الإنجليزية البريطانية إما قبول ما أعطاهم النموذج أو تشغيل خطوة تحويل منفصلة لاحقًا. يوجد نفس القيد في معظم أدوات الترجمة الرئيسية بالذكاء الاصطناعي في السوق.
ما يجعل نهج السياق مختلفًا هو أن اختيار المتغير يحدث قبل الترجمة، وليس بعد ذلك. نموذج الذكاء الاصطناعي لا ينتج نص اللغة الإنجليزية الأمريكية ثم يحوله إلى بريطاني. ينتج نص اللغة الإنجليزية البريطانية من البداية، مختارًا الكلمات الصحيحة والإملاء الصحيح والإنشاءات الصحيحة من الجملة الأولى جدا. هذا نهج مختلف بشكل أساسي عن معالجة البحث والاستبدال اللاحقة، وينتج نتائج تقرأ بشكل طبيعي في المتغير الهدف بدلاً من الشعور بأنها نص أمريكي بطبقة بريطانية رقيقة.
أسئلة مكررة التوجيه
هل يمكن لـ Google Translate أن ينتج اللغة الإنجليزية البريطانية بشكل محدد
يقدم Google Translate "اللغة الإنجليزية" كلغة هدف واحدة دون التمييز بين متغيرات بريطانية أو أمريكية أو أسترالية أو غيرها. يتبع الإخراج عادة الاتفاقيات الأمريكية لأن بيانات تدريب النموذج تحتوي على المزيد من اللغة الإنجليزية الأمريكية. لا توجد إعدادات لطلب اللغة الإنجليزية البريطانية بشكل محدد، لذا يجب على المستخدمين الذين يحتاجون إليها مراجعة وتصحيح الإخراج يدويًا.
ما هي الاختلافات الرئيسية بين قاموس اللغة الإنجليزية البريطانية والأمريكية
بعد اختلافات الإملاء مثل "colour" مقابل "color" و"organise" مقابل "organize"، تشمل الاختلافات في المفردات الكلمات اليومية. بريطاني "boot" هو أمريكي "trunk". البريطاني "lift" هو الأمريكي "elevator". البريطاني "pavement" هو الأمريكي "sidewalk". البريطاني "flat" هو الأمريكي "apartment". تؤثر هذه الاختلافات على النص المترجم لأن نموذج الذكاء الاصطناعي يجب أن يختار نسخة واحدة، وبدون سياق، فإنه يختار أيهما ظهر أكثر في بيانات التدريب.
هل هناك أداة مجانية لترجمة النصوص عبر الإنترنت باللغة الإنجليزية البريطانية
YEB Translate تعمل على نموذج ائتمان دفع لكل استخدام حيث يتم استهلاك الائتمانات فقط عند معالجة النص. تكون إعدادات متغير اللغة، بما في ذلك اللغة الإنجليزية البريطانية، متاحة في كل طلب ترجمة دون أي طبقة قسط أو تكلفة إضافية.
كيفية تعامل الترجمة الموجهة بالسياق مع متغيرات اللغة الإقليمية
تتضمن الترجمة الموجهة بالسياق متغير اللغة كأحد إعداداته. قبل معالجة نموذج الذكاء الاصطناعي للنص المصدر، يتلقى معلومات حول أي متغير إقليمي يجب استخدامه في الإخراج. هذا يؤثر على الإملاء والمفردات والعبارات الاصطلاحية وحتى بنية الجملة. ينتج النموذج نصًا بشكل أصلي في المتغير المطلوب بدلاً من الترجمة إلى متغير افتراضي والتحويل لاحقًا.
ما أفضل بديل Google Translate للترجمات الدقيقة
تعتمد الدقة على الحاجة المحددة. بالنسبة للغات الأوروبية ذات متطلبات الطلاقة العالية، DeepL هو خيار قوي. بالنسبة للترجمات الموجهة بالسياق التي تحتاج إلى الأخذ في الاعتبار الجنس والرسمية وجargon الصناعة والمتغيرات الإقليمية، يوفر مترجم الذكاء الاصطناعي من YEB عناصر تحكم تفتقد الأدوات الأخرى. يقسم المقارنة الكاملة لأدوات الترجمة بالذكاء الاصطناعي نقاط القوة والقيود عبر الخيارات الرئيسية.
هل يهم الفرق بين اللغة الإنجليزية البريطانية والأمريكية لـ SEO
نعم. يختلف سلوك البحث بين المناطق. يبحث مستخدمو المملكة المتحدة عن "colour palette" بينما يبحث مستخدمو الولايات المتحدة عن "color palette". استخدام المتغير الخاطئ يعني أن المحتوى قد لا يتطابق مع شروط البحث للجمهور المقصود. بالنسبة للمواقع التي تستهدف أسواق إنجليزية محددة، يحسن الاستخدام المتسق للمتغير الصحيح ثقة المستخدم وأهمية البحث.