تحويل الأبجدية السيريلية إلى اللاتينية والعربية إلى اللاتينية وتحويل البرنامج النصي للتطبيقات متعددة اللغات

الإنترنت يعمل على الأحرف اللاتينية. عناوين URL لاتينية. عناوين البريد الإلكتروني لاتينية. أسماء الملفات على معظم أنظمة التشغيل تفضل اللاتينية. معرّفات قاعدة البيانات وتنسيقات معاملات API والأكواد المولدة بواسطة النظام كلها تعمل في مجموعة ASCII من اللاتينية. هذا الارتكاز على اللاتينية هو نتيجة تاريخية تسبق التوسع العالمي للإنترنت، لكن عواقبها العملية لا تزال قائمة في كل نظام يحتاج إلى التعامل مع النصوص من الأنظمة الكتابية غير اللاتينية في العالم. اسم عمل روسي يبدو طبيعياً تماماً في السيريلية يصبح سلسلة من الأحرف المشفرة غير المقروءة عند إجباره في عنوان URL. اسم شخص عربي يتدفق بشكل طبيعي من اليمين إلى اليسار يصبح لغزاً تقنياً عندما يحتاج إلى الظهور في حقل قاعدة بيانات غربية. تحدث هذه الاصطدامات بين التنوع اللغوي في العالم والبنية التحتية اللاتينية للإنترنت ملايين المرات كل يوم، وكل واحدة منها تتطلب ترجمة ليس للمعنى بل للبرنامج النصي.

الترجمة الحرفية هي الكلمة المستخدمة لهذه الترجمة على مستوى البرنامج النصي، وهي تختلف بشكل أساسي عن الترجمة اللغوية. الترجمة تحول المعنى: "house" في الإنجليزية يصبح "дом" في الروسية، لأن كلا الكلمتين تعنيان نفس الشيء بلغات مختلفة. الترجمة الحرفية تحول البرنامج النصي: "дом" في السيريلية يصبح "dom" في اللاتينية، لأن تلك هي الأحرف اللاتينية التي تقارب أصوات الأحرف السيريلية. المعنى يبقى كما هو. اللغة تبقى كما هي. فقط نظام الكتابة يتغير، وهذا هو السبب في وصف الترجمة الحرفية أحياناً بأنها "إعادة تهجئة" بدلاً من "إعادة معنى".

Transliterator API يوفر تحويل البرنامج النصي هذا كخدمة قابلة للبرمجة. أرسل نصاً بأحد الأنظمة الكتابية واستقبله مرة أخرى بنظام آخر. السيريلية إلى اللاتينية، العربية إلى اللاتينية، الإغريقية إلى اللاتينية، الديفاناجاري إلى اللاتينية، وقائمة شاملة من أزواج الأنظمة الأخرى التي تغطي الأنظمة الكتابية المستخدمة من قبل غالبية مستخدمي الإنترنت في العالم. يتبع التحويل المعايير الثابتة للترجمة الحرفية حيث توجد وتعيينات دقيقة صوتياً حيث لم يتم تعريف الأنظمة الموحدة، مما ينتج مخرجات قابلة للقراءة والنطق ومناسبة للسياقات التقنية التي تتطلب أحرفاً لاتينية.

أسماء عناوين URL ومشكلة النص غير اللاتيني في عناوين الويب

التطبيق الأكثر عملية فوراً للترجمة الحرفية في تطوير الويب هو توليد أسماء عناوين URL من النص غير اللاتيني. منشور مدونة بعنوان "Как приготовить борщ" (كيفية صنع البرشت) يحتاج إلى اسم عنوان URL صديق للتكنولوجيا يعمل في كل متصفح وكل منصة مشاركة وكل نظام تحليل. الأحرف السيريلية في العنوان صالحة في أسماء النطاقات المدولة (IDNs) ومعرّفات الموارد المدولة (IRIs)، لكن من الناحية العملية، معظم البنية التحتية للويب لا تزال تتعامل معها بشكل غير موثوق. عناوين URL المشفرة من السيريلية طويلة وقبيحة وتنكسر عند نسخها بين تطبيقات معينة. اسم عنوان URL محول مثل "kak-prigotovit-borshch" قصير وقابل للقراءة ويمكن مشاركته وممتثل عالمياً.

حالة الاستخدام لتوليد اسم عنوان URL تتطلب ليس فقط تحويل البرنامج النصي بل أيضاً معالجة إضافية: تحويل الأحرف إلى أحرف صغيرة، استبدال المسافات البيضاء بالواصلات، إزالة الأحرف الخاصة، وتطبيع الأحرف المشددة. تتعامل API الترجمة الحرفية مع خطوة تحويل البرنامج النصي، وتحويل الأحرف السيريلية إلى ما يعادلها من الأحرف اللاتينية، والتطبيق الذي يستدعيها يتعامل مع خطوات المعالجة المتبقية. يبقي هذا التقسيم للمسؤولية API مركزة على المهمة المعقدة لغوياً (الترجمة الحرفية الصحيحة) بينما يترك المهام البسيطة تقنياً (أحرف صغيرة، إدراج واصلة) لخط معالجة النص الموجود لديك.

جودة الترجمة الحرفية لتوليد اسم عنوان URL مهمة لأن اسم عنوان URL مرئي للمستخدمين ويساهم في تحسين محركات البحث. يعترف مستخدم روسي يواجه اسم عنوان URL "kak-prigotovit-borshch" على الفور أنه ترجمة حرفية للعنوان الروسي ويمكنه قراءته دون جهد. اسم عنوان URL محول بشكل سيء، واحد يستخدم تعيينات أحرف غير صحيحة أو ينتج مجموعات أحرف غير قابلة للنطق، يبدو مثل الهراء لكل من القراء الروس والإنجليز. تستخدم API تعيينات دقيقة صوتياً تنتج مخرجات قابلة للقراءة بغض النظر عن البرنامج النصي المصدر، مما يجعل أسماء عناوين URL الناتجة تعمل كمعرّفات تقنية ونصوص قابلة للقراءة من قبل البشر.

مواقع التجارة الإلكترونية التي تبيع في أسواق متعددة اللغات تستخدم الترجمة الحرفية بشكل موسع لتوليد عناوين URL للمنتجات. فهرس منتجات يتضمن عناصر بأسماء باللغة الروسية والعربية والصينية والهندية يحتاج إلى أسماء عناوين URL تعمل عبر جميع اللغات. الترجمة الحرفية اليدوية بهذا الحجم غير عملية، والترجمة الحرفية الآلية من خلال API تنتج أسماء عناوين URL متسقة ودقيقة يمكن توليدها كجزء من خط أنابيب استيراد المنتج دون تدخل بشري لكل لغة.

أسماء جوازات السفر والترجمة الحرفية للوثائق الرسمية

ترجمة جواز السفر الحرفية هي واحدة من أكثر التطبيقات أهمية لتحويل البرنامج النصي لأن الأخطاء في ترجمة الأسماء الحرفية تسبب مشاكل حقيقية في العالم. قد يؤدي الاسم المترجم بشكل مختلف في جواز السفر عن نموذج طلب التأشيرة إلى تأخير أو منع السفر الدولي. قد يؤدي الاسم المترجم بشكل مختلف في نظام مصرفي عن وثيقة الهوية إلى منع المعاملات المالية. الرهانات عالية بما يكفي أن معظم الدول تحتفظ بمعايير ترجمة رسمية حرفية لأسماء جوازات السفر، و API تطبق هذه المعايير للأنظمة الكتابية التي تدعمها.

أسئلة شائعة

ما هو الفرق بين الترجمة الحرفية والترجمة

الترجمة تحول المعنى بين اللغات: "cat" يصبح "кошка" بالروسية لأن كلا الكلمتين تعنيان نفس الشيء. الترجمة الحرفية تحول البرنامج النصي دون تغيير اللغة أو المعنى: "кошка" يصبح "koshka" بالأحرف اللاتينية، يمثل نفس الكلمة الروسية بنظام كتابي مختلف. تحافظ الترجمة الحرفية على الصوت؛ الترجمة تحافظ على المعنى.

أي معيار ترجمة حرفية تستخدم API افتراضياً

معيار الترجمة الحرفية الافتراضي يختلف حسب البرنامج النصي وموثق لكل زوج برنامج نصي مدعوم. بالنسبة للسيريلية، يتبع الافتراضي اتفاقيات ICAO/جواز السفر. بالنسبة للعربية، يتبع الافتراضي تعيين محسّن صوتياً ينتج أكثر المخرجات اللاتينية معترفاً بها على نطاق واسع. يمكن للمستخدمين تحديد معايير بديلة حيث توجد أنظمة معترف بها متعددة لنفس البرنامج النصي.