สีหรือ Colour และเหตุผลที่การแปลโดย AI โดยไม่มีบริบท ไร้ประโยชน์
มีเอกสารที่วางอยู่ในโฟลเดอร์ที่แบ่งปันกันอยู่ที่ไหนสักแห่ง ซึ่งมีวัตถุประสงค์เป็นคำอธิบายสินค้าสำหรับผู้ชมชาวอังกฤษ ข้อความต้นฉบับเขียนเป็นภาษาเยอรมัน แปลเป็นภาษาอังกฤษโดยใช้เครื่องมือแปลออนไลน์ที่สำคัญเครื่องหนึ่ง และส่งให้ทีมการตลาด ในแวบแรกดูเหมือนจะดี ไวยากรณ์นั้นถูกต้อง ประโยคไหลไปมาค่อนข้างดี และความหมายได้รับการรักษาไว้ จากนั้นใครสักคนในลอนดอนชี้ให้เห็น เอกสารใช้ "color" แทน "colour" "organize" แทน "organise" "center" แทน "centre" และ "analyze" แทน "analyse" ทุกตัวเลือกการสะกดตัวอักษรเป็นไปตามอนุสัญญาของอเมริกา สำหรับเอกสารที่มุ่งเป้าไปยังลูกค้าชาวอังกฤษ เผยแพร่บนโดเมน .co.uk นี่ไม่สามารถยอมรับได้
ส่วนที่น่าหงุดหงิดไม่ใช่เพราะการแปลนั้นไม่ถูกต้อง ส่วนที่น่าหงุดหงิดคือไม่มีวิธีใดที่จะบอกเครื่องมือว่าจะสร้างเวอร์ชันภาษาอังกฤษใด Google Translate มีตัวเลือกเดียว: ภาษาอังกฤษ DeepL มีตัวเลือกเดียว: ภาษาอังกฤษ ไม่มีใครถามว่าเป้าหมายคือผู้อ่านในแมนเชสเตอร์หรือผู้อ่านในแมนแฮตตัน ผลลัพธ์จะถูกสร้างขึ้น ตัวแปรจะถูกเลือกโดยรูปแบบใดก็ตามที่ปรากฏมากที่สุดในข้อมูลการฝึกอบรม และผู้ใช้ต้องค้นหาและแทนที่ทุกตัวอักษรของการสะกดตัวอักษรของอเมริกาด้วยตนเองในเอกสารที่มีวัตถุประสงค์เป็นอังกฤษตั้งแต่เริ่มต้น
อาจเหมือนกับการบ่นเรื่องเล็กน้อย ความแตกต่างของการสะกดตัวอักษรระหว่างภาษาอังกฤษของอังกฤษและอเมริกาได้รับการจัดทำเอกสารอย่างดีและค่อนข้างคาดเดาได้ แต่ความแตกต่างนั้นเกินกว่าการสลับ "ou" สำหรับ "o" และ "ise" สำหรับ "ize" คำศัพท์นั้นแตกต่างกันอย่างมาก "boot" คือ trunk "bonnet" คือ hood "trousers" คือ pants แต่ "pants" คือ underwear "biscuits" คือ cookies "chips" คือ fries แต่ "crisps" คือ chips "flat" คือ apartment "first floor" คือจริง ๆ แล้วชั้นที่สอง ความแตกต่างของคำศัพท์เหล่านี้อาจทำให้ผู้อ่านสับสนจริง ๆ เมื่อตัวแปรที่ผิดปรากฏในข้อความที่เขียนได้ดีอยู่
สำหรับใครก็ตามที่จัดการเนื้อหาในหลายภาษา โดยเฉพาะเว็บไซต์ แอปพลิเคชัน หรือเอกสารการตลาดที่ต้องมีอยู่ทั้งภาษาอังกฤษของอังกฤษและอเมริกา ขาดการควบคุมตัวแปรในเครื่องมือแปลสร้างการทำงาน เอกสารที่แปลแล้วทุกฉบับต้องการการตรวจสอบการส่งผ่านด้วยตนเองโดยเฉพาะเพื่อจับและแก้ไขความเคลื่อนไหวของตัวแปร การตรวจสอบการส่งผ่านนั้นใช้เวลา มีค่าใช้จ่าย และหลีกเลี่ยงได้ทั้งหมดหากเครื่องมือแปลเพียงแต่รู้ว่าตัวแปรใดที่จะสร้างขึ้น
ภาษาเดียวกัน อนุสัญญาต่างกัน ไม่มีการควบคุม
ภาษาอังกฤษของอังกฤษและอเมริกาไม่ใช่คู่เดียวที่มีปัญหานี้ แม้ว่าพวกเขาจะเป็นคู่ที่พบบ่อยที่สุด โปรตุเกสแบ่งออกเป็นโปรตุเกสของบราซิลและโปรตุเกสของยุโรป มีความแตกต่างในการสะกด ไวยากรณ์ คำศัพท์ และแม้แต่การใช้สรรพนามที่มีความสำคัญเพียงพอที่จะให้ข้อความรู้สึกแปลกปลอมกับผู้อ่านของตัวแปรอื่น สเปนแตกต่างกันไประหว่างอนุสัญญาของละตินอเมริกาและคาบสมุทร ด้วยรูปแบบกริยา slang และคำศัพท์ที่แตกต่างกันอย่างมาก ฝรั่งเศสมีอนุสัญญาที่แตกต่างกันในฝรั่งเศส แคนาดา เบลเยียม และประเทศแอฟริกาต่าง ๆ จีนแบ่งออกเป็นอักษรที่ง่ายขึ้นและอักษรดั้งเดิม ซึ่งไม่ใช่เพียงความแตกต่างของการสะกดตัวอักษรเท่านั้น แต่เป็นชุดอักษรที่แตกต่างกันโดยสิ้นเชิง
ในแต่ละกรณี การสร้างตัวแปรที่ผิดไม่ใช่ปัญหาสำหริติสวยงามที่เล็กน้อย ผู้อ่านชาวบราซิลที่พบการสะกดตัวอักษรโปรตุเกสของยุโรปในคำอธิบายสินค้าจะสังเกตเห็นได้ทันที มันสร้างความรู้สึกของระยะไกล เหมือนว่าบริษัทไม่สนใจที่จะ localize อย่างเหมาะสม สำหรับธุรกิจที่พยายามสร้างความไว้วางใจในตลาดภูมิภาคเฉพาะ ความเคลื่อนไหวประเภทนี้ทำให้ความพยายามทั้งหมดหมดสิ้น เนื้อหาอาจเหมือนกับว่าไม่ได้แปลหากการแปลส่งสัญญาณว่า "เราไม่รู้จริง ๆ ตลาดของคุณ"
คำแนะนำเกี่ยวกับการแปลงระหว่างภาษาอังกฤษของอเมริกาและอังกฤษบน YEB ครอบคลุมการตั้งค่าที่เกี่ยวข้องโดยเฉพาะ ใน YEB Translate ตัวแปรภาษาเป็นหนึ่งในการตั้งค่าภาษา 22 ตัวที่มีอยู่ในระบบบริบท เมื่อเลือกภาษาอังกฤษเป็นภาษาเป้าหมาย ผู้ใช้สามารถระบุตัวแปรของอเมริกา อังกฤษ ออสเตรเลีย หรือภูมิภาคอื่น ๆ ได้ โมเดล AI ได้รับการตั้งค่ากำลังใจนี้เป็นส่วนหนึ่งของสตริงบริบทและสร้างผลลัพธ์ที่ใช้อนุสัญญาการสะกดตัวอักษร ตัวเลือกคำศัพท์ และการแสดงออกสำนวนที่ถูกต้องสำหรับตัวแปรนั้นอย่างสม่ำเสมอ ไม่จำเป็นต้องแยกการแก้ไข
กลไกเดียวกันนี้ใช้ได้สำหรับทุกคู่ภาษาที่มีตัวแปรภูมิภาค บราซิลเทียบกับโปรตุเกสของยุโรป ละตินอเมริกาเทียบกับสเปนของคาบสมุทร จีนที่ง่ายขึ้นเทียบกับจีนดั้งเดิม ฝรั่งเศสแคนาดาเทียบกับเมตโรโพลิตันฝรั่งเศส การตั้งค่าจะทำครั้งเดียว ยังคงอยู่ตลอดชั่วโมง และนำไปใช้กับข้อความที่ประมวลผลทั้งหมดในช่วงเวลาดังกล่าว สำหรับทีมเนื้อหาที่จัดการการ localization ในระดับใหญ่ นี่จะขจัดหมวดหมู่ QA ทั้งหมด
เหตุผลที่อคติของข้อมูลการฝึกอบรมทำให้เรื่องนี้แย่ลงกว่าที่ปรากฏ
เหตุผลที่เครื่องมือแปลส่วนใหญ่เริ่มต้นด้วยภาษาอังกฤษของอเมริกาคือเรื่องตรงไปตรงมา: อินเทอร์เน็ตมีข้อความภาษาอังกฤษของอเมริกามากกว่าข้อความภาษาอังกฤษของอังกฤษ ข้อมูลการฝึกอบรมสำหรับโมเดล AI ได้รับการจัดหามาจากเนื้อหาเว็บเป็นส่วนใหญ่ และเนื้อหาเว็บถูกครอบงำโดยสิ่งพิมพ์ของอเมริกา บริษัท และข้อความที่สร้างสรรค์โดยผู้ใช้ของอเมริกา เมื่อโมเดล AI เรียนรู้ว่า "ถูกต้อง" ภาษาอังกฤษเป็นอย่างไร มันเรียนรู้จากคอร์พัสที่เอียงไปทางอเมริกาตามค่าเริ่มต้น
อคติเหล่านี้ไม่ได้ตั้งใจ แต่มันยังคงอยู่ แม้ว่าเครื่องมือแปลจะได้รับการอัปเดตด้วยโมเดลใหม่ การกระจายข้อมูลพื้นฐานก็ไม่เปลี่ยนแปลง ภาษาอังกฤษของอเมริกายังคงเป็นตัวแปรส่วนใหญ่ในคอร์พัสการฝึกอบรม ซึ่งหมายความว่าเอาต์พุตเริ่มต้นจะยังคงเอียงไปทางอเมริกา ไม่ว่าผู้ใช้จะต้องการอังกฤษ ออสเตรเลีย แอฟริกาใต้ หรือตัวแปรอื่น ๆ โมเดลไม่ใช่การเลือกภาษาอังกฤษของอเมริกาเพราะว่าดีกว่า มันเลือกมันเพราะมันเคยเห็นมันมากขึ้น
สำหรับผู้ใช้ที่แปลเป็นภาษาอังกฤษจากภาษาอื่น ๆ นี่สร้างปัญหาที่มองไม่เห็น เอาต์พุตดูเหมือนจะถูกต้องเพราะมันถูกต้องไวยากรณ์ ประโยคสมควร คำศัพท์นั้นเหมาะสม แต่ตัวแปรไม่ถูกต้องสำหรับผู้ชมที่มีวัตถุประสงค์ และเว้นแต่ผู้ใช้จะคุ้นเคยกับตัวแปรทั้งสองพอที่จะจับทุกความแตกต่าง ความเคลื่อนไหวจะลื่นไถล ผู้จัดการการตลาดชาวเยอรมันที่แปลสำเนาสินค้าสำหรับตลาดสหราชอาณาจักรอาจไม่สังเกตเห็นว่า "aluminum" ควรเป็น "aluminium" หรือว่า "skeptical" ควรเป็น "sceptical" สิ่งเหล่านี้ไม่ใช่ข้อผิดพลาดที่ตัวตรวจสอบไวยากรณ์ได้ราง เพราะการสะกดทั้งสองถูกต้อง พวกเขาเป็นเพียงว่าถูกต้องในประเทศต่างกัน
ระบบบริบทใน ตัวแปลข้อความ AI ของ YEB ถือว่าตัวแปรภาษาเป็นการตั้งค่าประเภทแรกมากกว่าที่หลัง สิ่งนี้มีความสำคัญเพราะโมเดล AI ปรับไม่เพียงแต่การสะกดตัวอักษร แต่คำศัพท์ การเลือกสำนวน และแม้กระทั่งโครงสร้างประโยคตามตัวแปร ภาษาอังกฤษของอังกฤษมีแนวโน้มไปสู่โครงสร้างที่ราบรื่นขึ้นเล็กน้อยในการเขียนธุรกิจ ภาษาอังกฤษของอเมริกาใช้การวลีที่ชัดเจนมากขึ้น ภาษาอังกฤษของออสเตรเลียมีรีจิสเตอร์อย่างไม่เป็นทางการของตัวเองที่แตกต่างจากทั้งคู่ สิ่งเหล่านี้คือความแตกต่างที่ละเอียดอ่อนที่ผู้ใช้ที่พูดภาษาแม่นอกเหนือจากนั้นสร้างขึ้นโดยไม่รู้ตัว และที่โมเดล AI สามารถทำซ้ำได้เมื่อบอกว่าตัวแปรใดที่จะใช้เป้าหมาย
ต้นทุนจริงของการได้ตัวแปรที่ผิด
สำหรับอีเมลส่วนตัว ไม่มีใครสนใจว่า "colour" หรือ "color" ปรากฏขึ้น สำหรับเนื้อหาที่เผยแพร่ เดิมพันจะแตกต่างกัน เว็บไซต์ .co.uk ที่ใช้การสะกดตัวอักษรของอเมริกาทั้งหมดดูไม่สะอาด เว็บไซต์ .com ที่มีเป้าหมายไปยังผู้อ่านออสเตรเลียด้วยการสะกดตัวอักษรของอังกฤษดูเล็กน้อยปิด สิ่งเหล่านี้ไม่ใช่ความล้มเหลวที่ดุ พวกเขาเป็นเยื่อกระดาษที่สะสมตัวและสร้างความประทับใจโดยทั่วไปของความไม่ระวัง
ในอุตสาหกรรมที่ได้รับการควบคุม ความสม่ำเสมอของตัวแปรอาจเป็นปัญหาด้านปฏิบัติตามข้อบังคับ เอกสารทางกฎหมายในสหราชอาณาจักรเป็นไปตามข้อตกลงของอังกฤษ วรรณกรรมทางการแพทย์สำหรับ NHS ใช้คำศัพท์ของอังกฤษ สิ่งพิมพ์ของรัฐบาลเป็นไปตามคู่มือสไตล์ที่เข้มงวดซึ่งระบุการใช้ตัวแปรลงไปเพื่อคำแต่ละคำ การส่งเอกสารที่แปลแล้วซึ่งใช้ตัวแปรที่ผิดในบริบทเหล่านี้ไม่เพียงแต่เกะกะ มันสามารถทำให้เกิดการปฏิเสธหรือคำขอการแก้ไขที่ล่าช้าของโครงการทั้งหมด
การเปรียบเทียบกับ DeepL เน้นสิ่งนี้เป็นหนึ่งในพื้นที่เฉพาะที่เครื่องมือแปลวัตถุประสงค์ทั่วไปไม่อยู่ DeepL สร้างการแปลที่ยอดเยี่ยมในแง่ของความคล่องตัวและความแม่นยำ แต่จนกระทั่งเมื่อเร็ว ๆ นี้ไม่มีวิธีใดที่จะระบุว่าตัวแปรภาษาอังกฤษใดที่จะสร้างขึ้น ผู้ใช้ที่ต้องการภาษาอังกฤษของอังกฤษต้องยอมรับสิ่งที่โมเดลให้พวกเขาหรือเรียกใช้ขั้นตอนการแปลงแยกต่างหากหลังจากนั้น ข้อ จำกัด เดียวกันนี้มีอยู่ใน เครื่องมือแปล AI ที่ใหญ่ที่สุด ในตลาด
สิ่งที่ทำให้วิธีการบริบทแตกต่างคือการเลือกตัวแปรเกิดขึ้นก่อนการแปล ไม่ใช่หลังจากนั้น โมเดล AI ไม่สร้างข้อความภาษาอังกฤษของอเมริกาแล้วแปลงเป็นอังกฤษ มันสร้างข้อความภาษาอังกฤษของอังกฤษตั้งแต่เริ่มต้น เลือกคำที่ถูกต้อง การสะกดตัวอักษรที่ถูกต้อง และโครงสร้างที่ถูกต้องตั้งแต่ประโยคแรก นี่คือแนวทางที่แตกต่างกันโดยพื้นฐานกว่าการประมวลผลหลังจากการค้นหาและแทนที่ และมันสร้างผลลัพธ์ที่อ่านเป็นธรรมชาติในตัวแปรเป้าหมายแทนที่จะรู้สึกเหมือนข้อความอเมริกาที่มีเสื้อคลุมอังกฤษบาง ๆ
คำถามที่พบบ่อย
Google Translate สามารถสร้างภาษาอังกฤษของอังกฤษโดยเฉพาะได้หรือไม่
Google Translate นำเสนอ "English" เป็นภาษาเป้าหมายเดียวโดยไม่แยกความแตกต่างระหว่างตัวแปรของอังกฤษ อเมริกา ออสเตรเลีย หรืออื่น ๆ เอาต์พุตมักจะปฏิบัติตามอนุสัญญาของอเมริกาเพราะข้อมูลการฝึกอบรมของโมเดลมีภาษาอังกฤษมากขึ้น ไม่มีการตั้งค่าเพื่อขอให้มีภาษาอังกฤษของอังกฤษโดยเฉพาะ ดังนั้นผู้ใช้ที่ต้องการมันต้องตรวจสอบและแก้ไขผลลัพธ์ด้วยตนเอง
ความแตกต่างของคำศัพท์หลักระหว่างภาษาอังกฤษของอังกฤษและอเมริกาคืออะไร
นอกเหนือจากความแตกต่างของการสะกดตัวอักษรเช่น "colour" เทียบกับ "color" และ "organise" เทียบกับ "organize" ความแตกต่างของคำศัพท์รวมถึงคำในชีวิตประจำวัน "boot" ของอังกฤษคือ "trunk" ของอเมริกา "lift" ของอังกฤษคือ "elevator" ของอเมริกา "pavement" ของอังกฤษคือ "sidewalk" ของอเมริกา "flat" ของอังกฤษคือ "apartment" ของอเมริกา ความแตกต่างเหล่านี้มีผลต่อข้อความที่แปลแล้วเพราะโมเดล AI ต้องเลือกเวอร์ชันหนึ่ง และโดยไม่มีบริบท มันเลือกว่าสิ่งใดปรากฏบ่อยขึ้นในข้อมูลการฝึกอบรม
มีเครื่องมือแปลข้อความออนไลน์ฟรีในภาษาอังกฤษของอังกฤษหรือไม่
YEB Translate ทำงานบนแบบจำลองเครดิตต่อการใช้งานซึ่งเครดิตจะถูกใช้เมื่อมีการประมวลผลข้อความเท่านั้น การตั้งค่าตัวแปรภาษา รวมถึงภาษาอังกฤษของอังกฤษ มีให้ใช้งานในทุกคำขอการแปลโดยไม่มีชั้นพรีเมียมหรือค่าใช้จ่ายเพิ่มเติม
การแปลที่มีความตระหนัก บริบทจัดการตัวแปรภาษาในภูมิภาคได้อย่างไร
การแปลที่มีความตระหนัก บริบท รวมถึงตัวแปรภาษาเป็นหนึ่งในการตั้งค่าของมัน ก่อนที่โมเดล AI จะประมวลผลข้อความต้นฉบับ มันได้รับข้อมูลเกี่ยวกับตัวแปรภูมิภาคใดที่จะใช้ในเอาต์พุต สิ่งนี้มีผลต่อการสะกด คำศัพท์ สำนวน และแม้กระทั่งโครงสร้างประโยค โมเดลสร้างข้อความเป็นธรรมชาติในตัวแปรที่ขอได้แทนที่จะแปลเป็นตัวแปรเริ่มต้นและแปลงหลังจากนั้น
ทางเลือกที่ดีที่สุด Google Translate สำหรับการแปลที่แม่นยำคืออะไร
ความแม่นยำขึ้นอยู่กับความต้องการเฉพาะ สำหรับภาษายุโรปที่มีข้อกำหนดความคล่องตัวสูง DeepL เป็นตัวเลือกที่แข็งแกร่ง สำหรับการแปลที่มีความตระหนัก บริบท ที่ต้องคำนึงถึงเพศ ความเป็นทางการ คำศัพท์เฉพาะอุตสาหกรรม และตัวแปรในภูมิภาค ตัวแปลข้อความ AI ของ YEB มีการควบคุมที่เครื่องมืออื่นขาดหาย การเปรียบเทียบแบบเต็มของเครื่องมือแปล AI แบ่งออกจุดแข็งและข้อ จำกัด ตลอดตัวเลือกหลัก
ความแตกต่างของภาษาอังกฤษของอังกฤษเทียบกับอเมริกามีความสำคัญต่อ SEO หรือไม่
ใช่. พฤติกรรมการค้นหาแตกต่างกันระหว่างภูมิภาค ผู้ใช้ในสหราชอาณาจักรค้นหา "colour palette" ในขณะที่ผู้ใช้ในสหรัฐอเมริกาค้นหา "color palette" การใช้ตัวแปรที่ผิดหมายความว่าเนื้อหาอาจไม่ตรงกับคำค้นหาของผู้ชมที่มีวัตถุประสงค์ สำหรับเว็บไซต์ที่มีเป้าหมายไปยังตลาดที่พูดภาษาอังกฤษเฉพาะ การใช้ตัวแปรที่ถูกต้องอย่างสม่ำเสมอจะปรับปรุงทั้งความไว้วางใจของผู้ใช้และความเกี่ยวข้องของการค้นหา