Δέκα Κατηγορίες Περιεχομένου Που Αλλάζουν μια Μετάφραση Πέρα από την Αναγνώριση
Πάρτε μια απλή πρόταση στα αγγλικά: "Πρέπει να κλείσουμε αυτό γρήγορα." Τώρα μεταφράστε το στα γερμανικά. Χωρίς περιεχόμενο, ένα εργαλείο μετάφρασης θα παράγει κάτι γενικό και τεχνικά σωστό. Η επιλογή του ρήματος θα είναι ουδέτερη, η τυπικότητα θα είναι κάπου στη μέση και το τόνος θα είναι επίπεδο. Τώρα προσθέστε περιεχόμενο: αυτό είναι ένα νομικό όργανο που συζητά διαπραγμάτευση συμβάσεων. Το γερμανικό αποτέλεσμα αλλάζει. Το "κλείσιμο" γίνεται ένας συγκεκριμένος νομικός όρος για την ολοκλήρωση μιας συμφωνίας. Η τυπικότητα μεταβάλλεται σε τυπικό καταχρήση. Η επείγουσα κατάσταση που υποδηλώνεται από το "γρήγορα" εκφράζεται μέσω λεξιλογίου που θα χρησιμοποιούσε πραγματικά ένας γερμανός δικηγόρος. Το ίδιο κείμενο προέλευσης, εντελώς διαφορετικό αποτέλεσμα.
Τώρα αλλάξτε το περιεχόμενο ξανά. Ίδια πρόταση, αλλά αυτή τη φορά προέρχεται από μια ομάδα ανάπτυξης λογισμικού που συζητά κλείσιμο ενός εισιτηρίου σφάλματος. Η γερμανική μετάφραση αλλάζει και πάλι. Το "κλείσιμο" τώρα αντιστοιχεί στον τεχνικό όρο που χρησιμοποιείται στα εργαλεία διαχείρισης έργων. Το καταχρήση πέφτει σε ημι-τυπικό. Το λεξιλόγιο ευθυγραμμίζεται με τον τρόπο που ομιλούν πραγματικά οι γερμανοί προγραμματιστές σε standups και κανάλια Slack. Η πρόταση εξακολουθεί να σημαίνει το ίδιο πράγμα στα αγγλικά. Οι γερμανικές εκδόσεις δεν θα μοιάζουν καθόλου μεταξύ τους και δεν θα έπρεπε, επειδή περιγράφουν εντελώς διαφορετικές καταστάσεις.
Αυτό είναι το βασικό πρόβλημα με τη μετάφραση χωρίς περιεχόμενο. Το κείμενο προέλευσης είναι διφορούμενο και ο μεταφραστής επιλύει αυτή την αμφισημία μαντεύοντας. Μερικές φορές η εικασία είναι σωστή. Συχνά παράγει αποτέλεσμα που είναι γραμματικά σωστό αλλά σημασιολογικά ανάλογο, κείμενο που τεχνικά λέει το σωστό πράγμα αλλά το λέει με τρόπο που κανείς πολίγλωσσος ομιλητής δεν θα χρησιμοποιούσε ποτέ σε αυτή τη συγκεκριμένη κατάσταση. Οι δέκα κατηγορίες περιεχομένου στο YEB Translate υπάρχουν ειδικά για να εξαλείψουν αυτή την εικασία. Καθεμία προσφέρει στο μοντέλο ΤΝ τις πληροφορίες που χρειάζεται για να κάνει καλύτερες επιλογές και μαζί μετατρέπουν το γενικό αποτέλεσμα μηχανικής στο κείμενο που διαβάζεται σαν να είχε γραφεί από κάποιον που πραγματικά κατανοεί την κατάσταση.
Βιομηχανία, Ακροατήριο και Σκοπός
Οι πρώτες τρεις κατηγορίες αποτελούν τη βάση οποιουδήποτε περιεχομένου μετάφρασης. Η βιομηχανία λέει στο μοντέλο σε ποιό πεδίο ανήκει το κείμενο, το οποίο ελέγχει απευθείας την επιλογή τεχνικού λεξιλογίου. Μια λέξη όπως "πρωτόκολλο" σε ένα ιατρικό πλαίσιο ενεργοποιεί εντελώς διαφορετικό λεξιλόγιο από το "πρωτόκολλο" σε ένα πλαίσιο δικτύωσης ή διπλωματικό πλαίσιο. Χωρίς τη ρύθμιση της βιομηχανίας, το μοντέλο επιλέγει ποια σημασία έχει δει πιο συχνά σε δεδομένα εκπαίδευσης, το οποίο για "πρωτόκολλο" συνήθως προεπιλέγει τεχνολογία. Ορίστε τη βιομηχανία σε υγειονομική περίθαλψη και το αποτέλεσμα χρησιμοποιεί τη σωστή ιατρική ορολογία αυτόματα.
Το ακροατήριο καθορίζει ποιος θα διαβάσει το μεταφρασμένο κείμενο. Ένα τεχνικό έγγραφο που απευθύνεται σε μηχανικούς χρησιμοποιεί διαφορετικό λεξιλόγιο και υποθέτει διαφορετικές γνώσεις φόντου από τις ίδιες πληροφορίες που γράφονται για ένα γενικό ακροατήριο. Μια περιγραφή προϊόντος για καταναλωτές χρησιμοποιεί απλούστερη γλώσσα και περισσότερο πειστικό πλαίσιο από ένα εσωτερικό έγγραφο προδιαγραφών για την ομάδα ανάπτυξης. Η κατηγορία του ακροατηρίου δεν αλλάζει τι λέγεται. Αλλάζει πώς λέγεται, προσαρμόζοντας την πολυπλοκότητα, την πυκνότητα σαργών και τις υποθέσεις γνώσης για να ταιριάζουν με το αναμενόμενο επίπεδο του αναγνώστη.
Ο σκοπός καταγράφει την πρόθεση πίσω από το κείμενο. Είναι αυτό το περιεχόμενο πληροφοριών που προορίζεται να εκπαιδεύει; Περιεχόμενο πειστικό που προορίζεται να πωλείται; Περιεχόμενο εκπαιδευτικό που προορίζεται να καθοδηγεί; Νομικό περιεχόμενο που προορίζεται να δεσμεύει; Κάθε σκοπός ενεργοποιεί διαφορετικά γλωσσικά μοτίβα στο αποτέλεσμα. Το πειστικό κείμενο στα γερμανικά χρησιμοποιεί διαφορετικές δομές προτάσεων από ενημερωτικό κείμενο. Το νομικό γαλλικά ακολουθεί συμβάσεις που είναι εντελώς απουσιάζουν από συνομιλιακά γαλλικά. Η κατηγορία του σκοπού λέει στο μοντέλο όχι μόνο τι λέει το κείμενο, αλλά τι προσπαθεί να πετύχει και το αποτέλεσμα αντανακλά αυτή την πρόθεση στη γλώσσα-στόχο.
Αυτές οι τρεις κατηγορίες μόνες τους παράγουν δραματικά διαφορετικά αποτελέσματα όταν ποικίλουν. Μια πρόταση σχετικά με "βελτίωση της απόδοσης" μεταφρασμένη για ένα ακροατήριο υγειονομικής περίθαλψης με σκοπό ενημερωτικό παράγει κλινική, μετρημένη γλώσσα. Η ίδια πρόταση μεταφρασμένη για ένα ακροατήριο μάρκετινγκ με σκοπό πειστικό παράγει δυναμική, γλώσσα εστιασμένη σε οφέλη. Ο δείκτης χαρακτηριστικών του μεταφραστή ΤΝ δείχνει παράδειγμα παράδειγμα αυτών των διαφορών για όποιον θέλει να δει την αντίθεση πρώτο χέρι.
Τυπικότητα, Ύφος και Τόνος
Η τυπικότητα είναι ίσως η πλέον αμέσως αποτελεσματική κατηγορία, ειδικά για γλώσσες με τυπικά και ανεπίσημα συστήματα αποσπάσματος. Ο ορισμός της τυπικότητας στο επίπεδο ένα παράγει τυχαία, συντομευμένο αποτέλεσμα που διαβάζεται σαν ένα μήνυμα κειμένου μεταξύ φίλων. Ο ορισμός του για το επίπεδο πέντε παράγει ακριβές, δομημένο αποτέλεσμα που διαβάζεται σαν μια νομική σύμβαση ή επίσημη κρατική αλληλογραφία. Ο οδηγός για την αναφράση για επαγγελματισμό εξερευνά τον τρόπο με τον οποίο η τυπικότητα αλληλεπιδρά με τη αναφράση, αλλά στη μετάφραση, το αποτέλεσμα είναι ακόμη πιο έντονο επειδή πολλές γλώσσες έχουν εντελώς ξεχωριστό λεξιλόγιο και γραμματικές δομές για διαφορετικά επίπεδα τυπικότητας.
Τα ιαπωνικά είναι το πιο δραματικό παράδειγμα. Η διαφορά μεταξύ τυχαίων ιαπωνικών και τυπικών ιαπωνικών είναι τόσο σημαντική που μια πρόταση στο επίπεδο τυπικότητας ένα μπορεί να μοιράζεται μόνο τις ρίζες ρημάτων με το ισοδύναμό της στο επίπεδο πέντε. Κάθε κατάληξη ρήματος αλλάζει. Οι αντωνυμίες αλλάζουν. Τα σωματίδια αλλάζουν. Τα σεβαστά προθέματα εμφανίζονται ή εξαφανίζονται. Ένα εργαλείο μετάφρασης που δεν αποδέχεται την τυπικότητα στα ιαπωνικά είναι ουσιαστικά παραγωγή τυχαίου αποτελέσματος στο φάσμα τυπικότητας, το οποίο σημαίνει ότι περίπου τα μισά αποτελέσματα θα είναι ακατάλληλα τυχαία για ένα επιχειρηματικό πλαίσιο ή ένα άσχετα άκαμπτα για φιλική συνομιλία.
Το καταχρήση δραστηριοποιείται παράπλευρα με την τυπικότητα αλλά δεν είναι ταυτόσημο με αυτό. Το καταχρήση περιγράφει τη γλωσσική ποικιλία που χρησιμοποιείται σε ένα συγκεκριμένο κοινωνικό πλαίσιο. Ακαδημαϊκό καταχρήση, τεχνικό καταχρήση, δημοσιογραφικό καταχρήση, λογοτεχνικό καταχρήση. Καθένα έχει τις δικές του συμβάσεις για δομή προτάσεων, λεξιλόγιο και ρητορικές συσκευές. Ένα κείμενο μεταφρασμένο σε ακαδημαϊκό καταχρήση χρησιμοποιεί παθητικές κατασκευές, γλώσσα αμφιβολίας και αναφορά-φιλική διατύπωση. Το ίδιο κείμενο στο δημοσιογραφικό καταχρήση χρησιμοποιεί ενεργητική φωνή, συντομευμένες προτάσεις και άμεση αναφορά. Η τυπικότητα ελέγχει πόσο ευγενής ή τυχαία ακούγεται το κείμενο. Το καταχρήση ελέγχει τι είδος κειμένου αισθάνεται.
Ο τόνος προσθέτει το συναισθηματικό στρώμα. Ουδέτερο, αισιόδοξο, επείγον, προσεκτικό, συμπαθητικό, αυθοριτάριο. Η κατηγορία τόνου επηρεάζει την επιλογή λέξεων στο επίπεδο κονοτάσεων. "Η προθεσμία πλησιάζει" σε ουδέτερο τόνο παραμένει επίπεδη. Σε επείγοντα τόνο, το λεξιλόγιο αλλάζει προς λέξεις που μεταφέρουν πίεση και αμεσότητα. Σε προσεκτικό τόνο, γίνεται μαλακότερο, αμφιβολία, πιο διπλωματικό. Ο τόνος είναι η κατηγορία που πιο άμεσα επηρεάζει τον τρόπο που ο αναγνώστης αισθάνεται για το κείμενο και η λάθος κατανόηση του μπορεί να κάνει μια συμπαθητική μήνυμα να ακούγεται κρύο ή μια επαγγελματική ενημέρωση ακούγεται σε κατάσταση πανικού.
Τομέας, Φύλο, Παραλλαγή και Θέμα
Οι υπόλοιπες τέσσερις κατηγορίες χειρίζονται λεπτομέρειες που οι πρώτες έξι δεν μπορούν να καλύψουν. Ορολογία τομέα ελέγχει ποια ειδική σύνολο λεξιλογίου το μοντέλο αντλεί. Αυτό είναι πιο κοκκώδες από τη βιομηχανία. Εντός της βιομηχανίας τεχνολογίας, ο τομέας μπορεί να είναι υπολογιστικό νέφος, ανάπτυξη κινητών, κυβερνοασφάλεια ή επιστήμη δεδομένων. Καθένα έχει τη δική της ηλιθιότητα, τις δικές του συμβάσεις ακρωνύμιων και ένα δικό του σύνολο όρων που έχουν συγκεκριμένες σημασίες διαφορετικές από την καθημερινή τους χρήση.
Το φύλο του ομιλητή, όπως συζητείται στον ρωσικό οδηγό φύλου και τυπικότητας, ελέγχει το γραμματικό φύλο σε γλώσσες που το απαιτούν. Αυτό δεν είναι προαιρετικό για γλώσσες όπως ρωσικά, αραβικά, εβραϊκά, χίντι και πολλές άλλες όπου τα ρήματα παρελθόντος χρόνου και τα επίθετα πρέπει να συμφωνούν με το φύλο του ομιλητή. Ο ορισμός αυτής της κατηγορίας μία φορά εξασφαλίζει συνεπή και σωστά γραμματικά φύλο σε ολόκληρη την έξοδο.
Η περιφερειακή παραλλαγή ελέγχει ποια έκδοση της γλώσσας-στόχου να παράγει. Βρετανικά ή αμερικανικά αγγλικά. Βραζιλιάνα ή ευρωπαϊκά πορτογαλικά. Απλοποιημένα ή παραδοσιακά κινεζικά. Λατινοαμερικάνα ή Ισπανικά της Ισπανίας. Αυτή η κατηγορία λειτουργεί με τις 22 ρυθμίσεις ειδικές για τη γλώσσα για να εξασφαλίσει ότι το αποτέλεσμα ταιριάζει με τις συμβάσεις της περιοχής της προορισμένης ακροατηρίου, περιλαμβάνοντας ορθογραφία, λεξιλόγιο και ιδιωματικές εκφράσεις.
Τι σημαίνει στην πράξη η Τυχαία Δειγματοληψία 117 Επιλογών
Ο αριθμός ακούγεται μεγάλος, αλλά στην πράξη το σύστημα σχεδιάστηκε έτσι ώστε οι περισσότεροι χρήστες να χρειάζονται να ορίσουν μόνο ένα χούφτα κατηγοριών για οποιαδήποτε δεδομένη εργασία. Ένας προγραμματιστής που μεταφράζει τεκμηρίωση API μπορεί να ορίσει τη βιομηχανία σε τεχνολογία, ο τομέας να ανάπτυξη λογισμικού, τυπικότητα να επίπεδο τρία και καταχρήση προς τεχνικά. Αυτό είναι τέσσερις ρυθμίσεις, ίσως τριάντα δευτερόλεπτα παραμόρφωσης, και οι προκύπτοντες μεταφράσεις χρησιμοποιούν σωστή τεχνική ορολογία, κατάλληλη τυπικότητα και επαγγελματικό καταχρήση σε ολόκληρη την περίοδο.
Ένας επαγγελματίας μάρκετινγκ που μεταφράζει αντίγραφα εκστρατείας μπορεί να ορίσει τη βιομηχανία σε μάρκετινγκ, το ακροατήριο σε καταναλωτές, σκοπό προς πειστικό, τόνο προς αισιόδοξο και τυπικότητα σε επίπεδο δύο. Πέντε ρυθμίσεις, εξακολουθούν κάτω από λεπτό παραμόρφωσης και κάθε μετάφραση στο περίοδο αντανακλά αυτές τις επιλογές.
Οι 117 επιλογές σε δέκα κατηγορίες δεν προορίζονται για όλες να χρησιμοποιούνται ταυτόχρονα. Προορίζονται για να καλύψουν το πλήρες φάσμα των καταστάσεων που συναντούν οι πραγματικοί χρήστες. Ένας νομικός μεταφραστής χρειάζεται διαφορετικές επιλογές από έναν διαχειριστή κοινωνικών μέσων. Ένας ερευνητής ιατρικής χρειάζεται διαφορετικές επιλογές από έναν ταξιδιώτη ταξιδιού. Το σύστημα παρέχει αρκετή κοκκόμετρα για την εξυπηρέτηση όλων αυτών των περιπτώσεων χρήσης χωρίς να απαιτεί κάθε χρήστης να κατανοήσει κάθε επιλογή. Ορίστε τις κατηγορίες που έχουν σημασία για την εργασία που διεξάγεται, αφήστε τα υπόλοιπα στις προεπιλογές τους και το μοντέλο ΤΝ ενσωματώνει οποιοδήποτε περιεχόμενο λαμβάνει.
Αυτό που κάνει αυτό θεμελιωδώς διαφορετικό από γενικά μεταφραστείο είναι ότι το μοντέλο δεν παράγει μια προεπιλεγμένη μετάφραση και στη συνέχεια προσαρμόζει αυτό. Το περιεχόμενο διαμορφώνει το αποτέλεσμα από την πολύ αρχή. Η επιλογή λέξης, η δομή προτάσης, η ορολογία, το καταχρήση και η τυπικότητα προσδιορίζονται όλα από το περιεχόμενο πριν από την πρώτη λέξη της μετάφρασης δημιουργηθεί. Αυτός είναι ο λόγος για τον οποίο το αποτέλεσμα μπορεί να φαίνεται τόσο δραματικά διαφορετικό με διαφορετικές ρυθμίσεις περιεχομένου. Δεν είναι η ίδια μετάφραση να διορθώνεται. Είναι μια διαφορετική μετάφραση που δημιουργείται από την αρχή, καθοδηγούμενη από ένα εντελώς διαφορετικό σύνολο περιορισμών.
Συχνές Ερωτήσεις
Τι είναι η μετάφραση μηχανής που γνωρίζει το περιεχόμενο
Η μετάφραση μηχανής που γνωρίζει το περιεχόμενο είναι μια προσέγγιση όπου το μοντέλο ΤΝ λαμβάνει πληροφορίες σχετικά με τον ομιλητή, το ακροατήριο, τη βιομηχανία, το επίπεδο τυπικότητας, τον τόνο και άλλους παράγοντες πριν από τη δημιουργία της μετάφρασης. Αυτό το περιεχόμενο διαμορφώνει την επιλογή των λέξεων, τη γραμματική και το ύφος του αποτελέσματος, παράγοντας μεταφράσεις προσαρμοσμένες σε συγκεκριμένες καταστάσεις και όχι γενικές μεταφράσεις που ισχύουν για όλες τις περιπτώσεις.
Πόσες ρυθμίσεις περιεχομένου προσφέρει το YEB Translate
Το YEB Translate παρέχει 10 κατηγορίες περιεχομένου με 117 μεμονωμένες επιλογές, συν 22 ρυθμίσεις ειδικές για τη γλώσσα με 78 επιλογές. Οι κατηγορίες περιλαμβάνουν βιομηχανία, ακροατήριο, τυπικότητα, ύφος, τόνο, σκοπό, ορολογία τομέα, φύλο ομιλητή, περιφερειακή παραλλαγή και θέμα. Οι χρήστες συνήθως ορίζουν 3 έως 5 κατηγορίες ανά σεάνς.
Μπορούν οι ρυθμίσεις περιεχομένου να παράγουν χειρότερες μεταφράσεις εάν ρυθμιστούν λανθασμένα
Ο ορισμός του λανθασμένου περιεχομένου μπορεί να ωθήσει τη μετάφραση προς μια ακατάλληλη κατεύθυνση. Για παράδειγμα, ο ορισμός του ιατρικού περιεχομένου της βιομηχανίας για ένα κείμενο μάρκετινγκ θα εισάγει κλινική ορολογία που φαίνεται απόεσκεπή. Ωστόσο, η αφήνοντας τις ρυθμίσεις στις προεπιλογές τους παράγει απλώς γενικό αποτέλεσμα, το οποίο είναι ισοδύναμο με αυτό που παράγουν άλλα εργαλεία μετάφρασης χωρίς περιεχόμενο. Η χειρότερη περίπτωση για τις ρυθμίσεις που δεν χρησιμοποιούνται είναι ουδέτερη, όχι επιβλαβής.
Υπάρχει δωρεάν μεταφραστής ΤΝ με ρυθμίσεις περιεχομένου
Το YEB Translate χρησιμοποιεί ένα μοντέλο χρέωσης κατά χρήση ανά πίστωση παρά ένα μοντέλο συνδρομής. Όλες οι κατηγορίες περιεχομένου είναι διαθέσιμες σε κάθε αίτημα χωρίς στρώματα premium. Πίστωση καταναλώνεται μόνο όταν το κείμενο επεξεργάζεται πράγματι και οι αχρησιμοποίητες πίστωση μεταφέρονται επ'αόριστον. Αυτό το καθιστά πιο οικονομικό από τα εργαλεία συνδρομής για περιστασιακούς χρήστες που εξακολουθούν να χρειάζονται αποτελέσματα που γνωρίζουν το περιεχόμενο.
Πώς συγκρίνεται η μετάφραση που γνωρίζει το περιεχόμενο με το DeepL ή το Google Translate
Το DeepL και το Google Translate παράγουν ρευστό αποτέλεσμα αλλά προσφέρουν ελάχιστο έλεγχο σχετικά με το περιεχόμενο. Κανένα από τα δύο δεν παρέχει ρυθμίσεις για βιομηχανία, τόνο, φύλο ομιλητή ή ορολογία τομέα. Το αποτέλεσμα είναι γενικές μεταφράσεις που είναι γραμματικά σωστές αλλά μπορεί να χρησιμοποιούν λάθος ορολογία, ακατάλληλη τυπικότητα ή εσφαλμένες μορφές φύλου. Η μετάφραση που γνωρίζει το περιεχόμενο συμπληρώνει αυτά τα κενά δίνοντας στο μοντέλο ΤΝ τις πληροφορίες που χρειάζεται για να κάνει στοχευμένες επιλογές.
Λειτουργούν οι ρυθμίσεις περιεχομένου για όλα τα ζεύγη γλωσσών
Οι ρυθμίσεις περιεχομένου ισχύουν για οποιοδήποτε ζεύγος γλωσσών. Ορισμένες κατηγορίες έχουν περισσότερο αντίκτυπο για ορισμένες γλώσσες από άλλες. Το φύλο ομιλητή έχει σημασία περισσότερο για γλώσσες με φύλο όπως η ρωσική και τα αραβικά. Η τυπικότητα έχει το ισχυρότερο αποτέλεσμα στα ιαπωνικά, κορεάτικα και γερμανικά. Η περιφερειακή παραλλαγή είναι κρίσιμη για γλώσσες με μεγάλες διαλεκτικές διαφορές όπως τα πορτογαλικά και τα κινεζικά. Το σύστημα προσαρμόζει την ερμηνεία του περιεχομένου με βάση τη γλώσσα-στόχο.