Μετατροπή Κυριλλικών σε Λατινικά και Αραβικών σε Λατινικά και Μετατροπή Γραφής για Πολύγλωσσες Εφαρμογές

Το διαδίκτυο λειτουργεί με λατινικούς χαρακτήρες. Τα URLs είναι λατινικά. Οι διευθύνσεις ηλεκτρονικού ταχυδρομείου είναι λατινικές. Τα ονόματα αρχείων στα περισσότερα λειτουργικά συστήματα προεπιλέγονται σε λατινικά. Οι αναγνωριστικοί αριθμοί βάσης δεδομένων, οι παράμετροι API και οι κωδικοί που δημιουργούνται από το σύστημα λειτουργούν όλα στο υποσύνολο ASCII των λατινικών. Αυτό το λατινικό κεντρικό στοιχείο είναι ένα ιστορικό αντικείμενο που προηγείται της παγκόσμιας επέκτασης του διαδικτύου, αλλά οι πρακτικές του συνέπειες παραμένουν σε κάθε σύστημα που χρειάζεται να χειρίζεται κείμενο από τα πολλά μη λατινικά συστήματα γραφής του κόσμου. Ένα ρωσικό όνομα επιχείρησης που φαίνεται απόλυτα φυσιολογικό σε κυριλλικά γίνεται μια δυσαναγνώριστη ακολουθία κωδικοποιημένων χαρακτήρων όταν εξαναγκάζεται σε ένα URL. Ένα αραβικό όνομα προσώπου που ρέει φυσικά από δεξιά προς τα αριστερά γίνεται ένα τεχνικό παζλ όταν χρειάζεται να εμφανιστεί σε ένα δυτικό πεδίο βάσης δεδομένων. Αυτές οι σύγκρουσεις μεταξύ της γλωσσικής ποικιλίας του κόσμου και της λατινικής υποδομής του διαδικτύου συμβαίνουν εκατομμύρια φορές κάθε ημέρα, και καθεμία απαιτεί μια μετάφραση όχι του νοήματος αλλά της γραφής.

Η μετατροπή γραφής είναι η λέξη για αυτήν τη μετάφραση γραφής, και είναι ριζικά διαφορετική από τη γλωσσική μετάφραση. Η μετάφραση μετατρέπει το νόημα: "σπίτι" στα αγγλικά γίνεται "дом" στα ρωσικά, γιατί και οι δύο λέξεις σημαίνουν το ίδιο πράγμα σε διαφορετικές γλώσσες. Η μετατροπή γραφής μετατρέπει τη γραφή: "дом" σε κυριλλικά γίνεται "dom" σε λατινικά, γιατί αυτοί είναι οι λατινικοί χαρακτήρες που προσεγγίζουν τους ήχους των κυριλλικών χαρακτήρων. Το νόημα παραμένει το ίδιο. Η γλώσσα παραμένει η ίδια. Μόνο το σύστημα γραφής αλλάζει, γι' αυτό η μετατροπή γραφής περιγράφεται μερικές φορές ως "επανα-ορθογραφία" παρά "επανα-νόημα".

Το API Transliterator παρέχει αυτήν τη μετατροπή γραφής ως προγραμματιζόμενη υπηρεσία. Στείλτε κείμενο σε μία γραφή, λάβετέ το πίσω σε μια άλλη. Κυριλλικά σε λατινικά, αραβικά σε λατινικά, ελληνικά σε λατινικά, Devanagari σε λατινικά, και μια ολοκληρωμένη λίστα άλλων ζευγών γραφών που καλύπτουν τα συστήματα γραφής που χρησιμοποιούνται από την πλειονότητα των χρηστών του διαδικτύου του κόσμου. Η μετατροπή ακολουθεί καθιερωμένα πρότυπα μετατροπής γραφής όπου υπάρχουν και φωνητικά ακριβή αντιστοιχήματα όπου τυποποιημένα συστήματα δεν έχουν οριστεί, παράγοντας αποτέλεσμα που είναι ευανάγνωστο, προφερό και κατάλληλο για τα τεχνικά πλαίσια όπου απαιτούνται λατινικοί χαρακτήρες.

URL Slugs και το Πρόβλημα Μη Λατινικού Κειμένου σε Διαδικτυακές Διευθύνσεις

Η πιο άμεσα πρακτική εφαρμογή της μετατροπής γραφής στην ανάπτυξη ιστού είναι η δημιουργία URL slugs από μη λατινικό κείμενο. Μια δημοσίευση ιστολογίου με τίτλο "Як приготовити борщ" (Πώς να φτιάξεις ζουμπούλης) χρειάζεται ένα φιλικό URL slug που λειτουργεί σε κάθε πρόγραμμα περιήγησης, κάθε πλατφόρμα κοινής χρήσης και κάθε σύστημα αναλυτικής παρακολούθησης. Οι κυριλλικοί χαρακτήρες στον τίτλο είναι έγκυροι σε διεθνοποιημένα ονόματα τομέων (IDNs) και διεθνοποιημένα αναγνωριστικά πόρων (IRIs), αλλά στην πράξη, η περισσότερη υποδομή ιστού τα χειρίζεται ανεξάρτητα. Τα κωδικοποιημένα κυριλλικά URLs είναι μεγάλα, άσχημα και σπάνε όταν αντιγράφονται μεταξύ ορισμένων εφαρμογών. Ένα μετατροπό slug όπως "kak-prigotovit-borshch" είναι σύντομο, ευανάγνωστο, κοινοχρησιμοποιούμενο και καθολικά συμβατό.

Η δημιουργία slug απαιτεί όχι μόνο μετατροπή γραφής αλλά και πρόσθετη επεξεργασία: μετατροπή σε πεζά, αντικατάσταση κενών διαστημάτων με παύλες, αφαίρεση ειδικών χαρακτήρων και κανονικοποίηση χαρακτήρων με διακριτικά. Το API μετατροπής γραφής χειρίζεται το βήμα μετατροπής γραφής, μετατρέποντας τους κυριλλικούς χαρακτήρες στα λατινικά τους ισοδύναμα, και η εφαρμογή κλήσης χειρίζεται τα υπόλοιπα βήματα κανονικοποίησης. Αυτή η διαίρεση ευθύνης διατηρεί το API επικεντρωμένο στο γλωσσικά περίπλοκο καθήκον (ορθή μετατροπή γραφής) ενώ αφήνει τα τεχνικά απλά καθήκοντα (πεζά, εισαγωγή παύλας) στην υπάρχουσα διοχέτευση επεξεργασίας κειμένου του προγραμματιστή.

Η ποιότητα της μετατροπής γραφής για τη δημιουργία slug έχει σημασία γιατί το slug είναι ορατό στους χρήστες και συμβάλλει στην SEO. Ένας ρωσικός χρήστης που αντιμετωπίζει το slug "kak-prigotovit-borshch" το αναγνωρίζει αμέσως ως την μετατροπή του ρωσικού τίτλου και μπορεί να το διαβάσει χωρίς προσπάθεια. Ένα κακά μετατροπό slug, αυτό που χρησιμοποιεί λανθασμένες αντιστοιχήσεις γραμμάτων ή παράγει απρόφορες συνδυασμούς χαρακτήρων, φαίνεται σαν μαλακίες και στους ρωσικούς και στους αγγλικούς αναγνώστες. Το API χρησιμοποιεί φωνητικά ακριβή αντιστοιχήματα που παράγουν ευανάγνωστο αποτέλεσμα ανεξάρτητα από την πηγή γραφής, η οποία κάνει τα προκύπτοντα slugs λειτουργική και ως τεχνικούς αναγνωριστές και ως κείμενο που μπορούν να διαβάσουν άνθρωποι.

Τα ηλεκτρονικά καταστήματα που πουλούν σε πολύγλωσσες αγορές χρησιμοποιούν ευρέως τη μετατροπή γραφής για τη δημιουργία URLs προϊόντων. Ένας κατάλογος προϊόντων που περιλαμβάνει στοιχεία με ονόματα στα ρωσικά, αραβικά, κινέζικα και ινδικά χρειάζεται URL slugs που λειτουργούν σε όλες τις γλώσσες. Η χειροκίνητη μετατροπή γραφής σε αυτήν την κλίμακα είναι δύσκολη, και η αυτοματοποιημένη μετατροπή γραφής μέσω του API παράγει συνεπείς, ακριβείς slugs που μπορούν να δημιουργηθούν ως μέρος της διοχέτευσης εισαγωγής προϊόντος χωρίς ανθρώπινη παρέμβαση για κάθε γλώσσα.

Ονόματα Διαβατηρίου και Επίσημη Μετατροπή Γραφής Εγγράφου

Η μετατροπή γραφής διαβατηρίου είναι μια από τις πιο συνέπειες εφαρμογές της μετατροπής γραφής, διότι τα λάθη στη μετατροπή ονόματος γραφής προκαλούν προβλήματα πραγματικού κόσμου. Ένα όνομα που μετατρέπεται διαφορετικά σε ένα διαβατήριο από ό,τι σε μια αίτηση θεώρησης μπορεί να καθυστερήσει ή να αποτρέψει τα διεθνή ταξίδια. Ένα όνομα που μετατρέπεται διαφορετικά σε ένα σύστημα τραπεζικής από ό,τι σε ένα έγγραφο ταυτότητας μπορεί να αποκλείσει τις χρηματοοικονομικές συναλλαγές. Τα κολλέδια είναι αρκετά υψηλά ώστε οι περισσότερες χώρες να διατηρούν επίσημα πρότυπα μετατροπής γραφής για ονόματα διαβατηρίου, και το API εφαρμόζει αυτά τα πρότυπα για τις γραφές που υποστηρίζει.

Τα ρωσικά ονόματα επεξηγούν καλά την πολυπλοκότητα. Το ρωσικό γράμμα "Щ" μπορεί να μετατραπεί ως "shch," "sch," "sh," ή "sc" ανάλογα με ποιο σύστημα μετατροπής γραφής εφαρμόζεται. Το πρότυπο ICAO (Διεθνής Οργανισμός Πολιτικής Αεροπορίας) που χρησιμοποιείται για διαβατήρια καθορίζει "shch." Το σύστημα BGN/PCGN που χρησιμοποιείται από αμερικανικές και βρετανικές κυβερνητικές υπηρεσίες καθορίζει "shch." Το σύστημα ISO 9 που χρησιμοποιείται σε ακαδημαϊκά πλαίσια καθορίζει ένα ενιαίο χαρακτήρα με διακριτικό σημάδι. Ένα άτομο με όνομα "Щербаков" χρειάζεται να γνωρίζει ότι το διαβατήριό τους θα διαβάζει "Shcherbakov" και ότι κάθε άλλο έγγραφο που σχετίζεται με το όνομά τους πρέπει να ταιριάζει με αυτήν τη μετατροπή γραφής ακριβώς. Το API υποστηρίζει πολλαπλά πρότυπα μετατροπής γραφής και επιτρέπει στον καλούντα να καθορίσει ποιο πρότυπο να εφαρμόσει, διασφαλίζοντας ότι το αποτέλεσμα ταιριάζει με τις απαιτήσεις του συγκεκριμένου πλαισίου.

Η αραβική μετατροπή ονόματος γραφής προσθέτει πρόσθετη πολυπλοκότητα, διότι η αραβική γραφή είναι βασισμένη σε abjad, που σημαίνει ότι τα φωνήεντα συχνά παραλείπονται από το γραπτό κείμενο και πρέπει να συναχθούν για τη μετατροπή γραφής. Το όνομα "محمد" (Muhammad) μπορεί να μετατραπεί νόμιμα ως Muhammad, Mohamed, Mohammed, Muhammed, ή αρκετές άλλες παραλλαγές ανάλογα με το σύστημα μετατροπής γραφής και την περιοχική προφορά. Το API εφαρμόζει συνεπείς, συμβατούς με τα πρότυπα αντιστοιχήματα που παράγουν τις πιο ευρέως αναγνωρισμένες παραλλαγές, ενώ η τεκμηρίωση σημειώνει τις εναλλακτικές ορθογραφίες που διαφορετικά πρότυπα παράγουν για ονόματα που συνήθως μετατρέπονται γραφής.

Τα συστήματα μετανάστευσης και κυβέρνησης που επεξεργάζονται αιτήσεις από πολλές χώρες επωφελούνται από τυποποιημένη μετατροπή γραφής που παράγει συνεπές αποτέλεσμα ανεξάρτητα από ποιος φορέας επεξεργάζεται την αίτηση. Χωρίς μετατροπή γραφής βασισμένη σε API, ατομικοί φορείς εφαρμόζουν τη δική τους διαισθητική μετατροπή γραφής, η οποία παράγει ασυνεπείς αποτελέσματα που περιπλέκουν τη σύγκριση βάσης δεδομένων, την επαλήθευση ταυτότητας και τη σύνδεση εγγραφών. Η τυποποιημένη μετατροπή γραφής μέσω του API διασφαλίζει ότι το ίδιο κείμενο πηγής παράγει πάντα το ίδιο λατινικό αποτέλεσμα, το οποίο είναι απαραίτητο για συστήματα που βασίζονται στη σύγκριση συμβολοσειρών για την επαλήθευση ταυτότητας.

Κανονικοποίηση Αναζήτησης και Εύρεση Περιεχομένου Σε Γραφές

Τα συστήματα αναζήτησης αντιμετωπίζουν μια θεμελιώδη πρόκληση όταν το σώμα αναζήτησης περιέχει περιεχόμενο σε πολλαπλές γραφές: ένας χρήστης που αναζητά σε μία γραφή θα πρέπει να μπορεί να βρει περιεχόμενο που αποθηκεύεται σε άλλη γραφή εάν το περιεχόμενο είναι σημασιολογικά σχετικό. Ένας ρωσικός χρήστης που αναζητά "Москва" (Μόσχα) θα πρέπει να βρει περιεχόμενο που αναφέρει "Moskva" σε ένα λατινικό αρχείο ευρετηρίου. Ένας αγγλικός χρήστης που αναζητά "Moscow" θα πρέπει να βρει περιεχόμενο που αποθηκεύεται με το κυριλλικό αρχικό "Москва." Αυτή η σταυρό-γραφική αντιστοιχία απαιτεί ένα στρώμα κανονικοποίησης που μετατρέπει αναζητήσεις και περιεχόμενο που έχει δημοσιευθεί σε ευρετήριο σε μια κοινή γραφή πριν από τη σύγκριση.

Το API μετατροπής γραφής χρησιμεύει ως αυτό το στρώμα κανονικοποίησης. Στο χρόνο ευρετηρίασης, το μη λατινικό περιεχόμενο μετατρέπεται σε λατινικά και αποθηκεύεται παράλληλα με την αρχική έκδοση γραφής. Στο χρόνο ερωτήματος, τα μη λατινικά ερωτήματα μετατρέπονται πριν να ταιριάξουν με το λατινικό κανονικοποιημένο ευρετήριο. Αυτή η δυαδική προσέγγιση ευρετηρίασης διασφαλίζει ότι οι αναζητήσεις σε οποιαδήποτε υποστηριζόμενη γραφή βρίσκουν περιεχόμενο που αποθηκεύεται σε οποιαδήποτε υποστηριζόμενη γραφή, επειδή η αντιστοιχία συμβαίνει σε ένα κοινό λατινικό κανονικοποιημένο χώρο όπου οι διαφορές γραφής έχουν επιλυθεί.

Η ακρίβεια της μετατροπής γραφής επηρεάζει άμεσα τη σχετικότητα αναζήτησης σε αυτήν την εφαρμογή. Μια λανθασμένη μετατροπή γραφής παράγει μια κανονικοποιημένη φόρμα που δεν ταιριάζει με τη σωστή κανονικοποιημένη μορφή του ίδιου λόγου από μια διαφορετική πηγή, η οποία δημιουργεί ψευδείς αρνητικούς (σχετικό περιεχόμενο δεν βρέθηκε). Μια μετατροπή γραφής που παράγει διφορούμενο αποτέλεσμα, όπου διαφορετικές λέξεις πηγής αντιστοιχούν στην ίδια λατινική συμβολοσειρά, δημιουργεί ψευδείς θετικούς (ασχετικό περιεχόμενο που βρέθηκε). Τα φωνητικά ακριβή αντιστοιχήματα του API ελαχιστοποιούν και τα δύο είδη σφάλματος, αν και κάποια διφορία είναι εγγενής σε οποιοδήποτε σύστημα μετατροπής γραφής, διότι διαφορετικές γραφές κωδικοποιούν διαφορετικές φωνητικές διακρίσεις.

Οι πλατφόρμες μουσικής, οι βάσεις δεδομένων βιβλίων και οι κατάλογοι μέσων είναι βαρείς χρήστες κανονικοποίησης αναζήτησης βασισμένης σε μετατροπή γραφής, διότι οι κατάλογοί τους εκτείνονται σε δεκάδες γλώσσες και γραφές. Ένας καλλιτέχνης του οποίου το όνομα αποθηκεύεται σε κυριλλικά στο ρωσικό κατάλογο, λατινικά στο κατάλογο των ΗΠΑ και ιαπωνική κατακάνα στο ιαπωνικό κατάλογο χρειάζεται να είναι εντοπίσιμο μέσω μιας μόνο αναζήτησης ανεξάρτητα από την γραφή που πληκτρολογεί ο χρήστης. Η κανονικοποίηση μετατροπής γραφής κάνει αυτήν την ενοποιημένη αναζήτηση δυνατή μειώνοντας όλες τις παραλλαγές γραφών σε μια κοινή λατινική μορφή που χρησιμεύει ως κλειδί αντιστοιχίας.

Υποστηριζόμενες Γραφές και το Εύρος Μετατροπής

Το API Transliterator υποστηρίζει μετατροπή από κυριλλικά (ρωσικά, ουκρανικά, βουλγαρικά, σερβικά και άλλες γλώσσες κυριλλικών γραφών), αραβικά (συμπεριλαμβανομένων περσικών και ουρδικών παραλλαγών), ελληνικά, Devanagari (χίντι, σανσκριτικά, μαράθι), βεγγάλι, ταϊλάνδη, γεωργιανά, αρμενικά, εβραϊκά, κορεατικά (ρωμαϊκοποίηση του Hangul), ιαπωνικά (μετατροπή romaji για hiragana και katakana) και κινέζικα (μετατροπή pinyin για απλοποιημένα και παραδοσιακά χαρακτήρες). Κάθε ζευγάρι γραφών έχει συγκεκριμένους κανόνες μετατροπής γραφής που λαμβάνουν υπόψη τα φωνητικά χαρακτηριστικά της γραφής πηγής και τις δυνατότητες αναπαράστασης των λατινικών χαρακτήρων.

Οι κανόνες μετατροπής δεν είναι ένα μέγεθος που ταιριάζει όλα σε γλώσσες που μοιράζονται μια γραφή. Τα ρωσικά κυριλλικά και τα ουκρανικά κυριλλικά χρησιμοποιούν το ίδιο αλφάβητο αλλά με διαφορετικά γράμματα και διαφορετικές συμβάσεις προφοράς για κοινά γράμματα. Το API διακρίνει τις ρωσικές και ουκρανικές εισροές και εφαρμόζει τους κατάλληλους κανόνες μετατροπής γραφής για τη γλώσσα, το οποίο είναι απαραίτητο για την ακρίβεια, διότι ο ίδιος χαρακτήρας μπορεί να αναπαριστά διαφορετικούς ήχους σε διαφορετικές κυριλλικές γλώσσες. Αυτή η συνειδητότητα γλώσσας επεκτείνεται σε άλλες πολύγλωσσες γραφές, διασφαλίζοντας ότι η μετατροπή γραφής αντικατοπτρίζει τις συμβάσεις προφοράς της συγκεκριμένης γλώσσας πηγής παρά την εφαρμογή μιας γενικής αντιστοίχησης επιπέδου γραφής.

Το αποτέλεσμα είναι καθαρό λατινικό κείμενο χρησιμοποιώντας χαρακτήρες ASCII από προεπιλογή, με επιλογή να συμπεριληφθούν διακριτικά σημάδια για συστήματα μετατροπής γραφής που τα χρησιμοποιούν (όπως ISO 9 για κυριλλικά ή ISO 233 για αραβικά). Η έξοδος μόνο ASCII είναι ιδανική για τεχνικές εφαρμογές όπως URL slugs, ονόματα αρχείων και αναγνωριστικοί αριθμοί βάσης δεδομένων όπου τα διακριτικά σημάδια προκαλούν προβλήματα συμβατότητας. Η έξοδος με διακριτικά είναι ιδανική για εφαρμογές όπου η φωνητική ακρίβεια έχει περισσότερη σημασία από την καθολική συμβατότητα, όπως ακαδημαϊκές δημοσιεύσεις και γλωσσικές βάσεις δεδομένων.

Η διδιάστατη μετατροπή υποστηρίζεται για ζεύγη γραφών όπου η αντιστοίχηση είναι αναστρέψιμη. Κυριλλικά σε λατινικά και λατινικά σε κυριλλικά και τα δύο λειτουργούν, ενεργοποιώντας τη μετατροπή ολοκλήρου κύκλου όπου το αρχικό κείμενο μπορεί να ανακτηθεί περίπου από τη μετατροπή γραφής. Η ανατροπή είναι περίπου παρά ακριβής για ορισμένους χαρακτήρες, διότι η μετατροπή γραφής είναι εγγενώς απώλεια όταν η γραφή πηγής διακρίνει ήχους που η γραφή στόχου δεν κάνει, αλλά για τους περισσότερους πρακτικούς σκοπούς η ποιότητα ολοκλήρου κύκλου είναι επαρκής για την ανθρώπινη αναγνώριση.

Συχνές Ερωτήσεις

Ποια είναι η διαφορά μεταξύ μετατροπής γραφής και μετάφρασης

Η μετάφραση μετατρέπει το νόημα μεταξύ γλωσσών: "γάτα" γίνεται "кошка" στα ρωσικά, διότι και οι δύο λέξεις σημαίνουν το ίδιο πράγμα. Η μετατροπή γραφής μετατρέπει τη γραφή χωρίς να αλλάζει τη γλώσσα ή το νόημα: "кошка" γίνεται "koshka" σε λατινικούς χαρακτήρες, αναπαριστώντας το ίδιο ρωσικό λόγο σε ένα διαφορετικό σύστημα γραφής. Η μετατροπή γραφής διατηρεί τον ήχο; η μετάφραση διατηρεί το νόημα.

Ποιο πρότυπο μετατροπής γραφής χρησιμοποιεί το API από προεπιλογή

Το προεπιλεγμένο πρότυπο μετατροπής γραφής ποικίλλει ανάλογα με τη γραφή και τεκμηριώνεται για κάθε υποστηριζόμενο ζευγάρι γραφών. Για κυριλλικά, η προεπιλογή ακολουθεί τις συμβάσεις ICAO/διαβατηρίου. Για αραβικά, η προεπιλογή ακολουθεί μια φωνητικά βελτιστοποιημένη αντιστοίχηση που παράγει τη πιο ευρέως αναγνωρίσιμη λατινική έξοδο. Οι χρήστες μπορούν να καθορίσουν εναλλακτικά πρότυπα όπου υπάρχουν πολλαπλά αναγνωρισμένα συστήματα για το ίδιο δοχείο.

Μπορεί το API να χειριστεί κείμενο μικτής γραφής

Ναι. Το κείμενο που περιέχει ένα μείγμα λατινικών και μη λατινικών χαρακτήρων επεξεργάζεται μετατρέποντας μόνο τα μη λατινικά μέρη και διατηρώντας τους λατινικούς χαρακτήρες ως έχουν. Οι αριθμοί, η στίξη και άλλοι μη αλφαβητικοί χαρακτήρες διατηρούνται αμετάβλητοι. Αυτή η επεξεργασία σε μικτή λειτουργία είναι απαραίτητη για κείμενο πραγματικού κόσμου που συχνά περιέχει ονόματα μάρκας, τεχνικούς όρους ή ακρωνύμια σε λατινικά παράλληλα με μη λατινικό κείμενο σώματος.

Πώς το API χειρίζεται χαρακτήρες που δεν έχουν λατινικό ισοδύναμο

Χαρακτήρες χωρίς ένα ενιαίο χαρακτήρα λατινικό ισοδύναμο αναπαρίστανται από συνδυασμούς πολλαπλών χαρακτήρων που προσεγγίζουν τον ήχο. Το ρωσικό "Щ" γίνεται "shch," το αραβικό "ع" γίνεται σύμβολο ή "a" ανάλογα με το πρότυπο, και άλλοι μοναδικοί χαρακτήρες λαμβάνουν συμβατές με πρότυπα λατινικές αναπαραστάσεις. Η τεκμηρίωση παραθέτει όλες τις αντιστοιχήσεις χαρακτήρων για κάθε υποστηριζόμενη γραφή.

Είναι η μετατροπή γραφής αναστρέψιμη

Η ανατροπή εξαρτάται από το ζευγάρι γραφών και το πρότυπο μετατροπής γραφής που χρησιμοποιείται. Κάποιες μετατροπές είναι πλήρως αναστρέψιμες, που σημαίνει ότι το αρχικό κείμενο μπορεί να ανακτηθεί ακριβώς από τη μετατροπή γραφής. Άλλα είναι περίπου αναστρέψιμα, που σημαίνει ότι οι περισσότεροι χαρακτήρες μπορούν να ανακτηθούν αλλά κάποιες διακρίσεις παρούσες στη γραφή πηγής χάνονται στη λατινική αναπαράσταση. Η τεκμηρίωση υποδεικνύει το επίπεδο ανατροπής για κάθε υποστηριζόμενη μετατροπή.

Μπορεί το API να χρησιμοποιηθεί για μαζική μετατροπή γραφής των μεγάλων αρχείων κειμένου

Ναι. Το API δέχεται κείμενο οποιουδήποτε πρακτικού μήκους και το επεξεργάζεται σε ένα ενιαίο αίτημα. Για πολύ μεγάλα σύνολα δεδομένων, η επεξεργασία ομάδας με πολλαπλές ταυτόχρονες κλήσεις API παρέχει αποδοτική απόδοση. Το κόστος πίστωσης ανά αίτημα κλιμακώνεται με το μήκος του κειμένου, κάνοντας τη μαζική μετατροπή γραφής οικονομικά πρακτική για εργασίες επεξεργασίας μεγάλου σώματος.