Rozbaľovacia ponuka je prvá vec, ktorú vidíte pri nahrávaní videa do akéhokoľvek nástroja na generovanie titulkov. Dlhý zoznam jazykov, zoradený abecedne, niekedy s vlajkami vedľa nich. Angličtina je vždy prítomná, zvyčajne na vrchu. Španielčina, francúzština, nemčina, portugalčina. Všetci prítomní a započítaní. Posúvajte sa ďalej a môžete nájsť chinesťinu, japončinu, kórejčinu. Pokračujte v posúvaní. Arabčina. Hindčina, niekedy. A potom sa zoznam skončí, alebo jazyk, ktorý skutočne potrebujete, tam jednoducho nie je. Slovenčina. Nie je v zozname. Nie ako možnosť, nie ako beta funkcia, ani ako nepodporovaná položka s varovným štítkom. V univerze produktu jednoducho neexistuje.
Toto nie je malá nepohodlnosť. Keď jazyk úplne chýba, nástroj nie je čiastočne užitočný. Je úplne nepoužiteľný. Neexistuje žiadne riešenie, ktoré by prinieslo prijateľné výsledky. Zvuk vchádza a buď nástroj to úplne zamietne, alebo sa pokúsi spracovať ako niečo iné. Výstup je smeťom, zakaždým.
Skúsenosti tvorcov obsahu, ktorých primárny jazyk leží mimo úzkeho pásma „komerčne zaujímavých" jazykov, sú jedným neustálym prispôsobovaním. Znamená to naučiť sa pracovať okolo nástrojov namiesto s nimi. Znamená to, že väčšina softvéru jednoducho nebola vytvorená s vami na mysli a že funkcie propagované ako „globálne" alebo „viackľúčové" skutočne znamenajú „podporujeme desať jazykov, ktoré nám zarobia najviac peňazí."
Ruská obchádzka a prečo zlyháva
Keď slovenčina nie je v zozname, ruština sa stane predvoleným riešením. Tieto dva jazyky zdieľajú cyrilickú abecedu a určité slová majú podobné korene. Na papieri sa to zdá byť rozumným približovaním. V praxi je to katastrofa, ktorá vytvorí viac práce ako všetko robiť ručne od začiatku.
Ruská transkripcija aplikovaná na slovenský zvuk produkuje niečo, čo sa zdá byť takmer správne na prvý pohľad. Cyrilické znaky sa objavujú na obrazovke, slová majú vagúnne slovanský tvar a možno je jedna z troch skutočne správna. Ale „takmer správne" v titulkoch znamená úplne zle. Divák, ktorý číta titulky, ktoré sú správne na 60%, nedostáva 60% správy. Dostáva zmätok, rozptýlenie a dojem, že tvorca sa nestaral dosť na opravu svojho vlastného obsahu.
Proces úpravy, ktorý nasleduje, je miestom, kde sa skutočne stráca čas. Video dlhé päť minút môže vytvoriť 180 až 220 jednotlivých segmentov titulkov. Keď je jazyk transkripcije nesprávny, každý jeden z týchto segmentov musí byť otvorený, prečítaný, porovnaný s skutočným zvukom a úplne prepisovaný. Nie opravený, ale úplne prepísaný, pretože ruská transkripcija často zodpovedá pôvodnému slovenčine toľko, že je rýchlejšie vymazať text a začať nanovo, ako sa pokúšať opraviť ho znak po znaku. Dve hodiny manuálnej úpravy na päťminútové video nie je nezvyklé. Pre niekoho, kto prevádzkuje niekoľko YouTube kanálov s pravidelným harmonogramom nahrávania, táto aritmetika jednoducho nevychádza.
Tento presný problém sa rozširuje ďaleko za hranice slovenčiny. Tvorcovia hindčiny sa s ním stretávajú, keď ich regionálny dialekt zapadne do generickej hindčiny, ktorá prepadne polovicu slovnej zásoby. Tvorcovia thajčiny sa zaoberajú chybami tonálnej interpretácie, ktoré prevrátia každú druhú vetu na nezmysel. Vietnamčina, srbčina, tagalčina, svahilčina. Zoznam jazykov, ktoré sú buď ignorované alebo zle aproximované hlavnými nástrojmi na generovanie titulkov, je dlhý a tvorcovia, ktorí tieto jazyky hovoríte, po roky potajomky absorbujú dodatočnú záťaž.
Prečo vznik medery jazykov existuje na prvom mieste
Nástroje na generovanie titulkov sú podniky a podniky prideľujú zdroje na vývoj, kde je príjem. Trhy anglicky hovoriace reprezentujú najväčší podiel platiacich zákazníkov pre takmer všetky produkty SaaS v priestore tvorby videa. Španielčina a portugalčina pokrývajú väčšinu Latinskej Ameriky. Francúzština pridáva časti Európy a Afriky. Nemčina, japončina, kórejčina. Každá otvorí trh so značným kúpnou silou. Produkt, ktorý podporuje desať alebo dvanásť jazykov, môže tvrdiť, že slúži väčšine svojej potenciálnej zákazníka a z čisto finančného hľadiska je táto tvrdenie obranyhodná.
Pridanie nového jazyka do transkripcijného systému nie je triviálne. Vyžaduje si tréningové údaje, testovanie kvality, pokračujúcu údržbu a podpornú dokumentáciu. Pre jazyk hovorený siedmimi miliónmi ľudí, ako je slovenčina, výpočet nákladov na výnosy zriedka ospravedlňuje investíciu, keď by rovnaké inžinierske hodiny mohli ísť smerom k zlepšeniu presnosti anglickej transkripcije z 95% na 97%, čo ovplyvňuje milióny platiacich užívateľov.
Výsledok je trh, kde prvých pätnásť alebo dvadsať jazykov dostáva vynikajúcu podporu, ďalších tridsať dostáva prijateľné pokrytie a všetko ostatné alebo úplne chýba alebo je tak zle implementované, že by to nemalo byť uvedené ako funkcia vôbec. Toto nie je škodlivé. Je to predvídateľný výsledok stavby produktov, ktoré optimalizujú najväčšie možné publikum namiesto najširšieho možného pokrytia. Ale pochopenie, prečo sa to stane, nie je o nič menej frustrujúce, keď ste ten, ktorý hľadí na rozbaľovaciu ponuku, ktorá neobsahuje váš jazyk.
Generátor titulkov na YEB bol vytvorený s inou sadou priorít. Namiesto začatia s najkomerčne cennými jazykmi a práce smerom von, bol transkripcijný engine vybraný špeciálne pre svoju rozmanitosť podpory jazykov. Deväťdesiatosem jazykov od začiatku, nie ako cestovný plán, ale ako požiadavka na spustenie. Slovenčina, srbčina, hindčina, thajčina, vietnamčina, tagalčina a desiatky ďalších, ktoré sa zriedka objavujú v zoznamoch funkcií konkurentov, sú všetky spracovávané pôvodne, s rovnakou transkripcijnou potrubie a rovnakými normami kvality ako angličtina alebo španielčina.
Čo správna podpora jazykov skutočne znamená v praxi
Podpora jazyka neznamená len akceptovať zvuk v tomto jazyku a vracať nejaký text. Znamená to, že transkripcijný engine chápe fonetickú štruktúru, bežnú slovnú zásobu, kadencia a rytmus prirodzeného reči v tomto jazyku. Znamená to, že keď slovenský hovorca nahrá video, výstup nemusí byť manuálne opravovaný mimo príležitostného vlastného mena alebo technického termínu, na ktorý by si každý transkripcijný systém môže trúfať.
Na YEB Captions nahranie slovenského videa funguje presne rovnako ako nahranie anglického. Jazyk je vybraný z úplného zoznamu 98 možností, zvuk je spracovaný a transkripcija vracia správne načasované segmenty titulkov v slovenčine. Žiadne ruské približovanie, žiadne ručné prepisovanie, žiadne dvojhodinové relácie úpravy na päťminútové video. Segmenty je stále možné upraviť jednotlivo v prípade potreby, napríklad na zle počutý svah tu alebo meno, ktoré potrebuje opravu tam, ale základná presnosť robí tieto úpravy merané v minútach namiesto hodín.
To isté platí aj pre preklad titulkov. Obsah pôvodne prepísaný v slovenčine je možné pred vykresľovaním preložiť do ktoréhokoľvek z ďalších podporovaných jazykov. Hudobné video so slovenskými textami je možné zverejniť s anglickými, španielskymi alebo japonskými titulkami bez toho, aby ste prešli samostatným pracovným postupom prekladu. Pre tvorcov, ktorí zverejňujú obsah určený pre medzinárodné publiká, to eliminuje celý vrstvu manuálnej práce, ktorá predtým vyžadovala buď najímanie prekladateľa, alebo strávenie večera so slovníkom a veľa trpezlivosti.
Pointa nie je, že YEB Captions je jediný nástroj na svete, ktorý podporuje slovenčinu. Hrsť nástrojov ho ponúka v nejakej forme. Pointa je, že správna podpora, kde je kvalita transkripcije skutočne použiteľná bez rozsiahleho manuálneho opravovania, zostáva zriedkavá pre jazyky mimo mainstreamového a medzi „uvedením ako podporované" a „skutočne dobre funguje" je často obrovská priepasť.
Širší problém stavby nástrojov pre všetkých
V väčšine softvérového vývoja je zakomponovaný predpoklad, že „všetci" znamená „všetci, ktorí hovoria hlavný jazyk." Stránky funkcií hovoria „globálne" a „viackľúčové", zatiaľ čo skutočný zoznam jazykov hovorí oveľa užšej príbehu. Toto sa neobmedzuje len na nástroje na generovanie titulkov. Služby strojového prekladu, hlasové asistenty, systémy OCR a vyhľadávače vykazujú rovnakú schému hlbokej podpory pre malý počet jazykov a plytko alebo bez podpory pre zvyšok.
To, čo robí nástroje na generovanie titulkov obzvlášť viditeľnými, je povaha zlyhania. Keď hlasový asistent zle pochopí príkaz, používateľ ho môže zopakovať alebo namiesto toho zadať. Keď nástroj na generovanie titulkov vytvorí smeťový text, ten text skončí v paľbe v video, ktoré sa publikuje stovkám alebo tisícom divákov. Chyba je trvalá, verejná a priamo spojená s profesionálnou reputáciou tvorcov. Zle to nie je len nepohodlnosť; je to viditeľné zlyhanie kvality, ktoré diváci všimnu okamžite.
Tvorcovia, ktorí hovoria jazyky bez dostatočnej služby, si v priebehu rokov vyvinuli všetky druhy obchádzok. Niektorí svoj videá nahrávajú v angličtine, aj keď ich publikum hovorí niečo iné. Niektorí úplne preskakujú titulky a akceptujú nižšie čísla zapojenia. Niektorí používajú najbližšie dostupný jazyk a potom strávia hodiny opravou výstupu, absorbujúc náklady na pracovnú silu, ktorú ich anglicky hovoriace konkurenty jednoducho nemusia riešiť. Žiadny z nich nie sú skutočné riešenia. Sú to kompromisy vynútené trhom, ktorý sa rozhodol, že určité jazyky nestoja za to byť podporované správne.
Budovanie captions.yeb.to so 98 jazykmi bolo čiastočne reakciou na túto špecifickú frustráciu a čiastočne uznávaním, že slúžiace segmenty trhu sú oveľa väčšie, ako sa zdá väčšina spoločností myslí. Sedem miliónov slovenských hovoriacich je malý počet v porovnaní s angličtinou alebo mandarínčinou. Ale sčítajte všetky jazyky, ktoré spadajú do kategórie „komerčne zaujímavé", vrátane Srbov, Thajcov, Vietnamcov, Tagalog hovoriacich, Svahili hovoriacich a hovoríte o stovkách miliónov ľudí, ktorí boli zle slúžiť v nástrojoch na generovanie titulkov na roky. To nie je výkyvná. To je trh, ktorý jednoducho nebol riešený a krajina s aplikáciami na titulky pomaly začína odrážať túto realitu.
Často kladené otázky
Ktoré generátory titulkov podporujú slovenský jazyk
Len veľmi málo nástrojov na generovanie titulkov obsahuje slovenčinu ako podporovaný jazyk a ešte menej vytvárajú použiteľnú kvalitu transkripcije. YEB Captions podporuje slovenčinu ako jeden z 98 jazykov s pôvodnou transkripcijom, čo znamená, že výstup nevyžaduje rusko-jazykovú obchádzku, ktorú väčšina ostatných nástrojov núti slovenčinu hovoriace.
Môže generátor titulkov AI presne spracovať ne-latinské skripty
Presnosť závisí úplne od transkripcijného enginu a od toho, koľko tréningových údajov má pre konkrétny jazyk. Cyrilica, Devanagari, Thai a arabská skripta sú podporované modernými modelmi transkripcije, ale mnohé nástroje na generovanie titulkov obsahujú len hrsť z nich. Nástroje postavené s širokej viackľúčovej podporou od začiatku majú tendenciu zvládať skripty bez latinčiny výrazne lepšie ako tí, ktorí ich pridali ako pozmeňovateľný.
Prečo väčšina nástrojov na generovanie titulkov podporuje len 10 až 15 jazykov
Podpora jazykov vyžaduje tréningové údaje, testovanie a pokračujúcu údržbu. Väčšina spoločností sústreďuje svoje zdroje na jazyky, ktoré generujú najväčší príjem, čo znamená angličtinu, španielčinu, francúzštinu, nemčinu a pár ďalších. Jazyky hovorené menšou populáciou zriedka ospravedlňujú investíciu z čisto obchodného hľadiska, čo je dôvod, prečo sú úplne vylúčené z väčšiny produktov.
Je automatické generovanie titulkov dosť presné, aby sa preskakovali ručnú úprava
Pri dobre podporovaných jazykoch, ako je angličtina a španielčina, je moderná presnosť transkripcije obvykle nad 90%, čo znamená, že sú potrebné len menšie opravy. Pri menej bežných jazykoch sa presnosť medzi nástrojmi dramaticky líši. Kľúčový rozdiel je, či bol nástroj navrhnutý tak, aby od začiatku podporoval jazyk alebo ho pridal ako pozmeňovateľný s minimálnym testovaním.
Ako pridám titulky do videa v jazyku, ktorý väčšina nástrojov nepodporuje
Najčastejšou obchádzkou je výber súvisejúceho jazyka a manuálna oprava výstupu, čo je mimoriadne časovo náročné. Lepšou možnosťou je použitie nástroja, ktorý skutočne podporuje jazyk pôvodne. Generátor titulkov YEB pokrýva 98 jazykov a vytvárajú transkripcije, ktoré vyžadujú minimálnu opravu dokonca aj pre jazyky, ako je slovenčina, srbčina a thajčina, ktoré väčšina konkurentov ignoruje.
Aký je rozdiel medzi prekladom titulkov a generovaním titulkov
Generovanie titulkov znamená konverziu zvučného zvuku na text v rovnakom jazyku. Preklad titulkov znamená vziať existujúce titulky a previesť ich do iného jazyka. YEB Captions podporuje oboje. Video je možné prepísať v pôvodnom jazyku a potom preložiť do akéhokoľvek iného podporovaného jazyka pred vykreslením.