A bulgár nyelv nem létezik a legtöbb feliratkezelő eszköznél, ezért építettem egyet, amely 98 nyelvet támogat
A legördülő menü az első dolog, amit meglátunk, amikor videót töltünk fel egy feliratkezelő alkalmazásba. Hosszú nyelvlista, ábécé sorrendben, néha zászlók mellett. Az angol mindig ott van, általában felül. A spanyol, a francia, a német, a portugál. Mindegyik ott van. Görgetünk tovább, és megtalálhatjuk a kínait, a japánt, a koreait. Folytassunk a görgetéssel. Az arab. A hindi, néha. És aztán a lista vége, vagy a nyelvét, amelyre szükségünk van, egyszerűen nincs ott. Bulgár. Nem felsorolt. Nem lehetőségként, nem bétafunkcióként, még csak nem is támogatatlan jelzésű bejegyzésként. Egyszerűen nem létezik a termék univerzumában.
Ez nem csekély kellemetlenség. Ha a nyelv teljesen hiányzik, az eszköz nem részlegesen hasznos. Teljesen haszontalan. Nincs olyan megoldás, amely elfogadható eredményt produce. A hang bemegy, és vagy az eszköz teljesen elutasítja, vagy megpróbálja valami másként feldolgozni. Az eredmény szemét, minden esetben.
Az a tapasztalat, hogy olyan tartalomelőállító vagy, akinek az elsődleges nyelve kívül esik a "kereskedelmileg érdekes" nyelvek szűk körén, az állandó adaptáció. Ez azt jelenti, hogy tanulnod kell az eszközökön dolgozni, ahelyett hogy velük dolgoznál. Ez azt jelenti, hogy el kell fogadnod, hogy a legtöbb szoftvert egyszerűen nem úgy építették, hogy Te lennél szem előtt tartva, és a "globális" vagy "többnyelvű" funkcióként kínált funkciók valóban azt jelentik, hogy "támogatjuk azt a tíz nyelvet, amely a legtöbb pénzt csinálja számunkra."
Az orosz megkerülés és miért nem működik
Ha a bulgár nincs listán, az orosz lesz az alapértelmezett megkerülés. A két nyelv azonos Cirill ábécét használ, és bizonyos szavak hasonló gyökerekkel rendelkeznek. Elméletileg ésszerű közelítésnek tűnik. A gyakorlatban katasztrófa, amely több munkát jelent, mint az összes kézi megoldása az alapról.
Az orosz átírás bulgár audióra alkalmazva olyan valamit hoz létre, amely első pillantásra szinte helyesnek tűnik. A Cirill karakterek megjelennek a képernyőn, a szavak olyan kicsit szláv alakúak, és talán minden harmadik valóban helyes. De a feliratozásban az "szinte jó" azt jelenti, hogy teljesen rossz. Az olyan olvasó, aki olyan feliratokat olvas, amelyek 60% pontosak, nem kapja meg az üzenet 60% -át. Zavart, zavarozottságot és azt a benyomást kapnak, hogy az alkotó nem fordított elég gondot a saját tartalma felülvizsgálatára.
A szerkesztési folyamat, amely ezt követi, ahol az igazi idő elveszik. Egy öt perces videó lehet 180 és 220 egyedi feliratrészlet között. Ha az átírási nyelv helytelen, ezeknek a szegmenseknek az összes szükséges megnyitása, olvasása, az aktualáudio összehasonlítása és manuális újraírása. Nem korrigálva, hanem teljesen újraírva, mivel az orosz átírás gyakran olyan kevésbé hasonlít a bulgár eredetire, hogy gyorsabb a szöveget törölni és az elejétől kezdeni, mintsem megpróbálni karakterenként rögzíteni. A kéz szerkesztés két óra egy öt perces videóhoz nem szokatlan. Valaki számára, aki több YouTube csatornát működtet rendszeres feltöltési ütemezéssel, az aritmetika egyszerűen nem működik.
Ez a pontos probléma jóval túlmutat a bulgáron. Hindi-szóló alkotók szembesülnek vele, amikor regionális dialektusuk egy általános hindi átírásba kerül, amely a szókincs felét meghagyja. Thai alkotók a tónusinterpretációs hibákkal foglalkoznak, amelyek minden másodlagos mondatot értelmességgé fordítanak. Vietnami, szerb, tagalog, szuahéli. Az azon nyelvek listája, amelyeket vagy a mainsteam feliratkezelő eszközök ignorálnak vagy rosszul közelítik meg, hosszú, és az azok nyelvén beszélő alkotók az extra munkaterhelést csendes abszorpcióban voltak évek óta.
Miért létezik a nyelvkülönbség az első helyen
A feliratkezelő eszközök vállalkozások, és a vállalkozások a fejlesztési erőforrásokat oda allokálják, ahol a bevétel van. Az angol nyelvű piacok a videólétrehozási tér szinte minden SaaS termékének a fizetős ügyfeleinek legnagyobb hányadát képviselik. A spanyol és a portugál a Latin-Amerika legnagyobb részét fedi le. A francia részei Európának és Afrikának. Német, japán, koreai. Mindegyik egy piacot nyit meg, amelynek jelentős vásárlóereje van. Egy olyan termék, amely ezt a tíz vagy tizenkét nyelvet támogatja, azt állíthatja, hogy az lehetséges ügyfeleinek többségét szolgálja, és tisztán pénzügyi szemszögből az állítás védhető.
Egy új nyelv hozzáadása egy átírási rendszerhez nem triviális. Szükséges a képzési adatok, a minőségvizsgálat, az folyamatos karbantartás és a támogatási dokumentáció. Egy hét millió ember által beszélt nyelvhez, mint a bulgár, a költség-bevétel számítás ritkán igazolja az invesztációt, amikor ugyanez a mérnöki órák az angol átírás pontosságának 95% -ról 97% -ra javítására fordulhatnak, amely milliók fizetős felhasználóit érinti.
Az eredmény egy olyan piac, ahol a felső tizenöt vagy húsz nyelv kiváló támogatást kap, a következő harminc átlható lefedettséget, és minden más vagy hiányzik, vagy olyan rosszul vannak megvalósítva, hogy nem kellene funkcióként felsorolni. Ez nem rosszindulatú. Ez a végzetes kimenetele annak, hogy olyan termékeket építesz meg, amelyek a lehető legnagyobb közönségre optimalizálnak, ahelyett hogy a lehető legszélesebb lefedettségre. De megérteni, hogy miért történik, nem teszi kevésbé idegesítővé, amikor Te azt nézel egy legördülő menübe, amely nem tartalmazza a Te nyelvét.
A feliratkezelő a YEB-en más prioritások mellett egyéb prioritások miatt lett felépítve. Ahelyett, hogy a legkereskedelmileg értékes nyelvekkel indulnál és kifelé dolgoznál, az átírási motor kifejezetten szélességü nyelvtámogatásához lett kiválasztva. Kilencvennyolc nyelvt az indulástól, nem mint ütemtervek aspiráció, hanem mint indítási követelmény. Bulgár, szerb, hindi, thai, vietnami, tagalog és tucat, amely ritkán jelenik meg a versenyző funkciólistáján, mindegyik natívan kezelve van, ugyanazzal az átírási folyamattal és ugyanazokkal a minőségi normákkal, mint az angol vagy a spanyol.
Mit jelent a megfelelő nyelvtámogatás a gyakorlatban
A nyelv támogatása nem csak azt jelenti, hogy elfogadsz audiót ebben a nyelvben, és valamilyen szöveget visszaküldesz. Ez azt jelenti, hogy az átírási motor megérti a fonetikus szerkezetet, a közös szókincsét, a naturális beszéd ritmusát és tempóját ebben a nyelvben. Ez azt jelenti, hogy amikor egy bulgár beszélő videót rögzít, a kimenet nem szükséges kézzel korrigálni az alkalmi megfelelő nevet vagy műszaki kifejezést túl van, amit minden átírási rendszer megbotlana.
A YEB Captions, egy bulgár nyelvű videó feltöltése pontosan ugyanúgy működik, mint egy angol. A nyelvét a 98 lehetőség teljes listájából választják ki, a hang feldolgozódik, és az átírás jól időzített feliratrészletként jelenik meg bulgárul. Nincs orosz közelítés, nincs kézzel történő újraírás, nincs két órás szerkesztési munkamenet egy öt perces videóhoz. A szegmenseket az igények szerint továbbra is lehet szerkeszteni, például egy félrehallott szó vagy egy név, amely korrigálásra szorul, de az alapvonal pontossága a szerkesztéseket percekre redukálja, nem órára.
Ugyanez vonatkozik a felirat fordításra. Az eredeti bulgár nyelvben átírható tartalom a többi támogatott nyelvbe fordítható a megjelenítés előtt. Egy zenei videó bulgár dalszövegekkel angol, spanyol vagy japán felirattal járható külön fordítási munkafolyamat nélkül. Az olyan alkotók számára, akik nemzetközi közönségre szánt tartalmat közzé tesznek, ez kiküszöböli az egy egész manuális munkarétegét, amely korábban vagy fordítót bérlet, vagy egy estét szótárral és sok türelemmel töltött.
A lényeg nem az, hogy a YEB Captions az egyetlen eszköz a világon, amely támogatja a bulgárt. Néhány eszköz bizonyos formában felajánlja. A lényeg az, hogy a megfelelő támogatás, ahol az átírási minőség valóban hasznosítható széles körű kézzel történő korrigálás nélkül, ritkán marad fenn az olyan nyelvek számára, amelyek kívül esnek a fő áramvonalban, és az "támogatottként felsorolt" és az "valóban jól működik" között eltérés gyakran hatalmas.
Az eszközök építésének szélesebb problémája mindenkinek
Van egy feltevés beépítve a legtöbb szoftverfejlesztésbe, hogy az "mindenki" azt jelenti, hogy "mindenki, aki fő nyelvet beszél". A funkcióoldalak "globális" és "többnyelvű", míg a valódi nyelvlista sokkal szűkebben beszél. Ez nem korlátozódik a feliratkezelő eszközökre. A gépi fordítási szolgáltatások, a hangsegédek, az OCR rendszerek és a keresőmotorok mindegyike ugyanazt a mintázatot mutatja az egy kis számú nyelvtől szét támogatása és a sekély vagy nem létező támogatása a többi számára.
Az, ami a feliratkezelő eszközöket különösen észrevehetővé teszi, a kudarc természete. Ha egy hangasszisztens félreérti a parancsot, a felhasználó megismételheti vagy helyette írhat. Ha egy feliratkezelő eszköz szemét szöveget termel, az a szöveg egy olyan videóba kerül beleégett, amely száz vagy ezer nézőhöz kerül. A hiba állandó, nyilvános, és közvetlenül az alkotó professzionális reputációjához kötött. A rossz elírása nem csak kellemetlenség; ez egy látható minőségi kudarc, amelyet a nézők azonnal észrevesznek.
Az olyan nyelveken beszélő alkotók, amelyek alul szolgáltak, az évek során mindenféle megoldást dolgoztak ki. Néhányan az angol nyelvben rögzítik videóikat, még akkor is, ha a közönségük valami mást beszél. Néhányan teljesen kihagyják a feliratokat, és elfogadják az alacsonyabb elköteleződési számokat. Néhányan a legközelebb elérhető nyelvet használják, majd az órák Fix produktumot szerkesztik, abszorbeálva a munkaerőköltséget, amit az angol beszélő versenytársainak egyszerűen nem kell kezelniük. Egyikük sem valódi megoldások. Ezek olyan kompromisszumok, amelyeket egy piac kényszerített rá, amely úgy döntött, hogy bizonyos nyelvek nem érdemelnek megfelelő támogatást.
A captions.yeb.to felépítése 98 nyelvvel részben ez a specifikus idegesítés reagálása, és részben az a felismerés, hogy az alul szolgáló piaci szegmens sokkal nagyobb, mint a legtöbb vállalat úgy véli. A hét millió bulgár beszélő kis szám az angolhoz vagy a mandarinhoz képest. De add össze az összes olyan nyelvet, amely az "nem kereskedelmileg érdekes" kategóriába esik, beleértve a szerbeket, a thaiakat, a vietnamiakat, a tagalog beszélőket, a szuahéli beszélőket, és beszélsz a több száz millió emberről, akiket a feliratkezelő eszközök az évek során rosszul szolgáltak. Ez nem niša. Ez egy olyan piac, amely egyszerűen nem lett megcímezve, és a felirat alkalmazások tájképe lassan kezd ezt a valóságot tükrözni.
Gyakran Ismételt Kérdések
Mely feliratkezelők támogatják a bulgárt
Nagyon kevés feliratkezelő olyan eszköz tartalmazza a bulgárt, mint a támogatott nyelvet, és még kevesebben termelik az használható átírási minőséget. A YEB Captions támogatja a bulgárt, mint a 98 nyelvből egyet az eredeti átírással, ami azt jelenti, hogy a kimenet nem igényli az orosz-nyelvű megkerülést, amelyet a legtöbb más eszköz kényszerít a bulgár beszélőkre.
A mesterséges intelligencia feliratkezelő képes-e a nem latin forgatókönyveket pontosan kezelni
A pontosság teljesen az átírási motortól és arról függ, hogy mennyi képzési adatot tartalmaz az adott nyelvhez. A Cirill, Devanagari, Thai és arab forgatókönyvek mindegyike a modern átírási modellek által támogatott, de sok feliratkezelő csak ezek közül néhányat tartalmaz. A széles többnyelvű támogatás kezdeteitől fogva felépített eszközök általában sokkal jobban kezelik a nem latin forgatókönyveket, mint azok, amelyek utólag léptek hozzájuk.
Miért támogatja a legtöbb feliratkezelő csak 10-15 nyelvet
A nyelvtámogatás képzési adatokat, tesztelést és folyamatos karbantartást igényel. A legtöbb vállalat az olyan nyelvekre összpontosít erőforrásait, amelyek a legtöbb bevételt termelik, ami azt jelenti, hogy angol, spanyol, francia, német és még néhány. Az olyan nyelvek, amelyeket kisebb populációk beszélnek, ritkán igazolják az invesztációt egy tiszta üzleti perspektívából, ezért maradnak el a legtöbb termék egészéből.
Az automatikus felirat generálása elég pontos-e ahhoz, hogy kihagyjuk a kézzel történő szerkesztést
Az olyan jól támogatott nyelvekhez, mint az angol és a spanyol, a modern átírási pontosság jellemzően 90% felett van, ami azt jelenti, hogy csak apró korrekciók szükségesek. Az olyan kevésbé gyakori nyelvekhez a pontosság drámaian eltérő az eszközök között. A fő eltérés az, hogy az eszközt az elején a nyelv támogatásához tervezték, vagy utólag azt adták hozzá, minimális teszteléssel.
Hogyan adok hozzá feliratokat egy olyan videóhoz, amelyet a legtöbb eszköz nem támogat
A leggyakoribb megkerülés egy kapcsolódó nyelvét választani és manuálisan korrigálni a kimenetét, amely rendkívül időigényes. A jobb megoldás olyan eszköz használata, amely valóban natívan támogatja a nyelvet. A YEB feliratkezelője 98 nyelvet fed le és olyan átírásokat termel, amelyek minimális korrigálást igényelnek olyan nyelvekhez is, mint a bulgár, szerb és thai, amelyeket a legtöbb versenyző figyelmen kívül hagy.
Mi a különbség a felirat fordítása és a felirat generálása között
A felirat generálása azt jelenti, hogy a beszélgetett audiót szöveggé konvertálják ugyanabban a nyelvben. A felirat fordítása azt jelenti, hogy a meglévő feliratokat egy másik nyelvbe konvertálják. A YEB Captions mindkettőt támogatja. Egy videó átírható az eredeti nyelvén, majd fordítható a többi támogatott nyelvre a megjelenítés előtt.