Shqipja nuk ekziston për shumicën e mjeteve të nënshkrimeve, kështu që ndërtova njërin që mbështet 98 gjuhë
Menyja e rënies është gjëja e parë që shihni kur ngarkon një video në ndonjë mjet nënshkrimi. Një listë e gjatë gjuhësh, renditur alfabetikisht, ndonjëherë me flamuj pranë tyre. Anglishtja është gjithmonë atje, zakonisht në krye. Spanjishte, Frëngjisht, Gjermanisht, Portugalisht. Të gjitha të pranishme dhe të llogarituara. Scrollo më tej dhe mund të gjesh Kinezisht, Japonisht, Koreapisht. Vazhdo të bësh scroll. Arabisht. Hindisht, ndonjëherë. Dhe më pas lista përfundon, ose gjuha që të duhet në të vërtetë nuk është atje. Shqipe. Jo në listë. Jo si opsion, jo si veçori beta, jo as si futje e pambështetur me etiketë paralajmëruese. Thjesht nuk ekziston në universin e produktit.
Ky nuk është një shqetësim i vogël. Kur gjuha mungon plotësisht, mjeti nuk është pjesërisht i dobishëm. Është kompletisht i padobishëm. Nuk ka punë përreth që të prodhoj rezultate të pranueshme. Audio shkon brenda, dhe ose mjeti e refuzon atë plotësisht ose përpiqet ta përpunojë atë si diçka tjetër. Rezultati është mbeturina, çdo herë të vetme.
Përvoja e të qenit një krijues përmbajtjeje gjuha parësore e të cilit bie jashtë brezit të ngushtë të "gjuhëve tregtare të interesante" është përshtatje konstante. Kjo do të thotë të mësosh të punosh rreth mjeteve sesa me to. Kjo do të thotë të pranosh se shumica e softuerit thjesht nuk u ndërtua me ty në mendje, dhe se karakteristikat e tregtuara si "globale" ose "shumëjezore" në të vërtetë nënkuptojnë "ne mbështesim dhjetë gjuhët që na bëjnë më shumë para."
Mënyra ruse dhe pse dështon
Kur shqipja nuk është në listë, rusishtja bëhet mënyra standarde e zgjidhjes. Dy gjuhët ndajnë alfabetin kirillik, dhe fjalë të caktuara kanë rrënjë të ngjashme. Në letër, duket si një përafrim i arsyeshëm. Në praktikë, është një katastrofë që krijon më shumë punë sesa të bëjë gjithçka me dorë nga e para.
Transkripzioni rus i aplikuar në audio shqip prodhon diçka që duket pothuajse e drejtë në shikim të parë. Karakteret kirillike shfaqen në ekran, fjalët kanë një formë vagabund sllave për ta, dhe ndoshta një në tre është në të vërtetë i saktë. Por "pothuajse e drejtë" në nënshkrime do të thotë plotësisht e gabuar. Një shikues që lexon nënshkrime që janë 60% të sakta nuk merr 60% të mesazhit. Ata marrin konfuzion, shpërqëndrim, dhe përshtypjen se krijuesi nuk kujdeset mjaftueshëm për të bërë një korrekturë të përmbajtjes së tyre.
Procesi i redaktimit që vijon është vendi ku koha reale humbet. Një video pesë minutash mund të prodhojë 180 deri 220 segmente nënshkrimi individual. Kur gjuha e transkriptimit është e gabuar, çdo një nga ato segmente duhet të hapet, të lexohet, krahasuar kundër audiodit aktual, dhe të shtypet me dorë. Jo i korrigjuar, por shtypet në tërësi, sepse transkripzioni rus shpesh ka kaq pak ngjashmëri me origjinalin shqip sa është më i shpejtë të fshish tekstin dhe të fillosh nga e para sesa të përpiqesh ta rregullosh atë karakter për karakter. Dy orë redaktimi manual për një video pesë minutash nuk është e pazakontë. Për dikënd që drejton kanale të shumta YouTube me orare të rregullt ngarkimi, ajo aritmetikë thjesht nuk përpunohet.
Ky problem i saktë shtrihet shumë jashtë shqipes. Krijesit hindu i duhet përballë asaj kur dialekti i tyre rajonal zbutet në një transkriptim gjuheje hindi gjenerik që humb gjysmën e fjalorit. Krijesit tailandez duhet të merret me gabime të interpretimit të tonit që kthejnë çdo fjali të dytë në marrëzi. Vietnameze, serbe, tagalog, suahili. Lista e gjuhëve që ose injorohen ose përafrimi i keq nga mjetet e nënshkrimeve kryesore është e gjatë, dhe krijesit që flasin ato gjuhë kanë qenë në heshtje thithje ngarkesa shtesë për vite.
Pse boshllëku i gjuhës ekziston në radhë të parë
Mjetet e nënshkrimeve janë biznese, dhe bizneset shpenzojnë burime zhvilluese përballë të ardhurave. Tregjet e folurit anglisht përfaqësojnë pjesën më të madhe të kostumeve paguan për pothuajse çdo produkt SaaS në hapësirën e krijimit të videos. Spanjishta dhe portugalishtja mbulojnë shumicën e Amerikës Latine. Frëngjisht shtohet pjesë të Evropës dhe Afrikës. Gjermanisht, Japonisht, Koreapisht. Secili hap hap një treg me fuqi të konsiderueshme blerës. Një produkt që mbështet këto dhjetë ose dymbëdhjetë gjuhë mund të pretendojë të shërbejë shumica të bazës së tij të potencialit të klientit, dhe nga këndvështrimi thjesht financiar, ajo pretendim është i mbrojtshëm.
Shtimi i një gjuhe të re në një sistem transkriptimi nuk është trivial. Kërkon të dhëna trajnimi, testim të cilësisë, mirëmbajtje të vazhdueshme, dhe dokumentacion mbështetje. Për një gjuhë e folur nga shtatë milion njerëz, si shqipja, llogaritja e kostos në kundër të ardhurave rrallë justifikon investimin kur të njëjtat orë inxhinerie mund të shkojnë drejt përmirësimit të saktësisë së transkriptimit anglisht nga 95% në 97%, e cila ndikon në miliona përdorues paguan.
Rezultati është një treg ku gjuhët 15 ose 20 më të mira marrin mbështetje të shkëlqyer, të ardhmen 30 marrin mbulim të pranueshem, dhe çdo gjë tjetër ose mungon ose është përpiluar kaq keq sa nuk duhet të renditet si veçori fare. Ky nuk është keqbëreje. Është rezultati i parashikueshëm i ndërtimit të produkteve që optimizojnë për audiencën më të madhe të mundshme sesa mbulimit më të gjerë të mundshëm. Por kuptimi i arsyes se përse ndodh nuk e bën atë më pak frustruese kur je ai që shikon një meny rënese që nuk përfshin gjuhën tënde.
Gjeneruesi i nënshkrimeve në YEB u ndërtua me një sërë parash të ndryshme. Në vend të fillimit me gjuhët më tregtare të vlefshme dhe të punojnë përpara, motori i transkriptimit u zgjodh në të vërtetë për gjerësinë e tij të mbështetjes së gjuhëve. Nëndëdhjetë e tetë gjuhë nga e para, jo si aspirata e rrugës hartë, por si kërkesë nisje. Shqipe, serbe, hindi, tailandeze, vietnameze, tagalog, dhe dhjetëra të tjerat që rrallë shfaqen në linjat e veçorisë konkurente janë të gjitha trajtuar në mënyrë vendase, me të njëjtën tubacion transkriptimi dhe të njëjtit standarte cilësie si shqipja ose spanjishta.
Ç'do të thotë mbështetja e duhur e gjuhës në praktikë
Mbështetja e një gjuhe nuk do të thotë thjesht pranimin e audiodit në atë gjuhë dhe kthimin e disa teksteve. Kjo do të thotë që motori i transkriptimit kupton strukturën fonetike, fjalorin e zakonshëm, ritmin dhe ritmin e të folurit natyral në atë gjuhë. Kjo do të thotë se kur një folës shqip incizoi një video, rezultati nuk duhet të rregullohet manualisht përtej herës paraprake emri ose termi teknik që çdo sistem transkriptimi mund të pengohet.
Në YEB Captions, ngarkimi i një videoje në gjuhën shqipe funksionon saktësisht si ngarkimi i një in Anglisht. Gjuha zgjidhet nga lista e plotë e 98 opsioneve, audio përpunohet, dhe transkriptimi vjen si segmente nënshkrimi të ndarë në mënyrë të duhur në shqip. Jo përafrim rus, jo shtypje manuale, jo dy sesione redaktimi të orëve për një video pesë minutash. Segmentet mund të redaktohen ende individualisht nëse të duhet, të tilla si një fjalë e keqkuptuar këtu ose një emër që ka nevojë për korrigjim atje, por saktësia bazë bën ato rregulluese të matura në minuta sesa në orë.
Përkthimi i nënshkrimeve zbatoj e njëjtën mënyrë. Përmbajtja e transkriptuar në origjinal në shqip mund të përkthehet në ndonjë nga gjuhët e tjera të mbështetuara para se të renderohet. Një video muzike me këngë shqipe mund të publikohet me nënshkrime anglisht, spanjol, ose japonisht pa kaluar nëpër një punë përkthimi të veçantë. Për krijesit që publikojnë përmbajtje të synuar drejt audienceve ndërkombëtare, kjo eliminon një nivel të tërë të punës manuale që më parë kërkonte ose punësim të një përkthyesi ose shpenzim të mbrëmjes me një fjalor dhe shumë durim.
Pika nuk është se YEB Captions është mjeti i vetëm në botë që mbështet shqipen. Një handful i mjeteve e ofrojnë atë në disa forma. Pika është se mbështetja e duhur, ku cilësia e transkriptimit është në të vërtetë e përdorshme pa korrigjim të gjerë manual, mbetet e rrallë për gjuhët jashtë mainstream, dhe hendeku midis "renditur si mbështetur" dhe "në të vërtetë funksionon mirë" shpesh është i madh.
Problemi më i gjerë i ndërtimit të mjeteve për të gjithë
Ka një supozim i ngjitur në shumicën e zhvillimit të softuerit që "të gjithë" do të thotë "të gjithë ata që flasin një gjuhë kryesore." Faqet e veçorisë thonë "globale" dhe "shumëjezore" ndërkohë që lista aktuale e gjuhës tregon një histori shumë më të ngushtë. Ky nuk është i kufizuar në mjete nënshkrimi. Shërbimët e përkthimit makinerie, asistentët zëri, sistemet OCR, dhe motorët e kërkimit të gjithë shfaqin të njëjtën skemë të mbështetjes të thellë për një numër të vogël gjuhësh dhe mbështetjeje sipërfaqesore ose të ekzistencës për pjesën tjetër.
Ç'e bën mjeteve nënshkrimi veçanërisht të dukshme është natyra e dështimit. Kur një asistent zëri keqkupton një komandë, përdoruesi mund ta përsërisë atë ose të shkruajë në vend. Kur mjeti nënshkrim prodhon tekst mbeturina, ai tekst përfundon i djegur në një video që merr botuar në qindra ose mijëra shikues. Gabimi është përjetesë, publik, dhe i lidhur drejtpërdrejt me reputacionin profesional të krijuesit. Të marrë atë gabim nuk është thjesht një shqetësim; është dështimi i cilësisë së dukshme që shikuesit vërejnë menjëherë.
Krijesit që flasin gjuhë të nënshërbejur kanë zhvilluar të gjitha llojet e punëve rreth viteve. Disa incizojnë videot e tyre në anglisht edhe kur audienca e tyre flet diçka tjetër. Disa anashkalon nënshkrime plotësisht dhe pranojnë numrat më të ulët të angazhimit. Disa përdorin gjuhën më të afërt të disponueshme dhe më pas kalojnë orë rregullimin e rezultatit, thithje kostin e punës që konkurentët e tyre të folur anglisht thjesht nuk kanë për të merret. Asnjë nga këto nuk janë zgjidhje reale. Ata janë kompromise të detyruara nga një treg që vendosi se gjuhë të caktuara nuk ishin të vlerës mbështetjeje të duhur.
Ndërtimi i captions.yeb.to me 98 gjuhë ishte pjesërisht përgjigje ndaj kësaj përfrustrimi specifik dhe pjesërisht njohje që segmenti i nënshërbyer i tregut është shumë më i madh se shoqërive të shumta duket të mendojnë. Shtatë milion folës shqip është një numër i vogël krahasuar me Anglisht ose Mandarin. Por bashkoni të gjitha gjuhët që bien në kategorinë "jo tregtarisht e interesante", përfshirë serbët, thaillendezët, vietnamezët, folësit tagalog, folësit e suahili, dhe jeni duke folur rreth qindra milionave njerëzish që kanë qenë keq të shërbyer nga mjete nënshkrim për vite. Ky nuk është një niş. Kjo është treg që thjesht nuk është adresuar, dhe peizazhit i aplikacioneve caption është ngadalë duke filluar të pasqyrojë atë realitet.
Shpesh pyetje
Cilat gjenerues nënshkrimi mbështesin shqipen
Shumë pak mjete nënshkrim përfshijnë shqipen si gjuhë mbështetur, dhe edhe më pak prodhojnë cilësi transkriptimi të përdorshme. YEB Captions mbështet shqipen si një nga 98 gjuhë me transkriptim të vendas, që do të thotë se rezultati nuk kërkon punën ruse të gjuhës që shumica e mjeteve të tjera e detyrojnë folësit shqip të përdorin.
A mund të transkriptim aI nënshkrim të trajnojë skenarë jo-latine me saktësi
Saktësia varet plotësisht nga motori i transkriptimit dhe sa të dhëna trajnimi ka për gjuhën specifike. Kirillik, Devanagari, Thai, dhe skriptet arabe të gjitha mbështeten nga modelet e transkriptimit bashkëkohore, por shumë mjete nënshkrim përfshijnë vetëm një handful të këtyre. Mjetet e ndërtua me mbështetje shumëjezore të gjerë nga e para priren të trajtojnë skenarje jo-latine në mënyrë ndjeshëm më mirë sesa ato që i shtuan ato si kujdeskëmbe të mënehimeve.
Pse shumica e mjeteve nënshkrim mbështesin vetëm 10 deri 15 gjuhë
Mbështetja e gjuhës kërkon të dhëna trajnimi, testim, dhe mirëmbajtje të vazhdueshme. Shumica e shoqërive përqendrojnë burimet e tyre në gjuhët që gjenerojnë më shumë të ardhura, e cila do të thotë anglisht, spanjisht, frëngjisht, gjermanisht, dhe disa të tjerat. Gjuhët e foluara nga popullata më të vogla rrallë justifikojnë investimin nga perspektiva e purë biznesi, e cila është arsyeja pse ato marrin përjashtime nga shumica e produkteve plotësisht.
A është gjenerimja automatike nënshkrim e saktë mjaftueshëm për të kaluar redaktimin manual
Për gjuhë të mbështetur mirë si anglisht dhe spanjisht, saktësia e transkriptimit bashkëkohore është zakonisht mbi 90%, e cila do të thotë se vetëm korrigjime të vogla janë të nevojshme. Për gjuhë më të pabanuara, saktësia ndryshon në mënyrë dramatike midis mjeteve. Diferenca kyçe është nëse mjeti u projektua të mbështesë gjuhën nga e para ose e shtoi atë si një kujdeskëmbe me testim minimal.
Si i shtoj nënshkrime të një videoje në një gjuhë që shumica e mjeteve nuk mbështesin
Punë më e zakonshme është zgjdhja e një gjuhe të lidhur dhe korrigjimin manual të rezultatit, e cila është jashtëzakonisht kërkore. Opsioni më mirë është përdorimi i një mjeti që në të vërtetë mbështet gjuhën në mënyrë vendase. Gjeneruesi i nënshkrimeve të YEB mbulon 98 gjuhë dhe prodhon transkriptim që kërkon korrigjim minimal edhe për gjuhë si shqipja, serbe, dhe tailandeze që shumica e konkurentëve injorojnë.
Cili është ndryshim midis përkthimit të nënshkrimeve dhe gjenerimit të nënshkrimeve
Gjenerimja e nënshkrimeve do të thotë shndërrimin e audiodit të folur në tekst në të njëjtën gjuhë. Përkthim i nënshkrimeve do të thotë marrjen e nënshkrimeve ekzistuese dhe shndërrimin e tyre në një gjuhë tjetër. YEB Captions mbështet të dyja. Një video mund të transkriptohet në gjuhën e tij origjinale dhe më pas përkthehet në ndonjë nga gjuhët e tjera të mbështetuara para se të renderohet.