ほとんどの字幕ツールでブルガリア語がサポートされていないため、98言語に対応したものを作ってみた
動画を字幕ツールにアップロードするとき、最初に目にするのはドロップダウンメニューです。言語の長いリストがアルファベット順にソートされ、時には旗のアイコンが並んでいます。英語はいつもそこにあり、通常はトップです。スペイン語、フランス語、ドイツ語、ポルトガル語。すべてが揃っています。さらにスクロールすると、中国語、日本語、韓国語が見つかるかもしれません。スクロールを続けます。アラビア語。ヒンディー語、ときどき。そしてリストが終わるか、実際に必要な言語が単にそこにありません。ブルガリア語。リストされていません。選択肢としてもなく、ベータ機能としてもなく、警告ラベル付きのサポートされていないエントリとしてさえもありません。それは製品の宇宙に単に存在しません。
これは軽微な不便ではありません。言語が完全に欠落していると、ツールは部分的に役に立つわけではありません。それは完全に役に立たなくなります。許容できる結果をもたらす回避策はありません。音声がいくり、ツールがそれを完全に拒否するか、他の言語として処理しようとします。出力はゴミ、毎回です。
主な言語が「商業的に興味深い」言語の狭い帯の外にある言語を話すコンテンツクリエーターの経験は、絶え間ない適応の一つです。ツールを使って作業するのではなく、ツールを回避して作業することを学ぶことを意味します。ほとんどのソフトウェアは単にあなたのことを念頭に置いて構築されていなかったこと、そして「グローバル」または「多言語」として販売されている機能は実際には「私たちは最もお金を稼いでいる10の言語をサポートしています」という意味であることを受け入れることを意味します。
ロシア語の回避策と失敗する理由
ブルガリア語がリストにないとき、ロシア語がデフォルトの回避策になります。2つの言語はキリル文字を共有し、特定の単語は類似したルーツを持っています。紙の上では、それは合理的な近似のように見えます。実際には、最初からすべてを手で行うよりも多くの作業を生成する災害です。
ブルガリア語の音声に適用されたロシア語の転写は、一目でほぼ正しく見えるものを生成します。キリル文字が画面に表示され、単語はかすかなスラヴ形をしており、おそらく3つに1つは実際に正しいです。しかし、字幕の「ほぼ正しい」は完全に間違っていることを意味します。60%正確な字幕を読んでいる視聴者は、メッセージの60%を得ません。彼らは混乱、気が散ることを得て、作成者は自分のコンテンツをチェックするほど気にかけていなかったという印象を得ます。
その後の編集プロセスが、実際の時間が失われるところです。5分間の動画は180〜220個の個別の字幕セグメントを生成する可能性があります。転写言語が間違っていると、それらのセグメントのすべてが開かれ、読まれ、実際の音声と比較され、完全に手入力される必要があります。修正ではなく、完全に手入力されます。ロシア語の転写がブルガリア語のオリジナルとほとんど類似性がないため、テキストを削除して最初から始める方が、文字ごとにそれを修正しようとするよりも速いです。5分間のビデオの場合、2時間の手動編集は珍しくありません。複数のYouTubeチャネルを定期的なアップロードスケジュールで実行している人にとって、その算術は単に成り立ちません。
この正確な問題はブルガリア語をはるかに超えて拡張しています。ヒンディー語のクリエーターは、彼らの地域方言が語彙の半分を逃す一般的なヒンディー語転写に平坦化されたときにそれに直面します。タイのクリエーターは、すべての他の文を無意味に変える音調解釈エラーに対処します。ベトナム語、セルビア語、タガログ語、スワヒリ語。主流の字幕ツールによって無視されるか、不十分に近似される言語のリストは長く、それらの言語を話すクリエーターは何年も静かに追加の作業負荷を吸収しています。
言語ギャップが最初の場所に存在する理由
字幕ツールはビジネスであり、ビジネスは収益がある場所に開発リソースを配分します。英語を話す市場は、ビデオ作成スペースのほぼすべてのSaaSproductにとって最大の顧客シェアを表します。スペイン語とポルトガル語はラテンアメリカのほとんどをカバーしています。フランス語はヨーロッパとアフリカの一部を追加します。ドイツ語、日本語、韓国語。それぞれが重要な購買力を持つ市場を開きます。10〜12の言語をサポートする製品は、潜在的な顧客ベースの大部分に役立つと主張することができ、純粋に財政的な観点からは、その主張は防衛可能です。
転写システムに新しい言語を追加することは簡単ではありません。トレーニングデータ、品質テスト、継続的なメンテナンス、サポートドキュメントが必要です。ブルガリア語のように700万人が話している言語の場合、コスト対収益の計算は、同じエンジニアリング時間が英語の転写精度を95%から97%に改善するために使用できる場合、投資を正当化することはめったにありません。これは数百万のユーザーに影響します。
結果は、トップ15〜20の言語が優れたサポートを受け、次の30が合格可能なカバレッジを取得し、他はすべてが欠落しているか、機能として非常に悪く実装されているため、リストするべきではない市場です。これは悪意ではありません。最大のオーディエンスを最適化するのではなく、最も広いカバレッジを最適化するのではなく、製品を構築する予測可能な結果です。しかし、それが起こる理由を理解することは、言語を含まないドロップダウンメニューを見つめているときの厄介さを少なくしません。
YEBの字幕生成は、異なる優先事項のセットで構築されました。最も商業的に価値のある言語から始めて外に向かう代わりに、転写エンジンは、その言語サポートの幅広さのために特に選択されました。ロードマップの願望としてではなく、起動要件として、最初から98言語です。ブルガリア語、セルビア語、ヒンディー語、タイ語、ベトナム語、タガログ語、および競合他社の機能リストにはめったに表示されない多くの他の言語は、すべて本来のものです。英語またはスペイン語と同じ転写パイプラインと同じ品質基準を持っています。
実践において適切な言語サポートが実際に意味すること
言語をサポートすることは、その言語で音声を受け入れ、テキストを返すことを意味するだけではありません。転写エンジンは、音韻構造、一般的な語彙、その言語での自然な音声のケイデンスとリズムを理解することを意味します。ブルガリア語話者がビデオを録音するとき、出力は多くの転写システムが躓く可能性のある固有名詞または技術用語を超えて手動で修正する必要がないことを意味します。
YEB字幕では、ブルガリア語のビデオをアップロードすることは、英語のビデオをアップロードするのと完全に同じです。言語は98個のオプションの完全なリストから選択され、音声が処理され、転写は適切にタイミングされた字幕セグメントでブルガリア語で返されます。ロシア語の近似はなく、手動で再入力はなく、5分間のビデオの場合、2時間の編集セッションはありません。セグメントは、聞き誤った単語や修正が必要な名前など、必要に応じて個別に編集できますが、ベースラインの精度により、これらの編集は時間ではなく分で測定されます。
同じことが字幕翻訳に適用されます。ブルガリア語で転写されたオリジナルコンテンツは、レンダリング前に他のサポートされている言語のいずれかに翻訳できます。ブルガリア語の歌詞を持つ音楽ビデオは、別の翻訳ワークフローを経ることなく、英語、スペイン語、または日本語の字幕で公開できます。国際的なオーディエンスを目的としたコンテンツを公開するクリエーターにとって、これは、翻訳者を雇うか、辞書の夜を多く費やす必要があった手動作業の層全体を排除します。
要点は、YEB字幕が世界中でブルガリア語をサポートしている唯一のツールではないということです。少数のツールがそれを何らかの形でサポートしています。ポイントは、転写品質が手動修正を広範にすることなく実際に使用できる適切なサポートが、主流の外の言語の場合は稀であり、「サポートされているとしてリストされている」と「実際に機能している」との間のギャップはしばしば大きいということです。
すべての人のためにツールを構築するより広い問題
ほとんどのソフトウェア開発に焼き込まれた仮定は、「すべての人」は「主な言語を話すすべての人」を意味するということです。機能ページには「グローバル」と「多言語」が言われているのに対し、実際の言語リストはより狭いストーリーを伝えています。これは字幕ツールに限定されていません。機械翻訳サービス、音声アシスタント、OCRシステム、検索エンジンはすべて、少数の言語の深いサポートと他の言語の浅いまたは存在しないサポートの同じパターンを示します。
字幕ツールを特に目立たせるのは、失敗の性質です。音声アシスタントがコマンドを誤解すると、ユーザーはそれを繰り返すか、代わりに入力できます。字幕ツールがゴミテキストを生成すると、そのテキストは数百または数千のビューアに公開される動画に焼き込まれます。エラーは永続的で、公開で、作成者の専門的な評判に直接結びついています。間違うことは単なる不便ではありません。それは視聴者がすぐに気付く見える品質の失敗です。
言語を話さないクリエーターは、何年も前のあらゆる種類の回避策を開発しました。彼らのオーディエンスが他の何かを話していても、英語で彼らのビデオを記録する人もいます。完全に字幕をスキップして、より低いエンゲージメント数を受け入れる人もいます。利用可能な最も近い言語を使用してから、出力を修正するために数時間を費やしている人もいます。彼らの英語を話す競合相手が対処する必要がない労働費用を吸収しています。これらはいずれも本当の解決策ではありません。それらは、特定の言語が適切にサポートするのに十分な価値がないと決定した市場によって強要された妥協です。
captions.yeb.toを98言語で構築することは、この特定の欲求への応答の一部であり、言語を話さないセグメントの市場が、ほとんどの企業が考えているよりもはるかに大きいという認識の一部でした。700万人のブルガリア語話者は、英語またはマンダリンと比較して小さな数字です。しかし、セルビア語、タイ語、ベトナム語、タガログ語、スワヒリ語話者を含む「商業的に興味深くない」カテゴリーに含まれるすべての言語を合計すると、何百万人の人々が何年も字幕ツールにより不十分にサポートされているとあなたが話す。これはニッチではありません。これは単にアドレス指定されていない市場であり、キャプションアプリの景観は徐々にその現実を反映し始めています。
よくある質問
どの字幕生成がブルガリア語をサポートしていますか
ブルガリア語をサポートする字幕ツールはほとんどなく、さらに使用可能な転写品質を生成するのはさらに少ないです。YEB字幕は、ブルガリア語を98言語の1つとして本来のサポートしており、出力が、ほとんどの他のツールがブルガリア語話者に強制するロシア語の回避策を必要としないことを意味します。
AI字幕生成は非ラテンスクリプトを正確に処理できますか
精度は完全に転写エンジンと、その特定の言語のトレーニングデータがいくらあるかに依存します。キリル文字、デーバナガリ、タイ語、アラビア語のスクリプトはすべて現代的な転写モデルでサポートされていますが、多くの字幕ツールはこれらのほんの一握りのみを含みます。最初から幅広い多言語サポートで構築されたツールは、それらをアフターソートとして追加したツールよりも非ラテンスクリプトを大幅に処理する傾向があります。
ほとんどの字幕ツールは10〜15言語のみをサポートするのはなぜですか
言語サポートにはトレーニングデータ、テスト、継続的なメンテナンスが必要です。ほとんどの企業は、最も多くの収益を生成する言語のリソースに焦点を当てています。これは英語、スペイン語、フランス語、ドイツ語、その他いくつかです。より小さな母集団が話している言語は、純粋なビジネスの観点から投資を正当化することはめったにありません。そのため、ほとんどの製品から完全に除外されます。
自動字幕生成は手動編集をスキップするのに十分に正確ですか
英語とスペイン語のようにサポートされているのに十分サポートされている言語の場合、最新の転写精度は通常90%以上で、わずかな修正のみが必要です。言語が少ない場合、精度はツール間で大きく異なります。重要な違いは、ツールが最初から言語をサポートするためにデザインされたか、最小限のテストで後付けとして追加されたかです。
ほとんどのツールがサポートしていない言語でビデオに字幕を追加するにはどうすればよいですか
最も一般的な回避策は、関連言語を選択して出力を手動で修正することです。これは非常に時間がかかります。より良いオプションは、実際に本来の言語をサポートするツールを使用しています。YEBの字幕生成は98言語をカバーしており、ブルガリア語、セルビア語、タイ語のような言語でも転写を生成し、ほとんどの競合相手が無視しているため、わずかな修正が必要です。
字幕翻訳と字幕生成の違いは何ですか
字幕生成は、スポークン音声をテキストに同じ言語で変換することを意味します。字幕翻訳は、既存の字幕を取得して別の言語に変換することを意味します。YEB字幕は両方をサポートしています。ビデオを元の言語で転写し、翻訳できます。レンダリング前にサポートされている他の言語のいずれかに。