תפריט הנפתח הוא הדבר הראשון שאתה רואה כשמעלה סרטון לכל כלי כתוביות. רשימה ארוכה של שפות, ממוינת בסדר אלפביתי, לפעמים עם דגלים לצידן. אנגלית תמיד שם, בדרך כלל בחלק העליון. ספרדית, צרפתית, גרמנית, פורטוגזית. כולן קיימות וזה בסדר. גלול הלאה ואתה עלול למצוא סינית, יפנית, קוריאנית. המשך לגלול. ערבית. הינדית, לפעמים. ואז הרשימה מסתיימת, או שהשפה שאתה בעצם צריך פשוט לא קיימת שם. עברית. לא ברשימה. לא כאפשרות, לא כתכונת בטא, אפילו לא כפריט לא נתמך עם תווית אזהרה. זה פשוט לא קיים בעולם המוצר.
זה לא אי-נוחות קטנה. כשהשפה חסרה לחלוטין, הכלי אינו שימושי בחלקו. הוא מחוסר תועלת לחלוטין. אין דרך עקיפה שמייצרת תוצאות קבילות. האודיו נכנס, וגם הכלי דוחה אותו לחלוטין או הוא מנסה לעבד אותו כמשהו אחר. הפלט זבל, כל פעם.
החוויה של יוצר תוכן שהשפה הראשונה שלו נופלת מחוץ לטווח הצר של "שפות בעלות עניין מסחרי" היא אחת של התאמה קבועה. זה אומר ללמוד לעבוד סביב כלים במקום איתם. זה אומר לקבל שרוב התוכנה פשוט לא בנויה עם אתה בראש, וש-תכונות המתוכננות כ"גלובליות" או "רב-לשוניות" בעצם אומר "אנחנו תומכים בעשר השפות שמרוויחות לנו הרבה ביותר."
עקיפת הרוסית ולמה היא נכשלת
כשעברית לא ברשימה, רוסית הופכת לעקיפה ברירת המחדל. שתי השפות משתפות את האלפבית הקירילי, ולמילים מסוימות יש שורשים דומים. בנייר, זה נראה כמו קירוב סביר. בפרקטיקה, זה אסון שיוצר יותר עבודה מאשר לעשות הכל ביד מההתחלה.
תעתוק רוסי שהוחל על אודיו עברי מייצר משהו שנראה כמעט נכון בהשקפה ראשונה. התווים הקירילים מופיעים על המסך, למילים יש צורה ברית-סלוויק מעט, ואולי אחד משלוש הוא בעצם נכון. אבל "כמעט נכון" בכתוביות אומר לחלוטין לא נכון. צופה שקורא כתוביות שהן 60% מדויקות לא מקבל 60% מההודעה. הם מקבלים בלבול, הפחדה, וההתרשמות שיוצר התוכן לא טרחו מספיק לבדוק את התוכן שלהם.
תהליך העריכה שבא לאחר מכן הוא שם הזמן האמיתי הולך לאיבוד. סרטון של חמש דקות עלול לייצר 180 עד 220 קטעי כתוביות בודדים. כשהשפה של התעתוק לא נכונה, כל קטע יחיד של אלה צריך להיות פתוח, נקרא, השוואה כנגד האודיו בפועל, וכתוב ידנית מחדש. לא תוקן, אלא כתוב מחדש לחלוטין, כי התעתוק הרוסי לעתים קרובות נושא כל כך מעט דמיון למקור העברי שהוא מהיר יותר למחוק את הטקסט ולהתחיל מחדש מאשר לנסות לתקן אותו אות אחרי אות. שעתיים של עריכה ידנית לסרטון של חמש דקות אינו נדיר. למישהו שמנהל מספר ערוצי YouTube עם לוחות זמנים עלייה קבועים, החשבון הזה פשוט לא מחזיק.
הבעיה המדויקת הזו משתרעת הרבה מעבר לעברית. יוצרי תוכן בהינדית מתמודדים איתה כשהניב האזורי שלהם מושטח לתרגום גנרי של הינדית שמחמיץ חצי מהאוצר. יוצרי תוכן תאילנדים מתמודדים עם שגיאות פרשנות טוניות שהופכות כל משפט שני לשטויות. וייטנמית, סרבית, תגלוגית, סווהילית. הרשימה של שפות שנתעלמו או קירבו בעדינות על ידי כלי כתוביות בעיקר היא ארוכה, ויוצרי התוכן שדוברים בשפות אלה ספגו בשקט את עומס העבודה הנוסף במשך שנים.
למה הפער בשפה קיים בראשית
כלי כתוביות הם עסקים, וניהול תקצוב משאבים בתוך העסקים שם שם ההכנסה היא. שווקים דוברי אנגלית מייצגים את הנתח הגדול ביותר של לקוחות משלמים ל כמעט כל מוצר SaaS בחלל יצירת וידאו. ספרדית והפורטוגזית מכסות רוב אמריקה הלטינית. צרפתית מוסיפה חלקים מאירופה ואפריקה. גרמנית, יפנית, קוריאנית. כל אחד פותח שוק בעל כוח קנייה משמעותי. מוצר התומך בעשר או שתים עשרה שפות אלה יכול לטעון שהוא משרת את רוב בסיס הלקוחות הפוטנציאלי שלו, וממנקודת מבט במיוחד פיננסית, התביעה הזו ניתנת להגנה.
הוספת שפה חדשה למערכת תעתוק היא לא טריוויאלית. זה דורש נתוני הדרכה, בדיקות איכות, תחזוקה מתמשכת, ותיעוד תמיכה. עבור שפה שדוברת שבעה מיליון אנשים, כמו עברית, חישוב ההוצאה-להכנסה רחוק מלהצדיק את ההשקעה כאשר אותן שעות הנדסה יכלו ללכת לכיוון שיפור דיוק תעתוק אנגלית מ-95% ל-97%, המשפיע על מיליוני משתמשים משלמים.
התוצאה היא שוק שבו השפות העשרים האופ או שלוש עשרה העליונות קבלות תמיכה מצוינת, השלושים הבא קבלות כיסוי סביר, וכל השאר חסר או כל כך בעדינות מיושם שזה לא צריך להיות רשום כתכונה בכלל. זה לא זדוני. זה התוצאה הניתנת לחיזוי של בנייה מוצרים שמתאמנים עבור הקהל הגדול ביותר ובר קביעות, אלא כיסוי הרחב ביותר. אבל הבנה למה זה קורה לא עושה את זה פחות תסכול כשאתה זה שמסתכל על תפריט ירידה שלא כולל את השפה שלך.
מחולל הכתוביות ב-YEB בנוי עם קבוצה שונה של עדיפויות. במקום להתחיל עם השפות המסחריות הערכיות ביותר ולעבוד החוצה, מנוע התעתוק נבחר ספציפית על רחבתו של תמיכת שפה. תשעים ושמונה שפות מההתחלה, לא כשאיפות לוח דרכים, אלא כדרישת הרמה. עברית, סרבית, הינדית, תאילנדית, וייטנמית, תגלוגית, ועשרות אחרות שנראות בעדינות ברשימות תכונות המתחרים כולן מטופלות בעצמן, עם אותו צינור תעתוק וזנב תקני איכות דומה כמו אנגלית או ספרדית.
מה תמיכת שפה נכונה בעצם אומר בפרקטיקה
תמיכה בשפה לא אומר רק קבول אודיו בשפה הזו והחזרת טקסט כלשהו. זה אומר מנוע התעתוק מבין את המבנה הפונטי, את אוצר המילים הנפוץ, את קצב וקצב הדיבור הטבעי בשפה הזו. זה אומר שכשמישהו עברית מתעל סרטון, הפלט לא צריך להיות תוקן ידנית מעבר לשם עצום כל כך או מונח טכני שכל מערכת תעתוק עלולה להיתקל.
ב YEB Captions, העלאת סרטון שפה עברית עובדת בדיוק כמו העלאת אחד אנגלית. הבחירה בשפה הוא מתוך הרשימה המלאה של 98 אפשרויות, האודיו מעובד, והתעתוק חוזר כמקטעי כתוביות תקופתיים בעברית. אין קירוב רוסי, אין כתיבה ידנית מחדש, אין שעתיים של הפעלות עריכה לסרטון חמש דקות. הקטעים עדיין יכולים להיות עריכה בנפרד אם הוא נדרש, כמו מילה מה בטעות שם או שם שצריך תיקון שם, אבל הדיוק בסיסי עושה אלה עריכות נמדדות בדקות במקום שעות.
אותו דבר חל על תרגום כתוביות. תוכן שהוא בעצם תעתוק בעברית יכול להיות מתורגם לכל אחד משאר הנתמך שפות לפני הרינדור. סרטון מוזיקה עם מילים עברית יכול להיות פרסום עם אנגלית, ספרדית, או יפנית כתוביות ללא ללכת דרך זרימת עבודה של תרגום נפרדת. עבור יוצרי תוכן שפרסום כל קונטנט שנועדו עבור קהלים בינלאומיים, זה מחק שכבה שלמה של עבודה ידנית שקודם לכן דרוש גם השכרת מתרגם או בילוי ערב עם מילון הרבה של סבלנות.
הנקודה אינה כי YEB Captions הוא הכלי היחיד בעולם שתומך בעברית. קומץ של כלים יציע זה בצורה כלשהי. הנקודה היא כי תמיכה נכונה, שם איכות התעתוק היא כן שימושי ללא תיקון ידני נרחב, נשאר רתום עבור שפות מחוץ לזרם ראשי, וגב בין "רשום כנתמך" ו"בעצם עובד טוב" הוא לעתים קרובות אדיר.
הבעיה הרחבה יותר של בנייה כלים עבור כולם
יש ההנחה יצור קודמת לתוך רוב פיתוח תוכנה כי "כל אחד" אומר "כל אחד שדבור דיבור שפה גדולה." העמודים של תכונה אומר "גלובלי" ו"רב-לשוני" בזמן הרשימה בפועל של שפה אומר סיפור הרבה יותר צר. זה לא מוגבל לכלי כתוביות. תרגום מכונה שירותים, עוזרי קול, OCR מערכות, וחרקים כל אחד להציג את אותו דפוס של עמוק תמיכה עבור קטן מספר שפות ו רדוד או לא קיום תמיכה עבור שאר.
מה עשוי כלי כתוביות בפרטיקולרי בולט הוא הטבע כשל. כשעוזר קול misunderstands פקודה, המשתמש יכול חוזר עליה או טקסט במקום. כשכלי כתוביות מיצר טקסט זבל, כי טקסט מסתיים צרוב לתוך סרטון כי מקבל פרסום עד מאות או אלפים של צופים. הטעות הוא קבוע, ציבורי, וישירות קשור ליוצר התוכן של מקצוע שם. מקבל זה לא נכון הוא לא פשוט אי נוחות; זה ניקוד איכות גלוי כי צופים לשם מיד.
יוצרי תוכן שדבורה תחתון שפות פותחו כל מיני עקיפות לאורך השנים. חלקם תגובה סרטוני שלהם ב אנגלית אפילו כאשר קהל שלהם דבורה משהו אחר. כמה מדלג כתוביות ממש וקבל לעומת העמקה נמוך מס. חלקם להשתמש כמו הקרוב קיים שפה ואחר כך בילוי שעות קביע פלט, absorption עבודה עלות שלהם אנגלית דוברי מתחרים פשוט לא צריך להתמודד עם. אף אחד של אלה הם פתרונות אמיתיים. הם compromises כפוי על ידי שוק כי החליט שפות מסוימות לא היו שווה תמיכה כראוי.
בנייה captions.yeb.to עם 98 שפות היה בחלקו תגובה ל הפרוסטרציה ספציפיים זה ובחלקו הכרה כי תחום לא נעזוב של השוק היא הרבה יותר גדול מאשר רוב חברות נראה לחשוב. שבעה מיליון עברית דוברים הוא קטן מספר בהשוואה אל אנגלית או מנדארינית. אבל הוסף עד שאר כל שפות כי נופל לתוך ה "לא מסחרי רחוק" מקטגוריה, כולל סרבים, תאילנדים, וייטנמים, תגלוג דוברים, סווהילית דוברים, וזה זה עשרות מיליוני אנשים שפשוט לא היה טוב קבוע על ידי כלי כתוביות למשך שנים. כי אינו אניש. זה שוק שפשוט לא הוא קבוע, ואת הנוף של כתוביות יישומים הוא לאט התחלה לשקף כי מציאות.
שאלות בתדירות גבוהה
אילו מחוללי כתוביות תומכים בשפה עברית
מעט מאוד כלי כתוביות כוללים עברית כשפה נתמכת, ואפילו פחות ייצור איכות תעתוק בר שימוש. YEB Captions תומכת בעברית כאחד מ-98 שפות עם תעתוק בעצמי, כלומר הפלט לא דורש את עקיפת השפה הרוסית שרוב כלי אחרים כופים דוברי עברית להשתמש.
יכול מחולל כתוביות בזכות בינה מלאכותית להתמודד עם סקריפטים שאינם לטיניים בדיוק
דיוק תלוי לחלוטין בתוך מנוע התעתוק וכמה נתוני הדרכה הוא יש עבור השפה ספציפיים. קירילית, דוונגרי, תאילנדית, וערבית סקריפטים כולם נתמכו על ידי מודל תעתוק מודרני, אבל רבים כלי כתוביות רק כוללים קומץ מן אלה. כלים בנוי עם תמיכה רב-לשוני רחבה מן ההתחלה נוטים להתמודד עם סקריפטים שאינם לטיניים באופן משמעותי טוב יותר מאשר אלה כי הם הוספו כמו afterthoughts.
למה רוב כלי כתוביות רק תמיכה 10 עד 15 שפות
תמיכה בשפה דורש נתוני הדרכה, בדיקה, ותחזוקה מתמשכת. רוב החברות להיות מיוחד משאבים שלהם על הם שפות כי ייצור אנחנו רבים הכנסה, כלומר אנגלית, ספרדית, צרפתית, גרמנית, וקומץ אחרים. שפות דוברה על ידי קטן אוכלוסיות רחוק מן הצדק ההשקעה מן טהור עסק נקודת מבט, מה הם קבל יד מן רוב מוצרים ממש.
הוא אוטו כתוביות דור דיוק די לדלג עריכה ידנית
עבור שפות טוב נתמך כמו אנגלית וספרדית, תעתוק מודרני דיוק הוא בדרך כלל מעל 90%, כלומר רק קטן תיקונים הם נדרש. עבור שפות פחות נפוץ, דיוק משתנה באופן דרמטי בין כלים. הם של הבדל הוא אם כלי היה עיצוב לתמיכה השפה מן ההתחלה או הוסף זה כמו אחרי חשבון עם מינימום בדיקה.
איך לעשות אני הוסף כתוביות לסרטון בשפה כי רוב כלים לא תמיכה
הם נפוץ ביותר עקיפה הוא בחירת קשור שפה ויד תיקון פלט, כלומר לא יְרִים דורש זמן. הטוב אפשרות היא משתמש בכלי כי בעצם תמיכה השפה נטיבית. YEB של מחולל כתוביות כיסויים 98 שפות וייצור תעתוקים כי דורש מינימום תיקון אפילו עבור שפות כמו עברית, סרבית, ותאילנדית כי רוב מתחרים התעלם.
מה הוא שונה בין כתוביות תרגום וכתוביות דור
כתוביות דור אומר המרה של דבורה אודיו לתוך טקסט בתוך אותה שפה. כתוביות תרגום אומר לקיחה קיים כתוביות והמרה שלהם לתוך שונה שפה. YEB Captions תומך בשניהם. סרטון יכול להיות מתעתק בתוך של אותו שפה מקור ואז מתורגם לתוך כל אחד של אחר שפות נתמך לפני הרינדור.