Вземете просто английско изречение: "We need to close this quickly." Сега го преведете на немски. Без никакъв контекст, инструмент за превод ще произведе нещо общо и технически правилно. Изборът на глагол ще бъде неутрален, формалността ще бъде някъде в средата, и тонът ще бъде плосък. Сега добавете контекст: това е правен отбор, обсъждащ преговори за договор. Германския резултат се променя. "Close" (затворете) се превръща в специфичен правен термин за заключаване на споразумение. Формалността се променя на официален регистър. Спешността, предполагаема от "quickly" (бързо), се изразява чрез лексика, която немски адвокат наистина би използвал. Един и същи текст на английски, напълно различни резултати.

Сега променете контекста отново. Едно и също изречение, но този път идва от софтуерен отбор, обсъждащ затваряне на билет с грешка. Германския превод се променя още веднъж. "Close" сега е свързан с техническия термин, използван в инструменти за управление на проекти. Регистърът пада на полу-официален. Лексиката се подравнява с това как германските разработчици действително говорят на бърифинги и в Slack каналите. Изречението все още означава едно и също нещо на английски. Германските версии на него изглеждат напълно различни, и те трябва да бъдат, защото описват напълно различни ситуации.

Това е основния проблем с превода без контекст. Текстът на източника е неясен, и преводачът разрешава тази двусмисленост чрез предположение. Понякога предположението е правилно. Често произвежда резултат, който е граматически правилен, но семантично неправилен, текст, който технически казва правилното нещо, но го казва по начин, който роден говорител никога не би използвал в тази конкретна ситуация. Десетте категории контекст в YEB Translate съществуват специално, за да елиминират това предположение. Всяка една предоставя на ИИ модела информацията, която му е необходима, за да направи по-добри избори, и заедно те трансформират общия машинен резултат в текст, който изглежда сякаш е написан от някой, който наистина разбира ситуацията.

Индустрия, аудитория и цел

Първите три категории формират основата на всеки контекст на превод. Индустрията казва на модела от какво поле е текстът, което директно контролира избора на техническа лексика. Дума като "protocol" (протокол) в медицински контекст пълнит напълно различна лексика от "protocol" в контекст на мрежи или дипломатичен контекст. Без настройката на индустрията, моделът избира коя значение е видял най-често в обучаващите данни, което за "protocol" обикновено подразбира технология. Задайте индустрията като здравеопазване, и резултатът използва правилната медицинска терминология автоматично.

Аудиторията уточнява кой ще прочете преведения текст. Технически документ, насочен към инженери, използва различна лексика и предполага различни основни знания от едно и също информация, написана за обща публика. Описание на продукт за потребители използва по-проста лексика и по-убедителен фрейминг от вътрешен документ за спецификация на отбора за разработка. Категорията на аудиторията не променя това, което се казва. Променя как се казва, подравнявайки сложност, плътност на жаргон и предполагаемо знание, за да съответства на очаквания ниво на четеца.

Целта улавя намерението зад текста. Това ли е информационно съдържание, предназначено да образова? Убедително съдържание, предназначено да продаде? Инструкционно съдържание, предназначено да ръководи? Правно съдържание, предназначено да обвърза? Всяка цел активира различни лингвистични модели в резултата. Убедителният текст на немски използва различни структури на изречението от информационния текст. Правната френска следва конвенции, които напълно отсъстват в разговорната френска. Категорията на целта казва на модела не само какво казва текстът, но какво той се опитва да постигне, и резултатът отразява намерението на целевия език.

Само тези три категории произвеждат драматично различни резултати, когато се варираат. Изречение за "подобряване на производителността", преведено за аудитория на здравеопазване с информационна цел, генерира клинична, измерена лексика. Едно и също изречение, преведено за маркетингова аудитория с убедителна цел, генерира динамична, ориентирана на предимства лексика. Страницата с функции на преводач AI показва съответстващи примери на тези различия за всеки, който иска да видим контраста с собствени очи.

Формалност, регистър и тон

Формалността е може би най-веднага най-въздействащата категория, особено за езици с официални и неофициални системи на адресиране. Задаването на формалност на ниво един произвежда случайно, съкратено резултат, който изглежда като текстово съобщение между приятели. Задаването на ниво пет произвежда прецизна, структурирана резултат, която изглежда като правен договор или официална държавна кореспонденция. Ръководството на преформулирането за професионализъм изследва как формалността взаимодейства с преформулирането, но при превод, ефектът е още по-произнесен, защото много езици имат напълно отделна лексика и граматични структури за различни нива на формалност.

Японският е най-драматичния пример. Разликата между случайния японски и официален японски е толкова значима, че изречение при ниво на формалност един може да поделя само основни глаголи със своя еквивалент на ниво пет. Всеки краят на глагол се променя. Местоименията се променят. Частиците се променят. Почетни префикси се появяват или изчезват. Инструмент за превод, който не отчита формалност на японски, е по същество производство произволен резултат на спектъра на формалност, което означава приблизително половината време резултатът ще бъде неподходящо случаен за бизнес контекст или ненужно твърд за приятелско разговор.

Регистърът работи паралелно с формалност, но не е идентичен на нея. Регистърът описва лингвистичното разнообразие, използвано в специфичен социален контекст. Академичен регистър, технически регистър, журналистически регистър, литературен регистър. Всеки има свои собствени конвенции за структура на изречението, лексика и риторични устройства. Текст, преведен в академичен регистър, използва пасивни конструкции, елементи на съмнение и фразиране, приятелско за цитиране. Един и същ текст в журналистически регистър използва активен глас, по-кратки изречения и преки приписвания. Формалност контролира как вежлив или случаен звучи текстът. Регистърът контролира какъв вид текст звучи.

Тонът добавя емоционалния слой. Неутрален, оптимистичен, спешен, предпазлив, съчувственъм, авторитетен. Категорията на тона влияе на изборът на дума на ниво значение. "The deadline is approaching" (крайният срок приближава) при неутрален тон остава плосък. При спешен тон, лексиката се движи към думи, които предават налягане и незабавност. При предпазлив тон, той становя по-мек, условен, по-дипломатичен. Тонът е категорията, която най-преки влияе на това как четецът се чувства за текста, и грешното му предприятие може да направи съчувственъм съобщение да звучи студено или професионално обновление да звучи паникьосано.

Домейн, пол, вариант и предмет на изучаване

Останалите четири категории справят със специфики, които първите шест не могат да покрият. Терминологията на домейна контролира кой специализиран набор от лексика моделът начина. Това е по-гранулирано от индустрията. В техническата индустрия, домейнът може да бъде облачни изчисления, мобилна разработка, кибербезопасност или наука за данните. Всеки има собствения жаргон, собствените конвенции на акроним и собствения набор от термини, които имат специфични значения различни от тяхното вседеневно използване.

Полът на говорителя, както е обсъждан в ръководството за пол на руски, контролира граматичния род в езици, които го изискват. Това не е опционално за езици като руски, арабски, иврит, хинди и много други, където глаголите в минало време и прилагателните трябва да се съгласуват с полът на говорителя. Задаването на тази категория веднъж гарантира последователни и правилни маркери на пол през целия резултат.

Регионалния вариант контролира коя версия на целевия език да се произведе. Британски или американски английски. Португалски от Бразилия или европейски португалски. Опростен или традиционен китайски. Латиноамерикански или полуостровен испански. Тази категория работи със 22 езикови специфични настройки, за да гарантира, че резултатът съответства на конвенциите на предвидената аудитория на региона, включително правопис, лексика и идиоматични изрази. Ръководството на британски срещу американски английски обхвата това подробно за най-често поискания вариант на двойката.

Предметът на изучаване предоставя тематичния контекст, който помага за разрешаване на двусмисленост. Когато множество категории са зададени едновременно, ИИ моделът получава богат контекстен низ, който ръководи всяко решение, което прави по време на превод. Комбинацията на всичких десет категории, със своите 117 отделни опции, създава контекстен отпечатък, който е достатъчно специфичен, за да произведе преводи, приспособени към точни ситуации вместо общи приближения.

Какво 117 опции наистина означават на практика

Числото звучи голямо, но на практика системата е проектирана така, че повечето потребители трябва да задават само няколко категории за всяка дадена задача. Разработчик, превеждащ документацията на API, може да зададе индустрия като технология, домейн като разработка на софтуер, формалност на ниво три и регистър като технически. Това са четири настройки, може би тридесет секунди конфигурация, и получените преводи използват правилна техническа терминология, подходящо формалност и професионален регистър през целата сесия.

Маркетингов професионалист, превеждащ материали на кампания, може да зададе индустрия като маркетинг, аудитория на потребители, цел на убедима, тон на оптимистичен и формалност на ниво две. Пет настройки, все още под минута конфигурация, и всеки превод в сесията отразява тези избори. Ръководството за използване преминава през процеса на конфигурация стъпка по стъпка.

Опциите на 117 в десет категории не са предназначени да се използват едновременно. Те са предназначени да покрият пълния обхват на ситуации, които реални потребители срещат. Правен преводач имам различни опции от мениджър на социални медии. Медицински изследовател имам различни опции от пътни блогър. Системата предоставя достатъчно гранулярност, за да служи всички тези случаи на употреба без да изисква всеки потребител да разбира всяка опция. Задайте категориите, които са важни за задачата в ръка, оставете остатъка на техните подразбирания, и ИИ моделът включва какъв контекст получава.

Това, което го прави принципно различен от общия превод, е че моделът не произвежда подразбран превод и след това го коригира. Контекстът формира резултата от самото начало. Избор на дума, структура на изречението, терминология, регистър и формалност се определят от контекста преди първата дума на превода да бъде генерирана. Това е защо резултатът може да изглежда толкова драматично различен с различни настройки на контекста. Не е един превод, който се коригира. Това е различен превод, който се генерира от нулата, ръководен от напълно различен набор от ограничения.

Често задавани въпроси

Какво е превод на машина с контекст

Превод на машина с контекст е подход, където ИИ моделът получава информацията за говорителя, аудиторията, индустрия, ниво на формалност, тон и други фактори преди генериране на превода. Този контекст формира избор на дума, граматика и регистър в резултата, производя преводи, приспособени към конкретни ситуации, вместо общи един-размер-подхожда-всички резултати.

Колко контекстни настройки предлага YEB Translate

YEB Translate предоставя 10 контекстни категории със 117 отделни опции, плюс 22 езикови специфични настройки със 78 опции. Категориите включват индустрия, аудитория, формалност, регистър, тон, цел, терминология на домейна, пол на говорителя, регионален вариант и предмет на изучаване. Потребителите обикновено задават 3 до 5 категории на сесия.

Могат ли контекстни настройки да произведат по-лошо преводи, ако са неправилно зададени

Задаването на грешен контекст може да натисне превода в неподходящо направление. Например, задаване на медицински контекст на индустрия за маркетингов текст ще въведе клинична терминология, която се чувства неместна. Однакъ, оставяне на настройки на техните подразбирани просто произвежда общ резултат, който е еквивалентен на това, което други инструменти за превод произвеждат без никакъв контекст. Най-лошия случай за неизползвани настройки е неутрален, не вреден.

Има ли безплатен преводач AI с настройки на контекста

YEB Translate използва модел на плащане по употреба на кредити, вместо абонамент. Всички контекстни категории са налични при всеки запрос без премиум слоеве. Кредитите се потребяват само когато текстът наистина се обработва, и неизползвани кредити се пренасят неограничено. Това го прави по-икономичен от абонаментни инструменти за случайни потребители, които все още имат нужда от резултат с контекста.

Как се сравнява превод с контекст към DeepL или Google Translate

DeepL и Google Translate произвеждат течен резултат, но предлагат минимален контрол върху контекста. Нито един не предоставя настройки за индустрия, тон, пол на говорителя или терминология на домейна. Резултатът е общ преводи, които са граматически правилни, но може да използват неправилна терминология, неподходяща формалност или неправилни полови форми. Превод с контекст попълва тези пропуски, давайки на ИИ модела информацията, което му е необходимо, за да направи целеви избори. Сравнението на DeepL разбива това подробно.

Работят ли контекстни настройки за всички двойки езици

Контекстните настройки се прилагат за всяка двойка езици. Някои категории са по-въздействащи за определени езици от други. Полът на говорителя е най-важен за езици с род, като руски и арабски. Формалност има най-силния ефект на японски, корейски и немски. Регионалния вариант е критичен за езици с големи диалектни разделения, как португалски и китайски. Системата адаптира своята интерпретация на контекст въз основа на целевия език.