簡単な英文を考えてみましょう:「We need to close this quickly.」(これを素早く終わらせる必要があります)。これをドイツ語に翻訳します。コンテキストなしでは、翻訳ツールは一般的で技術的に正しい何かを生み出します。動詞の選択は中立的で、フォーマリティはどこかの中程度で、トーンは平坦になります。ここでコンテキストを追加します:これは契約交渉を議論する法務チームです。ドイツ語の出力が変わります。「Close」は契約の締結を意味する特定の法律用語になります。フォーマリティは正式な文体に移行します。「quickly」で暗示される緊急性は、ドイツの弁護士が実際に使う語彙を通じて表現されます。ソーステキストは同じですが、出力はまったく異なります。

コンテキストをもう一度変えましょう。同じ文ですが、今回はバグチケットをクローズすることについて話しているソフトウェア開発チームから来ています。ドイツ語の翻訳は再び変わります。「Close」は現在、プロジェクト管理ツールで使用される技術用語にマップされます。文体は準正式なレベルに低下します。語彙はドイツの開発者がスタンドアップとSlackチャネルで実際に話す方法に合致します。この文は英語では依然として同じことを意味しています。ドイツ語版はまったく異なって見えます。そしてそうであるべきです。なぜなら、彼らはまったく異なる状況を説明しているからです。

これはコンテキストなし翻訳の中心的な問題です。ソーステキストは曖昧で、翻訳者はその曖昧性を推測によって解決します。時には推測は正しいです。多くの場合、文法的には正しいが意味的にはずれている出力を生成します。技術的には正しいことを言っているが、その特定の状況でネイティブスピーカーが決して使わないやり方で言っているテキストです。YEB Translateの10のコンテキストカテゴリはこの推測を排除するために特別に存在します。それぞれが翻訳中にAIモデルがより良い選択をするために必要な情報を提供し、一緒に彼らは一般的な機械出力を実際の状況を理解している人によって書かれたかのように読むテキストに変換します。

業界、聴衆、および目的

最初の3つのカテゴリはあらゆる翻訳コンテキストの基礎を形成します。業界は、テキストがどの分野に属しているかをモデルに伝えます。これは技術用語の選択を直接制御します。医療の文脈での「protocol」という言葉は、ネットワーキング文脈での「protocol」または外交文脈での「protocol」とはまったく異なる語彙をトリガーします。業界設定がない場合、モデルは訓練データで最も見られた意味を選択します。「protocol」の場合、通常はテクノロジーがデフォルトになります。業界をヘルスケアに設定すると、出力は自動的に正しい医学用語を使用します。

聴衆は翻訳されたテキストを誰が読むかを指定します。エンジニアを対象とした技術文書は、開発チームの一般向けの情報とは異なる語彙を使用し、異なる背景知識を想定しています。消費者向けの製品説明は、開発チームの内部仕様文書よりも単純な言語とより説得力のあるフレームを使用しています。聴衆カテゴリは、何が言われているかは変わりません。どのように言われているかが変わります。複雑さ、専門用語の密度、および想定される知識を読者の期待レベルに合わせて調整します。

目的は、テキストの背後にある意図をキャプチャします。これは教育することを目的とした情報提供コンテンツですか?販売することを目的とした説得的なコンテンツですか?ガイドすることを目的とした指示的なコンテンツですか?バインドすることを目的とした法的コンテンツですか?各目的は出力内の異なる言語パターンをアクティブにします。ドイツ語の説得的なテキストは、情報提供テキストとは異なる文構造を使用しています。法的フランス語は、会話フランス語には完全に存在しない慣例に従います。目的カテゴリはモデルに、テキストが何を言っているのかだけでなく、何を達成しようとしているのかを伝え、出力はターゲット言語でその意図を反映しています。

これら3つのカテゴリだけでも、変化すると劇的に異なる出力を生成します。「パフォーマンスを向上させる」ことについての文を医療聴衆に情報提供目的で翻訳すると、臨床的で測定された言語が生成されます。同じ文をマーケティング聴衆に説得的目的で翻訳すると、動的で利益に焦点を当てた言語が生成されます。AIテキスト翻訳機能ページは、対比を見たい誰もがこれらの違いのサイドバイサイド例を示しています。

フォーマリティ、レジスター、およびトーン

フォーマリティは、特に正式および非正式のアドレスシステムを持つ言語では、おそらく最も直接的に影響を与えるカテゴリです。フォーマリティをレベル1に設定すると、友人間のテキストメッセージのように読まれるカジュアルで短縮された出力が生成されます。それをレベル5に設定すると、法的契約または公式政府通信のように読まれる正確で構造化された出力が生成されます。職業的に聞こえるように言い換えるためのガイドは翻訳ではフォーマリティが言い換えとどのように相互作用するかを探りますが、効果はさらに顕著です。多くの言語には異なるフォーマリティレベルの完全に異なる語彙と文法構造があります。

日本語が最も劇的な例です。カジュアルな日本語と正式な日本語の違いは非常に顕著です。フォーマリティレベル1の文は、レベル5の同等の文と根の動詞のみを共有する可能性があります。すべての動詞の終わりが変わります。代名詞が変わります。粒子が変わります。敬語のプレフィックスが表示されたり消えたりします。フォーマリティを考慮しない翻訳ツールは、本質的にフォーマリティスペクトル上でランダムな出力を生成しています。つまり、ビジネス文脈で不適切にカジュアルな結果が得られる、または友好的な会話に対して不必要に硬い結果が得られる確率は約50%です。

レジスターはフォーマリティと並んで機能しますが、それと同一ではありません。レジスターは、特定の社会的文脈で使用される言語の多様性を説明しています。学術レジスター、技術レジスター、ジャーナリスティックレジスター、文学レジスター。それぞれは、文構造、語彙、および修辞的装置に独自の慣例があります。学術レジスターで翻訳されたテキストは、受動的な構造、緩和言語、および引用対応フレーズを使用します。ジャーナリスティックレジスターでの同じテキストは、能動的な声、短い文、および直接的なアトリビューションを使用します。フォーマリティは、テキストがどのくらい丁寧またはカジュアルに聞こえるかを制御します。レジスターは、それがどのような種類のテキストに聞こえるかを制御します。

トーンは感情的な層を追加します。中立、楽観的、緊急、用心深い、共感的、権威的。トーンカテゴリは、内涵レベルでの言葉の選択に影響を与えます。中立的なトーンで「締め切りが近づいています」という文は平坦なままです。緊急なトーンでは、語彙は圧力と直前性を伝える言葉にシフトします。用心深いトーンでは、より柔らかく、緩和され、より外交的になります。トーンは、読者がテキストについてどのように感じるかに最も直接的に影響するカテゴリです。それを間違えると、同情的なメッセージが冷たく聞こえたり、専門的な更新がパニックになったりする可能性があります。

ドメイン、性別、バリアント、および主題

残りの4つのカテゴリは、最初の6つが対応できない特定のものを処理します。ドメイン用語は、モデルが引き出す専門的な語彙セットを制御します。これは業界よりも粒度が細かいです。テクノロジー業界内では、ドメインはクラウドコンピューティング、モバイル開発、サイバーセキュリティ、またはデータサイエンスである可能性があります。それぞれは独自の専門用語、独自の頭字語慣例、および日常的な用法と異なる特定の意味を持つ用語のセットを持っています。

ロシア語性別ガイドで説明されているように、スピーカーの性別は言語で必要とされる文法的な性別を制御します。これはロシア語、アラビア語、ヘブライ語、ヒンディー語、および過去時制の動詞と形容詞がスピーカーの性別と一致する必要がある多くの他の言語では必須ではありません。このカテゴリを1回設定すると、出力全体を通じて一貫した正しい性別マーカーが確保されます。

地域のバリアントは、ターゲット言語のどのバージョンを生成するかを制御します。イギリス英語またはアメリカ英語。ブラジルまたはヨーロッパポルトガル語。簡体字または繁体字中国語。ラテンアメリカンまたはペニンシュラスペイン語。このカテゴリは22の言語固有設定と連携して、出力が意図された聴衆の地域の慣例に一致することを確保します。スペリング、語彙、およびイディオム表現を含みます。イギリス対アメリカ英語ガイドは最も一般的に要求されるバリアントペアについてこれを詳しく説明しています。

主題は、曖昧性を解決するのに役立つ主題のコンテキストを提供します。複数のカテゴリが同時に設定されると、AIモデルは翻訳中に行うすべての決定をガイドする豊富なコンテキスト文字列を受け取ります。10のすべてのカテゴリと117の個別オプションの組み合わせは、一般的な近似値ではなく正確な状況に合わせた翻訳を生成するのに十分に特定されるコンテキストフィンガープリントを作成します。

実践における117オプションの実際の意味

この数は大きく見えますが、実際にはシステムは、ほとんどのユーザーが任意のタスクで数個のカテゴリのみを設定する必要があるように設計されています。APIドキュメントを翻訳する開発者は、業界をテクノロジーに、ドメインをソフトウェア開発に、フォーマリティをレベル3に、レジスターをテクニカルに設定する場合があります。それは4つの設定で、おそらく30秒の設定で、結果として得られる翻訳は、セッション全体を通じて正しい技術用語、適切なフォーマリティ、および専門的なレジスターを使用します。

キャンペーンコピーを翻訳するマーケティング専門家は、業界をマーケティングに、聴衆を消費者に、目的を説得的に、トーンを楽観的に、フォーマリティをレベル2に設定する場合があります。5つの設定、まだ1分未満の設定、そしてセッション内のすべての翻訳はそれらの選択を反映しています。使用ガイドは設定プロセスをステップバイステップで説明しています。

10のカテゴリにわたる117オプションはすべて同時に使用することを目的としていません。実際のユーザーが遭遇する状況の全範囲をカバーすることを目的としています。法的翻訳者はソーシャルメディアマネージャーとは異なるオプションが必要です。医学研究者は旅行ブロガーとは異なるオプションが必要です。システムは、すべてのユーザーがすべてのオプションを理解することを要求することなく、すべてのこれらのユースケースに対応するための十分な粒度を提供します。手元のタスクで重要なカテゴリを設定し、残りをデフォルトのままにしておきます。AIモデルは、受け取るあらゆるコンテキストを組み込みます。

これを一般的な翻訳と根本的に異なるものにするのは、モデルがデフォルトの翻訳を生成してからそれを調整しないということです。コンテキストは最初から出力を形成します。単語の選択、文構造、用語、レジスター、およびフォーマリティはすべて、翻訳の最初の言葉が生成される前にコンテキストによって決定されます。これが、異なるコンテキスト設定で出力がそんなに劇的に異なることができる理由です。それは調整されている同じ翻訳ではありません。それは、完全に異なる制約のセットによってガイドされた、ゼロから生成されている異なる翻訳です。

よくある質問

コンテキスト対応機械翻訳とは何ですか

コンテキスト対応機械翻訳は、AIモデルが翻訳を生成する前にスピーカー、聴衆、業界、フォーマリティレベル、トーン、およびその他の要素に関する情報を受け取るアプローチです。このコンテキストは出力内の単語の選択、文法、およびレジスターを形成し、一般的な万能な結果ではなく特定の状況に合わせた翻訳を生成します。

YEB Translateはいくつのコンテキスト設定を提供していますか

YEB Translateは117の個別オプションを備えた10のコンテキストカテゴリと、78のオプションを備えた22の言語固有設定を提供しています。カテゴリには、業界、聴衆、フォーマリティ、レジスター、トーン、目的、ドメイン用語、スピーカーの性別、地域のバリアント、および主題が含まれます。ユーザーは通常、セッションごとに3〜5個のカテゴリを設定します。

コンテキスト設定が正しく設定されていない場合、翻訳をより悪くすることができます

間違ったコンテキストを設定すると、翻訳が不適切な方向に押されることができます。例えば、マーケティングテキストに医療業界コンテキストを設定すると、場違いに感じる臨床用語が導入されます。ただし、設定をデフォルトのままにしておくだけで、他の翻訳ツールがコンテキストなしで生成するものと同等の一般的な出力が生成されます。未使用設定の最悪の場合は中立です。有害ではありません。

コンテキスト設定を備えた無料AIトランスレーターはありますか

YEB Translateはサブスクリプションではなく使用量に応じた支払いクレジットモデルを使用しています。すべてのコンテキストカテゴリはプレミアム階層なしですべてのリクエストで利用可能です。クレジットは、テキストが実際に処理されたときにのみ消費され、未使用のクレジットは無期限に繰り越されます。これにより、コンテキスト対応出力を必要としながらもサブスクリプションツールよりも手頃な価格になります。

コンテキスト対応翻訳はDeepLやGoogle Translateとどのように比較されますか

DeepLとGoogle Translateは流暢な出力を生成しますが、コンテキストの制御を最小限に提供しています。どちらも業界、トーン、スピーカーの性別、またはドメイン用語の設定を提供していません。結果は文法的に正しいが、間違った用語、不適切なフォーマリティ、または不正な性別の形式を使用する可能性がある一般的な翻訳です。コンテキスト対応翻訳は、AIモデルが対象を絞った選択をするために必要な情報を与えることによってこれらのギャップを埋めます。DeepL比較はこれを詳しく分割しています。

コンテキスト設定はすべての言語ペアで機能しますか

コンテキスト設定は任意の言語ペアに適用されます。特定の言語については、いくつかのカテゴリはより他のカテゴリより影響を与えます。スピーカーの性別は、ロシア語やアラビア語などのジェンダー言語に最も重要です。フォーマリティは日本語、韓国語、ドイツ語で最も強い効果があります。地域のバリアントはポルトガル語と中国語のような主要な方言分割を持つ言語にとって重要です。システムは、ターゲット言語に基づいてコンテキスト解釈を適応させます。