간단한 영어 문장을 생각해 보세요: "We need to close this quickly." 이제 이를 독일어로 번역하세요. 맥락이 없으면 번역 도구는 일반적이고 기술적으로 올바른 무언가를 생성할 것입니다. 동사 선택은 중립적이고, 공식성은 중간 어딘가에 있으며, 톤은 평평할 것입니다. 이제 맥락을 추가하세요: 이것은 계약 협상을 논의하는 법무 팀입니다. 독일어 출력이 변합니다. "Close"는 합의를 체결하기 위한 특정 법률 용어가 됩니다. 공식성은 공식적인 레지스터로 이동합니다. "quickly"가 암시하는 긴박함은 독일 변호사가 실제로 사용하는 어휘를 통해 표현됩니다. 동일한 원문, 완전히 다른 출력입니다.

이제 맥락을 다시 변경하세요. 동일한 문장이지만 이번에는 버그 티켓을 종료하는 것에 대해 논의하는 소프트웨어 개발 팀에서 나옵니다. 독일어 번역이 다시 변합니다. "Close"는 이제 프로젝트 관리 도구에서 사용되는 기술 용어에 매핑됩니다. 레지스터는 준공식적으로 떨어집니다. 어휘는 독일 개발자들이 스탠드업 및 Slack 채널에서 실제로 말하는 방식과 일치합니다. 문장은 여전히 영어로 같은 의미입니다. 독일어 버전은 서로 완전히 다르게 보이며, 그렇게 보여야 합니다. 왜냐하면 그들은 완전히 다른 상황을 설명하기 때문입니다.

이것이 맥락 없는 번역의 핵심 문제입니다. 원문은 모호하고, 번역가는 추측을 통해 그 모호함을 해결합니다. 때때로 추측이 맞을 때도 있습니다. 종종 그것은 문법적으로 올바르지만 의미적으로 벗어난 출력을 생성합니다. 기술적으로 올바른 것을 말하지만 그 특정 상황에서 원어민이 절대 사용하지 않는 방식으로 말하는 텍스트입니다. YEB 번역의 10가지 맥락 범주는 정확히 이러한 추측을 제거하기 위해 존재합니다. 각 범주는 AI 모델에 번역을 더 잘 선택하는 데 필요한 정보를 제공하며, 함께 일반적인 기계 출력을 그 상황을 실제로 이해하는 사람이 작성한 것처럼 읽히는 텍스트로 변환합니다.

업종, 청중, 그리고 목적

처음 세 범주는 모든 번역 맥락의 기초를 형성합니다. 업종은 모델에 텍스트가 속한 분야를 알려주며, 이는 기술 어휘 선택을 직접 제어합니다. "protocol"과 같은 단어는 의료 맥락에서 네트워킹 맥락이나 외교 맥락의 "protocol"과 완전히 다른 어휘를 유발합니다. 업종 설정이 없으면 모델은 훈련 데이터에서 가장 자주 본 의미를 선택합니다. "protocol"의 경우 일반적으로 기술로 기본값을 설정합니다. 업종을 의료로 설정하면 출력이 자동으로 올바른 의료 용어를 사용합니다.

청중은 번역된 텍스트를 읽을 사람을 지정합니다. 엔지니어를 대상으로 한 기술 문서는 동일한 정보를 일반 청중을 위해 작성한 것과 다른 어휘를 사용하고 다른 배경 지식을 가정합니다. 소비자용 제품 설명은 개발 팀을 위한 내부 사양 문서보다 더 단순한 언어와 더 설득력 있는 프레이밍을 사용합니다. 청중 범주는 무엇을 말할 것인지는 변경하지 않습니다. 그것이 어떻게 말할 것인지를 변경하여, 복잡성, 전문 용어 밀도, 그리고 가정된 지식을 독자의 예상 수준과 맞추도록 조정합니다.

목적은 텍스트 뒤의 의도를 포착합니다. 이것은 교육을 위한 정보 콘텐츠입니까? 판매를 위한 설득적 콘텐츠? 안내를 위한 지시 콘텐츠? 구속력을 위한 법적 콘텐츠? 각 목적은 출력에서 다른 언어 패턴을 활성화합니다. 독일어로 된 설득적 텍스트는 정보 텍스트와 다른 문장 구조를 사용합니다. 법적 프랑스어는 일상적 프랑스어에 완전히 없는 관례를 따릅니다. 목적 범주는 모델에 텍스트가 무엇을 말하는지뿐만 아니라 무엇을 달성하려는 것인지를 알려주며, 출력은 대상 언어에서 그 의도를 반영합니다.

이 세 범주만으로도 변경될 때 극적으로 다른 출력을 생성합니다. "성능 개선"에 대한 문장을 정보 목적으로 의료 청중을 위해 번역하면 임상적이고 신중한 언어가 생성됩니다. 설득 목적으로 마케팅 청중을 위해 동일한 문장을 번역하면 동적이고 이점 중심의 언어가 생성됩니다. AI 번역기 기능 페이지는 이러한 차이를 처음부터 볼 수 있고 싶은 사람을 위해 나란히 배치된 예제를 보여줍니다.

공식성, 레지스터, 그리고 톤

공식성은 아마도 가장 즉시적으로 영향을 미치는 범주, 특히 공식적이고 비공식적인 주소 체계가 있는 언어의 경우입니다. 공식성을 레벨 1로 설정하면 친구들 사이의 문자처럼 읽히는 캐주얼하고 축약된 출력이 생성됩니다. 레벨 5로 설정하면 법적 계약이나 공식 정부 서신처럼 읽히는 정확하고 구조화된 출력이 생성됩니다. 전문성을 위한 재작성 가이드는 공식성이 재작성과 어떻게 상호작용하는지 탐색하지만, 번역에서는 많은 언어가 다양한 공식성 수준을 위해 완전히 분리된 어휘와 문법 구조를 가지고 있기 때문에 효과가 훨씬 더 두드러집니다.

일본어가 가장 극적인 예입니다. 캐주얼 일본어와 공식 일본어의 차이는 너무 중요해서 공식성 레벨 1의 문장은 레벨 5와 오직 어근 동사만 공유할 수 있습니다. 모든 동사 끝이 변합니다. 대명사가 변합니다. 입자가 변합니다. 존댓말 접두어가 나타나거나 사라집니다. 공식성을 고려하지 않는 번역 도구는 본질적으로 공식성 스펙트럼에서 무작위 출력을 생성하고 있으며, 이는 대략 절반의 시간 동안 결과가 비즈니스 맥락에서 부적절하게 캐주얼하거나 친근한 대화에서 불필요하게 경직되어 있다는 의미입니다.

레지스터는 공식성과 함께 작동하지만 공식성과 동일하지 않습니다. 레지스터는 특정 사회적 맥락에서 사용되는 언어적 다양성을 설명합니다. 학술 레지스터, 기술 레지스터, 저널리즘 레지스터, 문학 레지스터. 각각은 문장 구조, 어휘, 그리고 수사적 장치에 대한 자체 관례가 있습니다. 학술 레지스터에서 번역된 텍스트는 수동적 구성, 완화 언어, 그리고 인용 친화적 표현을 사용합니다. 저널리즘 레지스터의 동일한 텍스트는 능동태, 짧은 문장, 그리고 직접 귀속을 사용합니다. 공식성은 텍스트가 얼마나 정중하거나 캐주얼한지를 제어합니다. 레지스터는 어떤 종류의 텍스트처럼 들리는지를 제어합니다.

톤은 감정 계층을 추가합니다. 중립, 낙관적, 긴급, 주의, 공감, 권위. 톤 범주는 암시적 수준에서 단어 선택에 영향을 미칩니다. 중립 톤의 "The deadline is approaching"은 평평합니다. 긴급 톤에서 어휘는 압력과 즉시성을 전달하는 단어로 이동합니다. 신중한 톤에서, 그것은 더 부드러워지고, 완화되고, 더 외교적이 됩니다. 톤은 독자가 텍스트에 대해 느끼는 방식에 가장 직접적으로 영향을 미치는 범주이며, 그것을 잘못 얻으면 동정적인 메시지가 차갑게 들리거나 전문적인 업데이트가 공황 상태로 들릴 수 있습니다.

도메인, 성별, 변형, 그리고 주제

나머지 네 범주는 처음 여섯 범주가 다룰 수 없는 세부 사항을 처리합니다. 도메인 용어는 모델이 어떤 전문화된 어휘 집합을 끌어오는지를 제어합니다. 이것은 업종보다 더 세분화되어 있습니다. 기술 업종 내에서 도메인은 클라우드 컴퓨팅, 모바일 개발, 사이버보안, 또는 데이터 과학일 수 있습니다. 각각은 자신의 전문 용어, 자신의 약어 관례, 그리고 일상적 사용과 다른 특정 의미를 가진 용어 집합을 가지고 있습니다.

화자 성별은 러시아어 성별 가이드에서 논의한 대로 필요한 언어의 문법 성별을 제어합니다. 이것은 러시아어, 아랍어, 히브리어, 힌디어, 그리고 많은 다른 언어처럼 과거형 동사와 형용사가 화자의 성별과 일치해야 하는 언어에서는 선택 사항이 아닙니다. 이 범주를 한 번 설정하면 전체 출력 전체에서 일관된 올바른 성별 표시가 보장됩니다.

지역 변형은 대상 언어의 어떤 버전을 생성할 것인지를 제어합니다. 영국 또는 미국 영어. 브라질 또는 유럽 포르투갈어. 간체 또는 번체 중국어. 라틴 아메리카 또는 이베리아 스페인어. 이 범주는 22가지 언어별 설정과 함께 작동하여 출력이 의도된 청중의 지역 관례와 일치하도록 합니다. 여기에는 철저법, 어휘, 그리고 관용 표현이 포함됩니다. 영국 vs 미국 영어 가이드는 가장 일반적으로 요청된 변형 쌍을 위해 이를 자세히 다룹니다.

주제는 모호함을 해결하는 데 도움이 되는 주제 맥락을 제공합니다. 여러 범주가 동시에 설정되면 AI 모델은 번역하는 동안 하는 모든 결정을 안내하는 풍부한 맥락 문자열을 받습니다. 10가지 범주의 모든 것의 조합은 117가지 개별 옵션을 사용하여 일반적인 근사값이 아닌 정확한 상황에 맞춘 번역을 생성하기에 충분히 구체적인 맥락 지문을 만듭니다.

117가지 옵션이 실제로 의미하는 것

이 수는 크게 들리지만, 실제로 시스템은 대부분의 사용자가 주어진 작업에 대해 여러 범주만 설정하면 되도록 설계되었습니다. API 문서를 번역하는 개발자는 업종을 기술로, 도메인을 소프트웨어 개발로, 공식성을 레벨 3으로, 그리고 레지스터를 기술로 설정할 수 있습니다. 그것은 4가지 설정, 아마도 30초의 구성이고, 결과 번역은 전체 세션 전체에서 올바른 기술 용어, 적절한 공식성, 그리고 전문 레지스터를 사용합니다.

캠페인 카피를 번역하는 마케팅 전문가는 업종을 마케팅으로, 청중을 소비자로, 목적을 설득적으로, 톤을 낙관적으로, 그리고 공식성을 레벨 2로 설정할 수 있습니다. 5가지 설정, 여전히 구성에서 1분 미만이고, 세션의 모든 번역은 이러한 선택을 반영합니다. 사용 가이드는 단계별로 구성 과정을 안내합니다.

10가지 범주의 117가지 옵션은 동시에 모두 사용되기 위한 것이 아닙니다. 그들은 실제 사용자가 만나는 상황의 전체 범위를 다루기 위한 것입니다. 법적 번역가는 소셜 미디어 관리자와 다른 옵션이 필요합니다. 의료 연구자는 여행 블로거와 다른 옵션이 필요합니다. 시스템은 모든 사용자가 모든 옵션을 이해하도록 요구하지 않고 이러한 모든 사용 사례를 제공하기에 충분한 세분도를 제공합니다. 작업에 중요한 범주를 설정하고, 나머지는 기본값으로 두고, AI 모델은 받는 어떤 맥락도 통합합니다.

이것이 일반적인 번역과 근본적으로 다르게 만드는 것은 모델이 기본 번역을 생성한 다음 조정한다는 것입니다. 맥락은 처음부터 출력을 형성합니다. 단어 선택, 문장 구조, 용어, 레지스터, 그리고 공식성은 모두 번역의 첫 번째 단어가 생성되기 전에 맥락에 의해 결정됩니다. 이것이 다른 맥락 설정으로 출력이 극적으로 다르게 보일 수 있는 이유입니다. 그것은 동일한 번역이 조정되지 않습니다. 그것은 완전히 다른 제약 집합에 의해 안내되는 완전히 다른 번역이 생성되는 것입니다.

자주 묻는 질문

맥락 인식 기계 번역이란 무엇인가요

맥락 인식 기계 번역은 AI 모델이 번역을 생성하기 전에 화자, 청중, 업종, 공식성 수준, 톤, 및 기타 요소에 대한 정보를 받는 접근 방식입니다. 이 맥락은 출력의 단어 선택, 문법, 그리고 레지스터를 형성하여 일반적인 만능 결과가 아닌 특정 상황에 맞춘 번역을 생성합니다.

YEB 번역은 몇 가지 맥락 설정을 제공하나요

YEB 번역은 10가지 맥락 범주에 117가지 개별 옵션을 제공하며, 추가로 22가지 언어별 설정에 78가지 옵션을 제공합니다. 범주에는 업종, 청중, 공식성, 레지스터, 톤, 목적, 도메인 용어, 화자 성별, 지역 변형, 그리고 주제가 포함됩니다. 사용자는 일반적으로 세션당 3~5개의 범주를 설정합니다.

맥락 설정이 잘못 설정되면 더 나쁜 번역을 생성할 수 있나요

잘못된 맥락을 설정하면 번역을 부적절한 방향으로 밀어낼 수 있습니다. 예를 들어, 마케팅 텍스트에 대해 의료 업종 맥락을 설정하면 부적절해 보이는 임상 용어를 도입할 것입니다. 그러나 설정을 기본값으로 두면 단순히 일반적인 출력이 생성되며, 이는 맥락 없이 다른 번역 도구가 생성하는 것과 같습니다. 사용되지 않은 설정의 최악의 경우는 해롭지 않은 중립입니다.

맥락 설정이 있는 무료 AI 번역기가 있나요

YEB 번역은 구독 모델이 아닌 사용량 기반 크레딧 모델을 사용합니다. 모든 맥락 범주는 프리미엄 계층 없이 모든 요청에서 사용 가능합니다. 크레딧은 텍스트가 실제로 처리될 때만 소비되며, 사용하지 않은 크레딧은 무기한으로 이월됩니다. 이것은 맥락 인식 출력이 여전히 필요한 가끔 사용하는 사용자에게 구독 도구보다 더 저렴합니다.

맥락 인식 번역을 DeepL 또는 Google 번역과 비교하면 어떤가요

DeepL과 Google 번역은 유창한 출력을 생성하지만 맥락에 대한 최소한의 제어만 제공합니다. 둘 다 업종, 톤, 화자 성별, 또는 도메인 용어에 대한 설정을 제공하지 않습니다. 결과는 문법적으로 올바르지만 잘못된 용어, 부적절한 공식성, 또는 잘못된 성별 형태를 사용할 수 있는 일반적인 번역입니다. 맥락 인식 번역은 AI 모델에 대상 선택을 하는 데 필요한 정보를 제공함으로써 이러한 격차를 채웁니다. DeepL 비교는 이를 자세히 설명합니다.

맥락 설정이 모든 언어 쌍에 대해 작동하나요

맥락 설정은 모든 언어 쌍에 적용됩니다. 일부 범주는 특정 언어에 더 영향을 미칩니다. 화자 성별은 러시아어와 아랍어와 같은 성별 있는 언어에 가장 중요합니다. 공식성은 일본어, 한국어, 그리고 독일어에서 가장 강한 영향을 미칩니다. 지역 변형은 포르투갈어와 중국어와 같이 주요 방언 분할이 있는 언어에 중요합니다. 시스템은 대상 언어를 기반으로 맥락 해석을 조정합니다.