Chat with us, powered by LiveChat

기계 번역의 인간 포스트 에디팅

기계 번역 기술은 최근 몇 년 동안 놀랄 만큼 발전해 왔습니다. 기계가 “인간의 수준”을 따라잡았는지에 대한 질문에는 약간의 논쟁이 있습니다. Trusted Translations는 일부 상황의 경우 기계가 인간을 따라잡았다고 생각합니다. 하지만 대부분의 경우 기계가 아직 숙련된 인간 번역가의 판단력을 대체할 수는 없음을 이해합니다. 언어 조합이나 분야, 복잡함, 기술적 수준, 내용이 평이하거나 창의적인 정도, 원문이 매끄럽게 잘 쓰인 정도, 원문의 양식 등 여러 요소에 따라 정도의 차이는 있으나, 여전히 인간의 개입으로 품질을 개선할 수 있는 여지는 존재합니다.

이처럼 무한한 변수가 있기에 기계 번역이 모든 경우에 올바른 번역을 판단하고 제공할 수는 없습니다(아마 영원히 그럴 수 없을 것입니다). 따라서 기계 번역을 활용하면서도 믿을 수 있는 번역물을 얻으려면 대부분의 경우 인간 포스트 에디팅은 필수입니다. 또 사용자 신경망 기계 번역 엔진(CMTE)의 성능을 개선하기 위한 재교육에도 인간 언어 전문가의 피드백이 필요합니다.

Trusted Translations는 기계 번역 감수 교육을 받은 언어 전문가를 보유하고 있습니다. 본사의 포스트 에디터들은 본인의 경험을 활용하여 기계 번역이나 자동 번역 결과물의 오류를 교정할 뿐만 아니라, 앞으로의 기계 번역 결과물을 개선합니다.

적절한 기술 도구를 활용하면 포스트 에디팅을 통해 현재 작업 중인 번역 결과물의 품질을 개선하고, 번역 품질 데이터를 번역 메모리(TM)에 저장하여 다음 프로젝트에서 기계 번역 엔진의 효율성과 정확도를 개선할 수 있습니다.

번역 및 포스트 에디팅 과정

기계가 생성한 콘텐츠를 번역하고 포스트 에디팅을 진행하는 과정은 일반적인 과정과 다르며, 여기에는 각자 특별한 기술과 교육이 필요합니다. 모든 언어 전문가가 포스트 에디팅에 익숙하지는 않습니다. 포스트 에디팅 업무에 도전한다고 해도 구체적으로 어떻게 하는지 몰라서 교육이 필요할 수 있습니다. 교육계는 최근 기계 번역의 인간 포스트 에디터 수요 증가에 부응한 교육 과정을 개발하기 시작했습니다.

이는 모두 2개 국어 콘텐츠를 검토할 때의 두뇌 처리 과정에서부터 시작합니다. 처음부터 혼자 번역할 때의 “대상(내가 번역한 내용)”은 번역가에게 백지와 같으며, 대체로 다음과 같은 과정을 따라갑니다.

  • 출처 콘텐츠를 꼼꼼하게 읽습니다.
  • 내적으로(즉, 머리 속에서) 번역문을 형성해 나갑니다.
  • 마지막으로 자신이 생각한 대상(번역물) 버전을 소프트웨어나 인터페이스에 입력합니다.

번역가는 내용이나 프로젝트의 성격에 따라 즉시 콘텐츠를 수정하거나, 추가 자료 조사를 하거나, 전체 번역을 완료한 후에 다시 검토합니다.
번역 메모리(TM)에 입력된 문장과 일부나 전체가 일치하는 문장이 있을 때의 번역 과정에는 약간의 차이가 있으나, 일반적으로 위의 세 단계를 거치게 됩니다. 활용할 콘텐츠가 있으면 다음을 수행합니다.

  • 출처 콘텐츠를 꼼꼼하게 읽습니다.
  • 번역 메모리가 제공하는 대상 콘텐츠를 꼼꼼하게 확인합니다.
  • 소프트웨어나 인터페이스에 자신이 수정한 대상 언어(번역)를 입력합니다.

기계가 번역한 텍스트를 포스트 에디팅할 때에는 처리 과정이 달라지며 다음과 같은 단계를 거칩니다.

  • 기계 번역(MT) 결과물을 문장이나 단락 단위로 읽습니다.(즉 대상에서부터 시작합니다).
  • 기계 번역 출력물을 출처 텍스트와 비교합니다.
  • 포스트 에디터는 명시적인 지침에 따라 MT 결과물에 대한 빠른 품질 판단을 합니다.
  • MT 결과물이 양호하다면 텍스트 개선 작업으로 넘어갑니다.
  • MT 결과물의 품질이 좋지 않다면 MT 텍스트를 삭제하고 다시 번역합니다(위의 번역 과정과 같이).

인간 포스트 에디팅과 인간 번역

인간이 한 번역과 기계가 생성한 번역을 검토하는 과정에 적용되는 기술과 접근법에는 상당한 차이가 있습니다. 일반적으로 인간 번역에서 나타나는 오류는 기계 번역 텍스트에 나타나는 오류와 많이 다릅니다. 예로 숫자를 번역할 때에는 기계 번역이 더 정확한 편입니다. 또 기계 엔진은 내용을 누락할 가능성이 적습니다(예를 들어 긴 법조문을 번역할 때 구절 하나를 빠뜨리는 경우 등). 그러나 기계 번역은 어색한 문장을 생산하는 경우가 더 많습니다. 일부 MT 엔진은 또 전문 용어 번역 성능이 많이 부족할 수 있습니다.

한편 인간이 한 번역은 어감이 자연스럽고, 맥락과 의미의 오류가 적게 발생하는 대신 숫자 번역 오류가 더 많이 발생하는 편입니다. 인간 언어 전문가는 또 번역할 때 내용을 누락할 가능성이 더 높습니다. 일부 번역가는 모호한 의미를 더 명확하게 하려는 과정에서 내용을 추가하기도 합니다. 이는 어쨌든 원문에서 벗어나는 것입니다. Trusted Translations는 기계 번역 포스트 에디터를 교육해 이와 같은 차이점을 인지하고, 보유한 도구를 잘 활용하여 번역물을 개선할 수 있게 합니다. 포스트 에디터는 저희가 보유한 도구를 이용해 기계 번역 엔진이 미래 결과물을 스스로 개선할 수 있게 “교육”하는 방식으로 어색한 기계 번역문을 교정할 수 있습니다.

가벼운 포스트 에디팅과 완전 포스트 에디팅

Trusted Translations는 모든 상황에 획일적으로 적용되는 정답은 없다는 원칙을 늘 기억하며, 항상 새롭게 고객의 요구에 맞는 솔루션을 제공합니다.

번역 품질이 핵심이라면 번역 엔진의 예상 성능뿐만 아니라 결과물의 완성도에 맞는 감수 작업의 수준도 판단해야 합니다. 이 경우 해당 작업의 최종 결과물 완성을 위한 전체(출판 가능 수준) 포스트 에디팅을 요청합니다. 다시 말해서 2개 국어 텍스트가 추가 검토 단계(예: 교정 등)를 거친다면, 에디터가 기계 번역을 포스트 에디팅한 글과 모든 번역 과정을 100% 인간이 수행한(HT) 텍스트 사이에 차이점을 찾을 수 없을 정도여야 합니다.

비용 절감이 더 중요하거나 시간이 아주 부족하고 기계 번역 결과물이 양호하다면, 글의 흐름을 매끄럽게 하고 맞춤법 검사기로 눈에 띄는 문법 오류를 점검하며 전문 용어 사용을 개선하는 정도의 가벼운 포스트 에디팅을 추천할 수 있습니다.

포스트 에디팅과 사전 에디팅

포스트 에디팅은 사전 에디팅과 다릅니다. 사전 에디팅은 자동 번역 도구에 특정 텍스트를 입력하기 전의 단계를 의미합니다. 이는 콘텐츠의 기본적인 오류를 검토하고, 특정 콘텐츠를 반드시 특정 방식으로 번역하게 태그하며(또는 아예 번역하지 않을 부분을 태그함) 형식을 최적화하는 과정입니다. 번역 도구를 이용하기 전에 준비 과정을 거치면 결과물의 품질이 크게 개선되며, 이러한 과정은 대부분의 기계 번역이나 자동 번역 작업의 필수 단계로 알려져 있습니다.

효율적인 사전 에디팅 과정을 거치면 결과물이 비약적으로 개선되며, 포스트 에디터의 작업도 쉬워지고 뛰어난 품질의 번역역을 완성할 수 있습니다. 기계 번역 기술의 지속적인 개선과 함께 고품질의 번역문을 완성하려면 번역의 사전 에디팅과 포스트 에디팅 과정 모두에 필요한 인력 확보가 필수일 것입니다.