2010년 11월 22일 월요일

자동번역 기능 출시 1주년!

(이 블로그 내용은 구글코리아 공식 블로그에도 게재되었습니다.)

오늘이 바로 자동번역 기능을 출시한지 1주년 되는 날입니다! 2009년 11월 소수의 파트너 채널에 적용되었던 자동번역 기능을 곧 모든 유튜브 사용자들이 사용할 수 있게 됐습니다. 올 한 해 동안 양적인 면과 질적인 면 모두 지속적으로 향상된 온라인 동영상 자동번역 기능의 활약상을 살펴보겠습니다.

● 자동번역 기능이 적용된 동영상 시청 횟수 2천 3백만 이상 기록 및 자동 번역 기능을 직접 활용한 동영상 시청 횟수 7백 6십만 이상 기록

● 자동번역 타이밍 기술을 통해 수동으로 만든 자막 숫자 3배 증가

● 최근 음성 인식 알고리즘의 오류 20% 감소

자동번역 기능이 출시되기 전 유튜브에는 약 20만개의 동영상에 자막이 올라와 있었습니다. 수치상으로 많게 보이지만, 현재 유튜브에는 35시간 이상 분량의 동영상이 매 분마다 올라오고 있습니다. 유튜브는 전 세계 사용자들이 언어와 상관 없이 모든 동영상을 즐길 수 있기를 바라고 있습니다.

올 3월부터 지나치게 불분명한 음향이 아니라면 영어로 된 동영상에는 자막이 제공됐고, 유튜브 사용자들은 1년이 채 되지 않아 자동번역 기능이 적용된 동영상을 2천 3백만 번 이상 시청했습니다. 자막을 포함한 콘텐츠 수요는 여전히 굉장하고, 사용자들 스스로 이 기능을 활발히 사용하기 시작했는데요. 50여 개가 넘는 언어로 자동번역이 가능하기 때문에 이 기능을 사용해 7백 6십만 번이 넘게 동영상이 재생 되었습니다.

허나 자동번역 기능이 완벽할 수는 없기에 사용자 스스로 자막을 만들 수 있게끔 유튜브는 많은 노력을 기울여 왔습니다. 일년 전 즈음, 기존의 문서파일을 타임 코드와 함께 자막으로 변환할 수 있는 자동번역 타이밍 기능을 소개했는데요. 그 이후 이 기능을 유튜브 데이터 API(Application Program Interface)에 더해 이용자들이 한꺼번에 많은 스크립트를 자막으로 보다 쉽게 올릴 수 있게 됐습니다. 최근 들어서는 ‘유튜브 레디(YouTube Ready)’ 프로그램을 통해 전문 자막을 구할 수 있는 공간을 만들었습니다. 이러한 기능을 활용하는 사용자들 덕분에 유튜브 내 수동으로 만들어진 자막을 포함한 영상도 3배가 넘게 늘었습니다.

유튜브는 자막에 관해서 양적인 면뿐만 아니라 질적이 면 또한 신경 쓰고 있습니다. 자동번역 기능은 오늘날 출시 된지 1년을 맞이했으며 유튜브는 여전히 새로운 단어들을 더해가고 있습니다. 이를 테면 “스마트폰” 같은 단어 말이죠.

지난 몇 주 동안 자동번역 기능의 정확성 향상을 위한 음성 인식 기능 역시 괄목할 만한 성장을 보였습니다. 유튜브의 새로운 음성 인식 모델은 전반적으로 단어 오류를 약 20% 가량 줄여줬는데요. 영상마다 수치는 조금 다를 수 있겠지만, 약 50% 가량 단어 수정이 이뤄졌던 영상은 현재 60% 정도, 75% 정도 인식했던 영상은 80% 가량으로 수치가 개선됐습니다.

유튜브는 지속적으로 자막의 정확성을 키우기 위해 노력할 것이고, 자동번역 기능이 유튜브를 비롯해 여러분의 인터넷 TV, 컴퓨터, 휴대폰 등 어디서든 사용이 가능했으면 바랍니다.

지금 바로 유튜브 자동번역 기능을 사용해보세요!

유튜브 자동번역팀 드림