YouTube Korea Blog: 유튜브의 정책 개발에 관하여 - 유튜브 커뮤니티 가이드 개발에 대한 질문과 답변

유튜브는 초창기부터 커뮤니티 가이드를 통해 유튜브 플랫폼에서 무엇이 허용되는지를 수립해 왔습니다. 유튜브의 교통법규라고 할 수 있는 이러한 가이드는 창의적인 표현의 장을 여는 동시에 유해한 콘텐츠로부터 유튜브 커뮤니티 전체를 보호하고 있습니다. 새로운 의견을 표출하고 다양한 생각을 나눌 수 있는 환경을 마련하기 위해서는 이와 같은 균형이 필수적입니다. 광고 파트너들은 기본적으로 유해한 콘텐츠와 연결되는 것을 원하지 않기 때문에 이는 비즈니스 차원에서 유튜브의 장기적인 성공을 보장하기 위해서도 반드시 필요한 부분입니다.

유튜브에서 이러한 가이드를 어떻게 설정하는지, 새로운 정책을 개발하고 시행하기까지 오랜 시간이 걸리는 이유는 무엇인지에 대한 질문이 주기적으로 제기되어 왔습니다 (책임을 다하기 위한 유튜브의 노력에 관한 상세한 이야기는 이곳을 참고하세요). 이 블로그에서는 유튜브가 정책을 어떻게 개발하고, 어떤 절차를 거쳐 시행하는지 더욱 자세히 알려드리고자 합니다.

정책에 업데이트가 필요한 부분은 어떻게 판단하나요?

급변하는 세상에 발맞춰 유튜브의 정책도 변화해야 합니다. 시민 사회를 운영하는 법이 그렇듯, 유튜브의 정책도 플랫폼 안팎에서 일어나는 변화를 반영할 수 있도록 주기적인 검토를 거칩니다. 물론 유튜브 플랫폼에는 가이드를 준수하는 콘텐츠가 대부분이지만, 혹시 모를 위반에 대비해 경계를 늦추지 않으며 정책의 빈틈을 노리는 새로운 위험 요소가 있는지 살피고 있습니다.

현재 상황에 맞춰 정책을 발전시키는 과정에서 유튜브가 길잡이로 삼는 한 가지 주요 목표는 심각한 수준의 실제적인 위험을 방지하는 것입니다. 이것은 유튜브에서 불쾌감을 주는 모든 콘텐츠를 삭제하겠다는 의미는 아닙니다. 유튜브는 열린 토론과 표현의 자유가 사회적으로 더 나은 결과를 가져온다고 믿습니다. 하지만 유튜브 이용자나 플랫폼에 심각한 피해를 끼칠 수 있는 콘텐츠에 대해서는 신중한 기준을 적용하고 있습니다.

여기서 말하는 심각한 피해에는 물리적인 상해도 포함됩니다. 예를 들어 5G 기술이 코로나19 확산과 관련이 있다는 주장이 제기됨에 따라 영국 전역에서 휴대폰 기지국 파손 행위가 잇따르자 유튜브는 이와 같은 주장을 발빠르게 금지 조치했습니다. 민주주의 제도에 대한 심각한 위해 행위도 고려 대상입니다. 유튜브에서 투표 시간, 장소, 자격요건에 관한 잘못된 정보를 조장하는 등 투표와 관련해 사람들을 호도하는 주장을 금지한 것도 그러한 이유 때문입니다.

유튜브는 정책 검토 과정에서 NGO와 학술 단체는 물론 세계 각국에 있는 다양한 분야의 전문가와 긴밀하게 협력합니다. 각 단체와 전문가는 새로운 우려사항을 제기하거나 계속 달라질 가능성이 있는 복잡한 주제에 대한 심도 있는 이해를 돕습니다. 예를 들어, 팬데믹이 발발한 당시 유튜브는 질병통제예방센터(Center for Disease Control), 세계보건기구 등의 보건 당국과 함께 코로나19와 관련된 잘못된 정보에 대한 정책을 수립했습니다. 이후 보건 당국의 지침이 마스크 착용과 사회적 거리두기 제한을 완화하는 방향으로 전환되자 유튜브에서도 이에 따라 마스크와 사회적 거리두기의 효과에 의문을 제기하는 콘텐츠에 관한 정책을 업데이트했습니다.

어떤 '기준'이 필요한지는 어떻게 판단하나요?

정책 업데이트가 필요한 영역이 발견되면 유튜브 트러스트 & 세이프티(Trust & Safety)팀이 알맞은 솔루션을 개발합니다. 먼저, 해당 유형의 유해한 콘텐츠가 유튜브에서 얼마나 많이 발견되는지, 앞으로 그 양이 늘어날 가능성이 있는지, 그리고 현재 커뮤니티 가이드하에서 어떻게 관리되고 있는지 등을 점검해 평가합니다.

그 후에는 수십, 수백 개의 동영상을 살펴보면서 다양한 정책 기준이 미칠 영향을 파악합니다. 한 편의 동영상만 고려해 정책 기준을 세우는 경우는 없습니다. 새로운 가이드라인으로 인해 삭제될 동영상과 유지될 동영상까지 모든 동영상에 미치게 될 영향을 고민해 결정합니다. 이와 같은 포괄적인 검토를 거쳐 정책 기준에 대한 다양한 선택지를 공유하고, 삭제와 승인은 물론 연령 제한 등 여러 시정 조치가 적용될 동영상의 사례를 자세히 살펴봅니다.

후보로 나온 여러 선택지 중 가장 알맞은 것이 선정되면 평가의 다음 단계로 넘어갑니다. 이 단계에서는 해당 제안이 아래와 같은 핵심 목표를 의미 있게 달성할 수 있는지 여부를 따져봅니다.

표현의 자유에 대한 균형을 유지하는 동시에 실제로 발생 가능한 심각한 피해를 줄일 수 있어야 합니다.
전 세계 수천 명의 콘텐츠 검토자가 정책을 일관되게 시행할 수 있어야 합니다.

이와 같은 목표를 달성할 수 있다고 판단되면 각 부서의 책임자들로 구성된 경영진이 해당 제안을 검토합니다. 최종 결재는 유튜브의 최고 제품 책임자(CPO)와 CEO를 비롯한 최고 경영진 선에서 이루어집니다. 어느 시점이든 결정된 정책 기준에 대한 팀 간 합의가 계속 이루어지지 않으면 정책 논의 단계부터 다시 시작합니다.

정책 개발 및 시행에는 누가 참여하나요?

정책 개발의 전 과정에 걸쳐 유튜브는 증오심 표현 또는 괴롭힘 등의 주제와 관련해 다양한 제3자 전문가와 긴밀하게 협력합니다. 폭력적 극단주의와 아동 보호 같은 다른 중요한 문제에 대해서는 여러 정부 기관과 협력하고 있습니다.

전문가들은 전 세계에서 일어나는 각종 사건이 어떻게 유튜브 플랫폼 내 유해한 콘텐츠 확산을 촉발시키는지 예측하는 데 도움을 줍니다. 예를 들어, 악의적인 행위자의 공격이 일어날 수 있는 유튜브 시스템의 빈틈을 찾거나 새로운 업데이트를 추천해 주기도 합니다. 또한 코로나19처럼 지침이 수시로 바뀔 수 있는 상황에서는 유튜브가 정책을 적절히 조정할 수 있도록 필요한 정보를 제공합니다.

이러한 파트너십은 지역 문제와 관련된 정책 시행을 지원하는 데에도 특히 중요합니다. 콘텐츠의 맥락을 제대로 파악하려면 언어나 문화적 전문 지식이 필요한 경우가 많기 때문입니다. 예를 들어 2021년 미얀마에 쿠데타가 일어났을 당시, 유튜브는 전문가들과 긴밀하게 협력해 민족, 종교적 차이에 따른 증오와 폭력을 선동하는 언사를 사용하는 일부 사례를 파악했습니다. 그 덕분에 플랫폼에서 정책 위반 콘텐츠를 신속하게 삭제할 수 있었습니다.

유튜브는 새롭게 생겨나는 문제에 발빠르게 대처하고 있나요?

많은 사람들은 콘텐츠 검토는 그 특성상 사후 대응 방식일 수 밖에 없고, 유튜브 시스템이나 사용자 차원의 신고가 있을 때만 콘텐츠가 게시 중단된다고 생각합니다. 그러나 유튜브의 대응 노력 대부분은 미래에 초점을 맞추고 있습니다. 새롭게 떠오르는 문제가 유튜브 플랫폼에 도달하거나 플랫폼 내에서 확산되기 전에 내부 팀에서 발견할 수 있도록 설계된 세부적인 절차가 마련되어 있습니다.

문제를 가시화하는 중요한 임무는 유튜브 트러스트 & 세이프티(Trust & Safety) 부서에 속한 인텔리전스 데스크팀에서 주관하고 있습니다. 팀의 전문 분석가들은 잘못된 정보 및 인터넷 위험 요소의 새로운 국면이 있는지 등을 포함해 정책을 위반할 가능성이 있는 흐름을 파악하고, 이러한 문제가 어떤 위험으로 이어질 수 있는지를 파악합니다. 뿐만 아니라 극단주의 음모론 같은 지속적인 위협을 주기적으로 모니터링하여 이러한 정보의 미디어 확산을 추적하고, 시간이 지나면서 어떻게 변화하는지 평가하기도 합니다.

이를 통해 현재와 미래의 정책이 새로운 위협을 어떻게 관리할 수 있을지에 관한 인사이트를 얻을 수 있습니다. 예를 들어, 유튜브에서는 인텔리전스 데스크팀에서 수집한 정보를 바탕으로 플랫폼에서 유해한 음모론에 보다 잘 대처할 수 있도록 증오심 표현 및 괴롭힘 정책을 업데이트하기도 했습니다.

유튜브는 정책이 일관적으로 시행되도록 어떤 노력을 기울이나요?

새로운 정책을 시행하는 것은 사람과 머신러닝 기술을 활용한 공동의 노력이 필요한 일입니다. 실제로 정책을 성공적으로 도입하고 시행하려면 사람과 시스템이 콘텐츠 검토 과정에서 협력해야 높은 수준의 정확성을 꾸준히 유지할 수 있습니다.

먼저 유튜브는 가장 경험이 많은 콘텐츠 검토자들로 구성된 팀에 정책 시행 가이드라인, 즉 정책 위반 콘텐츠에 대한 자세한 정의를 제공하고 이를 기반으로 위반되는 콘텐츠와 그렇지 않은 콘텐츠를 구분해 줄 것을 요청합니다. 해당 팀이 새로운 가이드라인으로 매우 높은 정확도를 달성한다면 서로 다른 배경과 언어, 경험 수준을 가진 수백 명의 검토자로 테스트 집단을 확대합니다.

이 시점에서 유튜브는 더 다양하고 많은 검토자들이 정확하게 해석할 수 있도록 가이드라인을 수정하기 시작합니다. 이 과정은 몇 달 이상 소요될 수 있으며 테스트 집단이 유사한 수준의 높은 정확성에 도달해야만 완료됩니다. 이렇게 얻은 결과는 정책 위반 가능성이 있는 콘텐츠를 대규모로 감지할 수 있도록 머신러닝 기술을 학습시키는 데 사용됩니다. 콘텐츠 검토자와 마찬가지로 이 머신러닝 모델을 테스트하여 사람의 검토가 필요한 콘텐츠를 정확하게 가려내기에 충분한 맥락을 제공했는지 파악합니다.

테스트 기간을 마치면 새로운 정책이 도입되며, 이후 몇 달간 지속적으로 세부적인 조정 사항을 적용합니다. 유튜브 트러스트 & 세이프티(Trust & Safety)팀의 리더들은 매주 콘텐츠 검토팀 관리를 담당하는 전 세계의 품질보증팀 리더들과 만나 결정이 어려운 문제를 논의하고 정책이 잘 시행되고 있는지 검토합니다. 필요하다면 정책의 빈틈을 해결하거나 예외 상황에 대한 명확성을 더하기 위해 가이드라인 변경 초안을 마련합니다.

유튜브 정책 시행을 위한 사람과 시스템 간의 협업은 어떻게 이루어지나요?

학습을 통해 정책 위반 가능성이 있는 콘텐츠를 식별할 수 있는 머신러닝 모델을 갖추었더라도 콘텐츠 검토자는 정책 시행 과정에서 여전히 중요한 역할을 합니다. 머신러닝이 정책 위반 가능성이 있는 콘텐츠를 대규모로 식별하여 유튜브 커뮤니티 가이드를 위반하는 것으로 보이는 검토 대상 콘텐츠를 선정하면 콘텐츠 검토자가 개입하여 해당 콘텐츠의 삭제를 승인하거나 거부합니다.

이와 같은 협력적 접근 방식은 콘텐츠 검토자의 피드백을 기반으로 모델을 지속적으로 학습시키고 조정하는 데 도움이 되므로 모델의 정확도가 점점 높아집니다. 유튜브의 정책 시행 시스템은 유튜브에 업로드되는 분당 500시간 이상의 엄청난 양의 콘텐츠를 관리하는 동시에 미묘한 차이까지 고려해 정책 위반 콘텐츠를 가려낼 수 있다는 의미이기도 합니다.

예를 들어, 뉘른베르크 전당대회에서의 히틀러 연설은 추가적인 맥락이 없다면 유튜브의 증오심 표현 정책에 위배될 수 있습니다. 하지만 이 연설이 나치의 행보를 비판하는 다큐멘터리에 포함되어 있다면 유튜브의 EDSA(교육, 다큐멘터리, 과학, 예술) 가이드라인에 의해 허용될 가능성이 높습니다. EDSA 가이드라인은 교육 동영상이나 역사 다큐멘터리처럼 정책 위반 가능성이 있는 자료도 충분한 맥락의 포함 여부를 고려해 콘텐츠에 사용될 수 있도록 허용합니다.

이와 같은 차이는 모델이 식별하기에는 다소 어려울 수 있지만 콘텐츠 검토자는 추가적인 맥락을 더 쉽게 파악할 수 있습니다. 이것이 기본적으로 정책 시행 책임을 사람과 시스템이 함께 분담하는 이유이자, 사람의 판단이 항상 중요한 부분을 차지하는 이유입니다. 유튜브에서 정책 위반 가능성이 높은 대부분의 콘텐츠 카테고리에 대해 모델은 검토가 필요한 콘텐츠를 지정하여 콘텐츠 검토자에게 알리는 역할을 하고 조치는 그 이후에 취해집니다.

유튜브는 이러한 과정들의 성과를 어떻게 평가하나요?

유튜브는 커뮤니티 가이드를 지속적으로 준수하는 동시에, 새로운 목소리와 커뮤니티가 유튜브에서 뜻을 펼칠 수 있도록 돕는다는 사명을 발전시키기 위해 최선을 다하고 있습니다. 특정한 측정항목으로 이러한 성과를 정의하기는 어렵지만, 유튜브는 이해관계자와 커뮤니티 구성원들이 유튜브의 개선 방안에 대해 제시하는 의견을 경청하며 시스템과 절차를 더욱 투명하게 운영할 수 있도록 지속적인 노력을 기울입니다. 이 블로그도 그러한 노력의 일환입니다.

정책 시행의 효과를 측정하기 위해 유튜브는 위반 조회율이라는 측정항목을 마련하여 유튜브 플랫폼에서 정책 위반 자료의 조회수가 얼마나 되는지 살펴보고 있습니다. 올해 7월부터 9월까지의 위반 조회율은 0.10%~0.11%였습니다. 즉, 조회수 10,000회당 10~11회가 커뮤니티 가이드를 위반하는 콘텐츠의 조회수였던 셈입니다.

삭제된 동영상에 대해 유튜브의 모든 크리에이터가 제출할 수 있는 이의신청 수도 추적하고 있습니다. 이는 시스템의 정확성을 더욱 확실히 파악하는 데 도움이 됩니다. 예를 들어 올해 7월부터 9월까지 커뮤니티 가이드 위반으로 삭제된 동영상은 560만 개가 넘었고, 유튜브에 접수된 이의신청은 약 271,000건이었습니다. 이러한 이의신청 중 유튜브의 검토를 거쳐 복원된 콘텐츠는 약 29,000개입니다.

이의신청, 복원, 위반 조회율 등의 측정항목이 일관성이나 정확성을 이해하기에 완벽한 솔루션이 되는 것은 아니지만, 지속적으로 성공의 기준을 세우는 데 중요한 역할을 합니다.

커뮤니티 가이드는 '언어'와 '표현'에 관한 것이고, 이 두 가지는 시간이 지나면서 변화하는 특성을 지니고 있습니다. 변화하는 환경 속에서 유튜브는 정책 기준이 시대에 알맞은지 계속해서 주기적으로 검토할 것입니다. 또한, 유튜브 커뮤니티가 이에 대해 보다 잘 이해할 수 있도록 앞으로 이러한 업데이트 과정에 대해 자세히 공유할 예정입니다.

작성자: 매트 핼프린(Matt Halprin), 유튜브 글로벌 트러스트 & 세이프티(Trust & Safety) 총괄 부사장 및 제니퍼 플래너리 오코너(Jennifer Flannery O'Connor), 유튜브 프로덕트 매니지먼트 부사장

2022년 12월 2일 금요일

유튜브의 정책 개발에 관하여 - 유튜브 커뮤니티 가이드 개발에 대한 질문과 답변

정책에 업데이트가 필요한 부분은 어떻게 판단하나요?

어떤 '기준'이 필요한지는 어떻게 판단하나요?