작성자: 크리스토스 굿로, 유튜브 엔지니어링 부사장
유튜브의 추천 시스템이 잘 작동할 때, 전 세계 수십억 명의 사용자에게 재미있고 교육적이며 영감을 주는 콘텐츠를 제공합니다. 제게는 오늘날 기술이 직면하고 있는 윤리적 문제를 탐구하는 강의나 어릴 때 봤던 서던캘리포니아 대학의 미식축구 경기 하이라이트 그렇습니다. 제 큰딸의 경우 브이로그브라더스(Vlogbrothers)의 영상을 보며 함께 웃고 커뮤니티에서 활동하기도 합니다. 큰아들은 추천 시스템을 통해 알게 된 3블루1브라운(3Blue1Brown)의 애니메이션 설명을 통해 선형대수학을 더 잘 이해할 수 있었으며, KSI 영상을 보며 휴식을 취했습니다.
제 가족의 경우에서 알 수 있듯이 거의 모든 동영상에는 적합한 시청자가 존재하며, 추천 시스템의 역할은 바로 이러한 시청자를 찾는 것입니다. 사서의 도움 없이 방대한 도서관에서 모든 도서를 찾는 것이 얼마나 어려울지 생각해 보세요. 맞춤 동영상은 채널 구독이나 검색보다 전체 유튜브 시청률의 훨씬 더 많은 부분을 차지합니다. 저는 10년 넘게 유튜브에서 추천 시스템을 구축해온 사람으로서 맞춤 동영상이 모든 사용자의 유튜브 경험에 없어서는 안 될 부분이 되었다는 데 자부심을 느낍니다. 하지만 맞춤 동영상을 신비한 블랙박스처럼 여기는 경우가 많습니다. 이에 추천 시스템이 어떻게 작동하고, 어떻게 발전해왔으며, 그리고 왜 저희가 책임감 있는 맞춤 동영상을 제공하는 것에 최우선 순위를 두고 있는지에 대한 이유를 설명해 드리려고 합니다.
유튜브 추천 시스템은 모든 사람이 각자의 시청 습관을 가지고 있다는 것에서 출발합니다. 그리고 사용자와 유사한 다른 사용자들의 시청 습관을 비교하여 이를 활용해 사용자가 시청하고 싶어할 만한 다른
콘텐츠를 추천합니다. 만약 여러분이 테니스 동영상을 좋아하는 경우, 재즈
동영상을 한 번도 시청한 적이 없더라도 시스템에서 동일한 테니스 동영상을 좋아하는 다른 사용자가 재즈 동영상도 즐겨 보는 것을 인식한다면 여러분에게
재즈 동영상을 추천할 수 있습니다(뉴스 및 정보 등의 카테고리에서는 이 기능이 다르게 작동할 수 있으며
관련 내용은 추후 자세히 다룰 예정입니다). 몇 년 전 유튜브 추천 시스템이 제 큰딸에게 타일러 오클리(Tyler Oakley)의
동영상을 추천했는데, 당시 브이로그브라더스를 시청한 많은 사용자가 해당 동영상을 시청했기 때문입니다. 나중에 제 딸은 타일러 오클리의 팬미팅에도 참석할 정도로 열성 팬이 되었습니다.
현재 유튜브 시스템은 수십억 개의 동영상을 분류하여 사용자의 특정 관심분야에 맞는 콘텐츠를 추천합니다. 예를 들어 제가 오래된 USC 미식축구 하이라이트를 시청하자 추천
시스템에서 이를 인식하고 그 당시의 다른 스포츠 하이라이트를 찾아줬습니다. 맞춤 동영상이 아니었다면
이러한 동영상이 있는지조차 몰랐을 것입니다. 다른 플랫폼과 달리 유튜브는 소셜 네트워크를 통해 시청자와
콘텐츠를 연결하지 않습니다. 유튜브 추천 시스템의 성공 여부는 사용자가 시청하기를 원하는 동영상을 정확히
예측하는 데 달려 있습니다.
그렇지만 이러한 정보를 유튜브와 공유하기를 원하지 않는 사용자도 있습니다. 그래서
데이터를 얼마나 제공할지 결정할 수 있는 제어 기능을 마련했습니다. 사용자는 언제든지 유튜브 검색 및 시청 기록을 일시 중지하거나 수정, 삭제할
수 있습니다.
- 클릭수: 동영상 클릭은 해당 동영상이 만족스럽다는 강력한 표현입니다. 시청하고 싶지 않은 콘텐츠를 클릭하지는 않을 것이기 때문입니다.
하지만 2011년, 저희는 동영상을 클릭했다고 해서 실제로 시청했다는 의미는 아니라는 점을 알게 되었습니다. 그 해의 윔블던 경기 하이라이트를 검색했다고 가정해 보겠습니다. 페이지를 스크롤하다 경기 장면을 보여준다는 내용의 썸네일과 제목을 사용한 영상 중 하나를 클릭합니다. 그렇지만 한 사람이 침실에서 경기에 대해 이야기하는 동영상이었습니다. 다음 동영상 패널에서 시스템이 추천한 동영상을 클릭했지만 다른 팬이 경기에 대해 말하는 영상이었습니다. 여러 동영상을 계속하여 클릭한 끝에 마침내 시청하고 싶은 경기 영상이 포함된 동영상을 추천받습니다. 이러한 점을 반영하여 2012년에 시청 시간을 신호에 추가했습니다.
- 시청 시간: 어떤 동영상을 얼마나 오랫동안 시청했는지를 나타내는 시청 시간은 시청할 가능성이 가장 높은 콘텐츠에 대한 개인화된 신호를 시스템에 제공합니다. 따라서 테니스 팬이 윔블던 하이라이트 클립을 20분간 시청한 반면 경기 분석 동영상은 몇 초만 봤다면, 사용자가 하이라이트 동영상을 시청하는 것을 더 가치 있게 여긴다고 생각할 수 있습니다.
처음 시청 시간을 추천 시스템에 포함한 직후에는 조회수가 20% 감소했습니다. 하지만 저희는 시청자에게 보다 큰 가치를 전달하는 것이 더 중요하다고 확인했습니다. 하지만 시청 시간이라고 해서 모두 동일한 가치를 지니지는 않습니다. 저는 가끔 새로운 언어를 배우거나 요리법 영상을 보는 대신, 밤 늦게까지 깨어 아무 동영상이나 시청합니다. 유튜브는 사용자가 동영상을 보는 데 쓴 시간을 후회하지 않기를 바랍니다. 따라서 유튜브에서 보내는 시간을 통해 얻는 가치를 측정해야 한다는 결론을 내렸습니다.
- 설문조사 답변: 사용자가 시청한 콘텐츠에 만족하는지 확인하기 위해 가치 있다고 판단되는 동영상을 시청하는 데 쓴 시간, 즉 '가치 있는 시청 시간'을 측정하고 있습니다. 사용자 설문조사를 통해 시청한 동영상을 별 1개에서 5개로 평가하도록 요청하고 있으며 이 측정항목을 통해 콘텐츠가 얼마나 만족스러웠는지 파악하고 있습니다. 별 1~2개로 평가한 영상의 경우 낮은 평점을 준 이유를 묻습니다. 마찬가지로 동영상에 별 4~5개의 평점을 주면 이유, 즉 영감을 받았거나 의미가 있었는지를 물어봅니다. 별표 4~5개로 평가한 동영상만 가치 있는 시청 시간으로 집계됩니다.
물론, 모든 사용자가 시청한 모든 동영상에 대한 설문조사에 응하지는 않습니다. 유튜브는 확보한 설문조사 답변을 바탕으로, 모든 사용자의 잠재적인 답변을 예측하기 위해 머신러닝 모델을 학습시켰습니다. 이러한 예측 정확성을 테스트하기 위해 일부 설문조사 답변은 의도적으로 학습을 보류합니다. 이렇게 하면 항상 시스템에서 실제 답변을 얼마나 정확하게 예측하는지를 모니터링할 수 있습니다.
- 공유, 좋아요, 싫어요: 일반적으로 자신이 공유하거나 좋아요 표시한 동영상에 더 만족감을 느낄 가능성이 높습니다. 이 정보를 사용해 이후 동영상을 공유하거나 좋아요 표시할 가능성을 예측합니다. 동영상에 싫어요를 표시한다면 즐겨 시청하는 콘텐츠가 아닐 가능성이 높다는 신호입니다.
맞춤 동영상과 마찬가지로 각 신호의 중요도는 사용자에 따라 다릅니다. 별표 1~2개로 평가한 동영상을 포함해 어떤 동영상이든 시청하면 공유하는 사용자라면 시스템에서 콘텐츠를 추천할 때 공유에 큰 비중을 두지 않습니다. 이 때문에 유튜브 시스템은 정해진 공식을 따르기보다는 시청 습관의 변화에 따라 역동적으로 발전합니다.
기술 플랫폼이 정책 위반 경계선상에 있는 콘텐츠 시청에 미치는 영향을 다루는 독립 연구가 늘고 있습니다. 아직 진행 중인 연구도 많지만 최근 발표된 논문에서는 유튜브 추천 시스템이 실제로 시청자를 극단적인 콘텐츠로 유도하지 않는다는 결론을 내리고 있습니다. 오히려 유튜브 뉴스 및 정치 관련 콘텐츠 이용에는 온라인 습관에서 볼 수 있는 개인적 취향이 더 반영됩니다.