유튜브, '초상 탐지' 할리우드 전면 확대 — Content ID 방식으로 셀럽 딥페이크 자동 탐지·삭제, CAA·UTA·WME 3대 에이전시 참여

2026년 4월 21일, 유튜브는 AI 딥페이크로부터 유명인의 초상을 보호하는 '초상 탐지(Likeness Detection)' 기술을 엔터테인먼트 산업 전체로 확대한다고 공식 발표했습니다. 이 기술은 유튜브의 기존 Content ID 시스템과 동일한 원리로 작동합니다. Content ID가 저작권 보호 음악이나 영상의 무단 사용을 자동 탐지하듯, 초상 탐지는 업로드된 영상에서 등록된 인물의 AI 생성 얼굴 — 즉 딥페이크 — 을 자동으로 스캔합니다. 할리우드 3대 에이전시인 CAA, UTA, WME와 매니지먼트 회사 Untitled가 참여를 확정했으며, 탤런트는 자체 유튜브 채널이 없어도 이 도구에 등록할 수 있습니다. 2024년 말 CAA와의 파일럿 프로그램으로 시작된 이 기술이 어떻게 딥페이크 탐지·방어의 새로운 표준을 세우고 있는지, 그리고 어떤 한계가 남아 있는지를 분석합니다.
Content ID의 진화: 저작권에서 초상권으로
유튜브의 Content ID는 2007년 도입 이후 18년간 음악·영상 저작권 보호의 핵심 인프라로 자리잡았습니다. 권리자가 원본 콘텐츠를 등록하면 유튜브에 업로드되는 모든 영상을 자동 스캔해 일치하는 부분을 찾아내고, 권리자에게 삭제·수익화·추적 중 선택권을 부여합니다. 2025년 기준 Content ID에는 1억 개 이상의 참조 파일이 등록되어 있으며, 매일 수백만 건의 콘텐츠를 검사합니다. 이 검증된 대규모 매칭 시스템의 원리를 '얼굴'에 적용한 것이 바로 초상 탐지입니다.
초상 탐지의 작동 방식은 다음과 같습니다. 등록된 탤런트의 얼굴 데이터를 참조 모델로 삼아, 유튜브에 새로 업로드되는 영상을 실시간으로 스캔합니다. AI가 해당 영상 속 얼굴이 등록된 인물의 얼굴과 일치하는 AI 생성물(딥페이크)인지를 판별합니다. 딥페이크가 탐지되면 해당 탤런트 또는 에이전시에 알림이 전송되고, 세 가지 대응 옵션이 주어집니다: (1) 프라이버시 정책 위반을 사유로 영상 삭제 요청, (2) 저작권 침해 삭제 요청, (3) 조치하지 않음. 이 시스템의 핵심 강점은 피해자가 직접 딥페이크를 찾아 헤맬 필요 없이 플랫폼이 자동으로 탐지해 알려준다는 점입니다.
할리우드 3대 에이전시의 참여: CAA·UTA·WME가 합류한 이유
이번 확대의 가장 주목할 점은 할리우드 3대 탤런트 에이전시 — CAA(Creative Artists Agency), UTA(United Talent Agency), WME(William Morris Endeavor) — 가 모두 참여했다는 것입니다. 여기에 매니지먼트 회사 Untitled도 합류했습니다. 이 네 회사는 할리우드 주요 배우, 감독, 프로듀서의 대다수를 대리하고 있어, 사실상 엔터테인먼트 산업의 주요 인물 대부분이 초상 탐지 등록 대상이 될 수 있습니다. 유튜브는 2024년 말 CAA와 단독으로 파일럿 프로그램을 진행하면서 기술을 검증하고 피드백을 반영해 시스템을 개선한 뒤, 2026년 4월 산업 전체로 확대한 것입니다.
에이전시들이 적극 합류한 배경에는 딥페이크 피해의 급증이 있습니다. 2025년 한 해 동안 유명인을 대상으로 한 딥페이크 영상은 전년 대비 300% 이상 증가했다는 보고가 있습니다. 특히 여성 배우와 가수를 대상으로 한 성적 딥페이크가 심각한 문제로 대두됐습니다. 기존에는 피해자 측이 일일이 딥페이크를 찾아서 플랫폼에 삭제를 요청해야 했고, 이 과정은 느리고 소모적이었습니다. 초상 탐지 시스템은 이 '탐지 부담'을 피해자로부터 플랫폼으로 이전시킨다는 점에서 구조적 전환을 의미합니다. CAA의 한 관계자는 '이전에는 고객이 피해를 입은 뒤 대응하는 수밖에 없었지만, 이제는 플랫폼이 선제적으로 탐지해준다'고 평가했습니다.
기술적 한계와 남은 과제: 패러디 예외·음성 미지원·플랫폼 종속
초상 탐지가 획기적 진전임에는 분명하지만, 한계도 명확합니다. 첫째, 유튜브는 패러디와 풍자 콘텐츠를 정책상 허용하기 때문에 모든 딥페이크가 삭제 대상은 아닙니다. 이 구분은 현실적으로 쉽지 않습니다. 어디까지가 '풍자'이고 어디부터가 '명예훼손' 또는 '성적 착취'인지의 경계는 사람마다 다를 수 있고, 자동화된 시스템이 이를 완벽히 판단하기는 어렵습니다. 결국 최종 판단은 인간 검토자의 몫이 될 가능성이 높으며, 이는 처리 속도의 병목이 될 수 있습니다.
둘째, 현재 초상 탐지는 시각(얼굴) 매칭만 지원하며 음성 탐지는 아직 구현되지 않았습니다. 유튜브는 '향후 음성 탐지도 지원할 계획'이라고 밝혔지만 구체적 일정은 없습니다. 최근 급증하고 있는 AI 음성 딥페이크 — 유명인의 목소리를 복제해 가짜 발언이나 노래를 만드는 사례 — 에는 아직 대응할 수 없다는 뜻입니다. 특히 음악 산업에서는 아티스트의 목소리를 AI로 복제한 가짜 음원이 스트리밍 플랫폼에 올라오는 사례가 2025년 37만 건을 기록했고, 이 문제에 대한 기술적 해법이 시급합니다.
셋째, 이 기술은 유튜브라는 단일 플랫폼에 한정됩니다. 딥페이크는 텔레그램, 엑스(X), 틱톡, 레딧, 디스코드, 각종 성인 사이트 등 수많은 플랫폼에 동시에 유포됩니다. 유튜브에서 딥페이크가 제거되더라도 다른 플랫폼에서의 유통은 별도 문제입니다. 결국 산업 전체의 통합적인 탐지·제거 메커니즘이 필요하다는 지적이 나옵니다. 이 점에서 C2PA(Coalition for Content Provenance and Authenticity)와 같은 범산업적 콘텐츠 출처 인증 표준과 유튜브의 초상 탐지가 연동되어야 한다는 목소리가 커지고 있습니다.
딥페이크 탐지 기술의 새로운 지형: 유튜브 이후
유튜브의 초상 탐지는 단순한 기술 업데이트를 넘어 딥페이크 탐지 생태계의 방향 전환을 상징합니다. 기존의 딥페이크 탐지는 주로 '사후 분석' 방식이었습니다 — 이미 유포된 콘텐츠를 분석해 딥페이크 여부를 판별하는 것. 유튜브의 접근법은 이를 '사전 스캔' 모델로 전환합니다. 콘텐츠가 업로드되는 시점에서 자동으로 탐지하고, 등록된 당사자에게 즉시 알려 대응할 수 있게 하는 것입니다. 이 패러다임의 전환은 플랫폼 규모의 인프라가 뒷받침되어야만 가능합니다.
이와 동시에 2026년 4월 현재, 구글 딥마인드의 SynthID(AI 생성 콘텐츠에 비가시 워터마크를 삽입하는 기술, 압축·자르기·스크린샷 후에도 98% 탐지율), ASU의 분산형 워터마크(딥페이크를 특정 AI 모델까지 역추적), EU AI법 제50조 AI 생성물 워터마크 의무화(2026년 8월 시행) 등 복수의 기술·규제 축이 동시에 움직이고 있습니다. 유튜브의 초상 탐지는 이 지형도에서 '플랫폼 주도 사전 탐지'라는 축을 확립한 것입니다. 문제는 이 다양한 방어선이 서로 연동되어 빈틈 없는 체계를 구축할 수 있느냐에 달려 있습니다. 유튜브 한 곳에서의 성공이 다른 플랫폼으로 확산되지 않는다면, 딥페이크 제작자는 단순히 유통 채널만 바꾸면 됩니다. 초상 탐지의 진정한 시험대는 기술 자체가 아니라, 이 기술이 산업 표준으로 자리잡을 수 있느냐입니다.
참고 자료 / References
- YouTube expands its AI likeness detection technology to celebrities — TechCrunch
- Expanding likeness detection to the entertainment industry — YouTube Official Blog
- YouTube Opens Up AI Deepfake Detection Tool to All of Hollywood — The Hollywood Reporter
- YouTube Extends AI Deepfake Detection Tool to Entertainment Industry — The AI Insider