유튜브 건강 콘텐츠, AI가 ‘평가’하는 시대가 오나?

전문가 대신 AI가 영상 품질을 판단할 수 있다는 연구가 나왔다


유튜브에서 건강·의료 정보를 다루는 콘텐츠는 단순한 정보 전달을 넘어서, 시청자의 건강과 직결될 수 있는 민감한 영역이다. 이런 맥락에서 최근 흥미로운 연구가 발표되었다. AI가 건강 관련 유튜브 영상의 ‘품질’을 평가할 수 있을지를 실험한 것이다.

놀랍게도 일부 대형 언어 모델(LLM)은 의료 전문가의 기준과 높은 일치도를 보였으며, 향후 유튜브 알고리즘에 적용될 가능성까지 제시되었다.


유튜브는 콘텐츠보다 ‘신뢰도’를 더 중요시하는 흐름이다

최근 유튜브는 건강 정보에 한해 일반 콘텐츠보다 훨씬 엄격한 정책을 적용하고 있다. 단순히 조회수나 시청시간이 아니라 정보의 출처, 균형성, 정확성을 중심으로 평가하는 방향으로 움직이고 있다.

크리에이터들이 느끼는 변화는 다음과 같다:

  • 출처가 불분명하거나 오해의 소지가 있는 경우” 수익 창출에 영향을 미친다
  • 특정 치료법을 단정적으로 말하면 영상이 노출에서 제외되거나 노란딱지가 붙는다 (암치료의 경우 특히)

이는 단순한 운영 방침이 아니라, 유튜브가 정보 플랫폼으로서의 책임감을 강화하고 있다는 신호다.


연구는 어떻게 진행됐나?

이번 연구는 미국 매사추세츠대학교 애머스트 캠퍼스 소속 연구진이 수행했으며, 국제 학술지인 Scientific Reports에 2025년 5월 게재되었다. 연구 방식은 다음과 같다

  1. 전문가 평가가 완료된 194개 유튜브 건강 콘텐츠를 선별
  2. 각 영상은 국제적으로 통용되는 평가 기준인 DISCERN 도구를 기반으로 점수화됨
    • DISCERN은 출처 명확성, 편향 여부, 다양한 치료법의 균형성 등 15가지 기준을 포함
  3. 같은 영상을 GPT-4, Gemini, Claude, LLaMA 등 20개 이상의 대형 언어 모델에게 평가하게 함
  4. AI는 영상의 **전체 자막(스크립트)**만을 제공받은 상태에서 두 가지 방식으로 평가 진행
    • Zero-shot: 별도 설명 없이 바로 평가
    • Guided: 평가 기준을 설명한 후 평가

그 결과 일부 모델(Gemini 1.0 Pro, GPT-4o)은 전문가 평가와 80~90% 수준의 유사도를 보였으며, 정보의 정확성, 다양성 평가에서는 오히려 전문가보다 일관성 있는 결과를 내기도 했다.

파란색 막대  : 각 AI 모델 또는 전문가 그룹이 부여한 영상 품질 점수의 평균(mean)
주황색 막대 : 점수의 일관성 정도(짧을수록 점수를 비교적 일관되게 부여)


AI는 단순한 실험 도구일까, 실제 유튜브에 적용될까?

가장 주목할 만한 점은, 이 연구가 단순히 AI의 언어 분석 능력을 실험한 것에 그치지 않았다는 점이다. 연구진은 실제 유튜브 플랫폼에서 이 기술이 적용될 수 있는 시나리오까지 제시했다.

예를 들면 다음과 같다

  • 사용자가 ‘불면증 치료’ 관련 영상을 검색
  • 백엔드에서 AI가 영상 자막을 분석해 DISCERN 점수 부여
  • 신뢰도 점수가 높은 순으로 영상이 추천
  • 반대로 기준 미달의 영상에는 경고 배너나 ‘참고 링크’가 자동 삽입됨

실제로 유튜브는 이미 “신뢰할 수 있는 건강 정보” 배지WHO나 CDC 링크 자동 첨부의학적 민감도 필터링 기능을 도입한 상태다. 따라서 이 AI 시스템이 신뢰도 점수를 자동으로 부여해 노출에 영향을 미치게 되는 날이 멀지 않았다고도 해석할 수 있다.


크리에이터 입장에서 느끼는 현실과 방향성

크리에이터로서 건강 콘텐츠를 제작하거나, 리뷰하는 과정을 겪어본 사람이라면 공감할 수 있다.
유튜브의 건강 정보 관련 정책은 보수적으로 업데이트 될 수 있으며 콘텐츠의 품질보다 ‘형식’이 평가의 핵심이 되기도 한다.

이제 중요한 것은 단순히 조회수를 높이는 콘텐츠 전략이 아니라, 신뢰도 기반의 정보 설계다. AI가 콘텐츠의 품질을 판단하게 될 미래를 대비하려면, 크리에이터도 이제부터는 전문가의 시선으로 자막과 메시지를 구성해야 한다.


AI 평가 시대, 건강 콘텐츠 제작자가 챙겨야 할 5가지 팁

연구 결과와 유튜브의 최근 흐름을 바탕으로, 건강·의료 정보를 다루는 크리에이터라면 다음 5가지를 특히 신경 써야 할 것이다.

  1. 출처를 말로만 하지 말고 자막에도 삽입하자
    • 영상에서 “출처는 WHO입니다”라고 말하는 것만으로는 부족하다.
    • 자막 또는 설명란에 출처 URL, 참고 논문 등 문서화된 정보를 넣는 것이 중요하다.
  2. 단일 치료법만 강조하지 말자
    • “~가 가장 효과 있다”는 식의 표현은 위험하다.
    • 대안적 치료법을 함께 소개하면서, 결정은 전문가와 상의하라는 구조가 바람직하다.
  3. 영상 제작자가 전문가가 아니라면, 출연자를 활용하자
    • 자격 있는 전문가(의사, 약사 등)를 영상에 출연시키는 것만으로도 신뢰도를 끌어올릴 수 있다.
    • 이 경우, 영상 도입부에서 전문가의 자격 정보를 시각적으로 명시하자.
  4. AI가 읽기 쉬운 자막 구조를 갖추자
    • 이번 연구처럼 AI가 자막만으로 콘텐츠를 평가하는 경우, 문장이 정돈되어 있지 않으면 정확한 분석이 어려울 수 있다.
    • 자동 생성 자막에 의존하지 말고, 가능하면 자막 파일(SRT)을 직접 제작해 업로드하자.
  5. 정보의 ‘최신성’도 언급하자
    • 건강정보는 시간이 지나면 달라질 수 있다.
    • 영상 내에서 “이 정보는 2025년 기준입니다”라는 식의 표현을 넣는 것도 신뢰도 향상에 도움이 된다.

추천 알고리즘에 ‘AI 신뢰도 점수’가 반영될까?

가장 흥미로운 부분은 이 기술이 단순한 실험에 그치지 않고, 유튜브의 실제 정책에 도입될 수 있는 가능성이다.
이미 유튜브는 광고 제한, 콘텐츠 노출 제한, ‘더 많은 정보 보기’ 패널 등으로 신뢰도 기반 분류를 시도하고 있다.

  • AI가 콘텐츠를 실시간으로 평가
  • 추천 알고리즘에서 ‘신뢰도 높은 영상 우선 노출’

이러한 변화가 현실이 된다면, 크리에이터는 더 이상 클릭 유도형 제목과 자극적인 내용만으로는 성과를 내기 어려워질 것이다.


이번 연구는 단순히 “AI가 똑똑하다”는 걸 증명하려는 목적이 아니다.
유튜브 생태계가 어떤 방향으로 변화하고 있는지를 보여주는 결정적인 단서이기도 하다.

건강 콘텐츠를 만드는 사람이라면, 이 흐름에 적응할 준비를 지금부터 해야 한다.
AI가 콘텐츠의 품질을 자동으로 읽어내는 시대,
‘잘 만든 영상’의 기준은 더 이상 감각적인 편집이 아니라, 정확하고 균형 잡힌 정보가 될 것이다.

※ 자료 참고 및 출처 :https://www.nature.com/articles/s41598-025-94208-6

위로 스크롤