Britannica가 OpenAI에 대해 저작권 소송: AI 학습 데이터로 사용한 10만 개 이상의 기사에 대한 침해

3분 읽기
공유
Britannica가 OpenAI에 대해 저작권 소송: AI 학습 데이터로 사용한 10만 개 이상의 기사에 대한 침해

Britannica (Merriam-Webster의 소유자)가 OpenAI에 대해 '대규모 저작권 침해'를 주장하며 AI 모델 훈련용으로 사용한 10만 개 이상의 온라인 기사에 대한 권리 침해 소송을 제기했습니다. 이는 AI 기업이 저작물을 무단으로 수집하여 학습 데이터로 활용하는 문제를 근본적으로 다루는 사례입니다.

"AI 시대의 '저작권 전쟁'은 더욱 격화되고 있습니다. 세계 최고의百科사전인 Britannica가 OpenAI에 대해 '대규모 저작권 침해'를 주장하며 소송을 제기했습니다. 그들은 AI 기업이 자신들의 10만 개 이상의 온라인 기사를 무단으로 스크랩하여 LLM 학습 데이터로 사용했다고 주장합니다.

무슨 일이 일어났나

2026년 3월 16일에 제기된 소송에서 Britannica는 OpenAI가 '대규모 저작권 침해'를 저질렀다고 주장합니다. 특히, 자사가 보유한 10만 개 이상의 온라인 기사가 AI 모델 훈련에 사용된 것을 비난했습니다. Britannica는 OpenAI가 RAG(Retrieval Augmented Generation) 워크플로우에서 자신들의 기사를 무단으로 활용하고, 생성된 답변 중 '완전 또는 부분적인 정확한 복제'가 포함되어 있다고 주장합니다. 또한, Lanham Act(상표법)을 위반하여 허위 표시를 한 것으로 지적했습니다. "ChatGPT는 웹 출판사(Britannica)와 같은 기업의 수익을 빼앗기며 사용자 질문에 대한 답변을 대체하고, 직접적으로 출판사의 콘텐츠와 경쟁합니다." 소송 내용에는 이러한 주장이 명시되어 있습니다. Britannica는 NYT, Ziff Davis 등 다수의 출판사들이 OpenAI에 대해 저작권 문제로 소송을 제기하고 있는 것과 함께, Perplexity에 대한 비슷한 소송도 미결 상태입니다.

왜 중요한가

이 사건은 AI 기업이 저작물을 무단으로 사용하는 문제를 근본적으로 다루는 것이 중요합니다. 웹 출판사들은 ChatGPT와 같은 AI 모델이 자신들의 콘텐츠를 경쟁하며 수익을 감소시키고 있음을 우려하고 있습니다. 또한, 법원이 '학습 데이터 사용'에 대한 명확한 판례를 내리면 AI 기업들의 학습 방식이 크게 변화할 가능성이 높습니다. 이전에 Anthropic이 법원의 판단을 받았던 사례에서는, '학습 데이터 사용'이 충분히 변형된 것으로 인정되었지만, 그들은 수백만 권의 책을 무단 다운로드하여 $1.5억의 집단소송 금액을 지급해야 했습니다.

내가 보기엔

이 소송은 AI와 저작권 문제를 더욱 뜨겁게 만들 것입니다. Britannica가 대형 기업으로서 소송을 제기함으로써, 저작권 침해에 대한 법적 싸움이 더욱 격화될 것이라고 예상합니다. 하지만 법원의 판단이 어떻게 될지는 미지수입니다. Anthropic의 사례에서처럼 '변형된 사용'을 인정받았더라도, 데이터 수집 방식에 대한 문제점은 여전히 남아 있습니다. 이번 소송 결과가 다른 출판사들의 행동에 영향을 미칠 것으로 예상합니다.

자주 묻는 질문

Q: 이 소송은 무엇을 의미하나요? A: Britannica와 Merriam-Webster가 OpenAI에 대해 저작권 침해를 주장하고 있습니다. AI 기업이 자신들의 10만 개 이상의 온라인 기사를 무단으로 스크랩하여 LLM 학습 데이터로 사용했다고 주장하는 것입니다. Q: 이 사건은 나에게 어떤 영향을 미칠까요? A: 웹 출판사(예: Britannica)의 수익이 ChatGPT와 같은 AI 모델에 의해 침해될 가능성이 높아집니다. 또한, AI 기업들이 저작권자에게 보상을 제공하지 않고 데이터를 사용하는 것에 대한 논란이 더욱 심화될 수 있습니다. Q: 이후 어떤 일이 발생할까요? A: 다른 출판사들(예: NYT, Ziff Davis)도 이미 OpenAI에 대해 소송을 제기했으므로, 이 소송은 AI 기업과 저작권자 간의 '저작권 전쟁'을 더욱 격화시킬 것입니다. 또한, 법원이 '학습 데이터 사용'에 대한 명확한 판례를 내릴 가능성이 높아져 AI 기업들의 학습 방식이 변화할 수 있습니다.

이 글은 The dictionary sues OpenAI의 보도를 바탕으로 작성되었습니다.