생성형 AI 학습 데이터 저작권 논쟁, 앞으로 기업은 어떻게 해야 할까?
앤트로픽(Anthropic)이 저작권 침해 소송 해결을 위해 최소 15억 달러를 지불하기로 합의하면서, 생성형 AI 모델 사용에 대한 기업들의 고민이 깊어지고 있습니다. 무단으로 저작물을 사용하여 AI 모델을 학습시킨 것에 대한 책임을 인정한 셈이기 때문입니다. 이번 합의는 AI 모델 사용 비용 상승으로 이어질 수 있다는 우려를 낳고 있으며, 기업들은 앞으로 AI 사용 전략을 어떻게 수립해야 할지 숙고해야 합니다.
앤트로픽 합의 내용과 의미
앤트로픽은 저작권이 있는 자료를 무단으로 사용하여 AI 모델을 학습시킨 것에 대한 소송에서 최소 15억 달러를 저작권자에게 지급하기로 합의했습니다. 이는 미국 역사상 최대 규모의 저작권 합의로 기록될 가능성이 높습니다. 합의 조건에는 불법 복제된 도서 사본 삭제가 포함되지만, AI 모델의 결과물에 대한 책임은 포함되지 않았습니다. 일각에서는 앤트로픽이 합의를 통해 "합법적으로 소싱된 콘텐츠는 AI 학습에 합법적으로 사용될 수 있다"는 선례를 만들었다고 평가하기도 합니다.
AI 비용 상승 우려와 기업의 고민
이번 합의는 AI 모델 학습에 필요한 저작권 확보 비용 증가로 이어질 수 있습니다. 기업들은 AI 모델 사용 비용 상승을 우려하며, AI 버블 붕괴 가능성까지 제기하고 있습니다. 또한, 모델 학습 데이터에 대한 투명성 부족 문제도 제기되고 있습니다. 기업들은 AI 모델의 신뢰성을 확보하기 위해 학습 데이터의 품질, 최신성, 언어 지원 등을 확인해야 하지만, 많은 모델 제작사들이 학습 데이터에 대한 충분한 정보를 제공하지 않고 있습니다.
AI 활용, 리스크 관리가 중요해진다
이번 합의를 계기로 AI 업계는 더욱 예측 가능한 영역으로 진입할 것으로 예상됩니다. 책 한 권당 3,000달러라는 사실상의 라이선스 벤치마크가 설정되면서, AI 기업들은 ‘선점 후 방어’ 전략에서 벗어나 구조화된 라이선스 계약으로 빠르게 전환해야 할 것입니다. 기업들은 AI 모델 도입 시 저작권 침해 위험을 최소화하기 위해 다음 사항들을 고려해야 합니다.
- 학습 데이터 출처 확인: AI 모델의 학습 데이터가 합법적인 경로를 통해 확보되었는지 확인해야 합니다.
- 계약 조건 명확화: AI 모델 사용 계약 시 저작권 관련 조항을 명확히 하고, 저작권 침해 발생 시 책임 소재를 분명히 해야 합니다.
- 내부 정책 수립: AI 모델 사용에 대한 내부 정책을 수립하고, 직원들에게 저작권 관련 교육을 실시해야 합니다.
이번 앤트로픽의 합의는 생성형 AI 시대에 저작권 문제가 얼마나 중요한지를 보여주는 사례입니다. 기업들은 AI 기술을 활용하는 동시에 저작권 침해 위험을 최소화하기 위한 노력을 기울여야 할 것입니다. AI 모델 사용에 대한 투명성 확보와 합법적인 데이터 사용을 위한 노력이 더욱 중요해질 것입니다.