prev
next
엠봉 유저들을 위한 홍보게시판
  • 목록
  • 아래로
  • 위로
  • 쓰기
  • 검색

Meta는 AI 훈련을 위해 불법 복제 도서를 사용한 것을 인정하지만 비용은 지불하지 않습니다.

11123124123
97 0 0
https://mbong.kr/plusd/2012099 복사
Meta는 AI 훈련을 위해 불법 복제 도서를 사용한 것을 인정하지만 비용은 지불하지 않습니다. | mbong.kr 엠봉

독점 소재를 사용하여 고급 AI 모델을 교육하는 것은 논란의 여지가 있는 문제가 되었습니다.

현재 많은 기업이 법정에서 작가와 미디어 조직으로부터 법적 문제에 직면하고 있습니다.

Meta는 잘 알려진 "해적" 데이터세트인 Books3를 사용하는 것을 인정했지만 회사는 작가에게 적절한 보상을 제공하기를 꺼려했습니다.

한 저자 그룹이 Llama 1 및 Llama 2 대형 언어 모델을 개발하는 데 저작권이 있는 자료를 불법적으로 사용했다고 주장하면서 Meta를 상대로 소송을 제기했습니다. 이에 대해 Facebook은 작가이자 코미디언인 Sarah Silverman, 작가 Richard Kadrey 및 법적 소송을 주도하는 기타 권리 보유자들에게 자사의 LLM이 저작권이 있는 도서를 사용하여 교육을 받았다는 사실을 인정했습니다.

Meta는 Llama 1 및 Llama 2 LLM을 교육하기 위해 다른 많은 자료 중에서 Books3 데이터 세트를 사용하는 것을 인정했습니다.

Books3은 약 37GB에 달하는 195,000권 이상의 도서로 구성된 일반 텍스트 컬렉션으로 구성된 잘 알려진 세트 입니다.

이 아카이브는 AI 연구원 Shawn Presser가 기계 학습 알고리즘을 개선하기 위한 더 나은 데이터 소스를 제공하기 위한 방법으로 2020년에 만들었습니다 .

Books3 데이터 세트의 광범위한 가용성으로 인해 많은 연구자들이 AI 교육에 광범위하게 사용하게 되었습니다.

Meta를 포함한 거대 기술 기업은 상업용 AI 제품에 Books3 및 기타 논쟁의 여지가 있는 데이터 세트를 활용했습니다.

이러한 이유로 New York Times는 ChatGPT 챗봇을 개발하기 위해 저작권이 있는 수백만 개의 기사를 사용한 혐의로 OpenAI와 Microsoft를 고소했습니다.

Meta는 AI 훈련을 위해 불법 복제 도서를 사용한 것을 인정하지만 비용은 지불하지 않습니다. | mbong.kr 엠봉

OpenAI는 저작권이 있는 자료를 사용하지 않고 AI 모델을 훈련시키는 것은 "불가능하다"고 공개적으로 선언했으며,

판사와 법원은 권리 보유자가 제기한 보상 소송을 기각해야 한다고 주장했습니다.

이러한 입장을 반영하여 Meta는 Books3 사용을 인정했지만 의도적인 위법 행위는 부인했습니다.

Meta는 Books3 데이터 세트의 일부를 사용하는 것을 인정했지만 LLM을 교육하기 위해 저작권이 있는 저작물을 사용하는 데는 "동의, 신용 또는 보상"이 필요하지 않다고 주장했습니다. 회사는 원고의 "주장된" 저작권을 침해했다는 주장을 반박하고 Books3에 있는 저작권이 있는 작품의 무단 사본은 공정 사용으로 간주되어야 한다고 주장합니다.

구글번역이라 번역이 어색할 수 있습니다.

★★★★★★★★★★
신고스크랩


댓글 0

댓글 쓰기
불법 사이트 홍보시 영구IP차단 됩니다.
권한이 없습니다. 로그인
0%
에디터 모드

신고

"님의 댓글"

이 댓글을 신고하시겠습니까?

댓글 삭제

"님의 댓글"

이 댓글을 삭제하시겠습니까?