AI 창작그림 게시판 | 구독자 243명 |

미국작가 3인 vs 이미지 생성 ai 회사 3사 소송 관련

기각 결정문 전문을 읽는건 너무 힘들 거 같아서 요약된 것을 찾았는데,
마침 정리가 잘 된 글들을 찾았습니다.
https://www.techdirt.com/2023/11/01/judge-dismisses-most-of-the-first-of-the-many-how-dare-ai-train-on-my-material-lawsuits/
https://x.com/jess_miers/status/1719135971705520497?s=20


결정문에서 나온 이야기들을 건별로 구분해서 잘 설명해주는 글 같아요. 이 글들을 보면서 결정문을 보니까 대충은 이해가 가더라고요.
데비안 아트나 미드저니쪽은 별 관심이 없는 쪽이고, 데이터셋이 미공개 상태라 알아서 잘 빠져나간 모양인거 같습니다.
그래서 스테빌리티(=스테이블 디퓨전)쪽에 집중해서 읽었습니다.

기사들을 보면 패소 승소 이야기가 나오는 기사들도 있는데 조금 잘못된거 아닌가 싶습니다.

판결이라기보다는 작가 3인이 제기한 소송에 대해 3개 회사가 요청한 기각 또는 각하(미국에서는 기각이나 각하나 둘 다 dismiss를 쓰는 모양이더라고요)에 대한 결정인 것 같습니다. 문서 제목부터 ORDER ON MOTIONS TO DISMISS~입니다.

img/23/11/05/18b9ebbe27356fae3.png





1. 저작권 등록
시작과 동시에 3명 중 2명이 나가리됩니다. 이 2명은 미국 저작권청에 자기 작품을 등록해놓지 않았기 때문입니다.
물론 저작권이라는게 창작과 동시에 발생하는 것이기는 합니다. 그래도 실질적으로 보호를 받으려면 국가에 등록을 해야만 하는데 왜 등록조차 하지 않은 상태에서 소송을 시작한 것인지 이해가 안갑니다. 변호사도 끼고 진행하는 소송인데 변호사가 첩자인가 싶어요.
아무튼 시작부터 3명 중 1명(앤더슨)이 저작권을 등록한 작품 16건에 대해서로 소송의 범위가 좁혀집니다.

img/23/11/05/18b9ebc662f56fae3.png






2. 침해된 저작물에 대한 확인
이 부분은 인정받고 있습니다. Laion 데이터셋을 검색할 수 있는 서비스인 haveibeentrained.com에서 앤더슨의 작품들을 확인할 수 있기 때문입니다. 그리고 이 데이터셋이 스테이블 디퓨전의 훈련용 자료로 사용되니까요.

img/23/11/05/18b9ebcf73256fae3.png


img/23/11/05/18b9ebcffa656fae3.png






3. 직접 침해: 기각 요청 거부
스테빌리티가 요청한 직접 침해에 대한 기각 요청은 거부되었습니다. 앞서 확인된 저작물들이 일단 복사되고는 있으니까요.
지금 우리들도 숨쉬듯이 하고 있는 것이 이 직접 침해입니다. 당장 구글에서 이미지 검색을 하면 그 순간 수십 수백개의 저작물 사본이 우리 컴퓨터에 저장되니까요. 이런저런 인터넷 게시글을 보면 그 순간 마찬가지로 우리 컴퓨터에 저작물이 저장되기도 합니다.
그래도 아무튼 침해는 침해라고 인정 받았고, 이 건에 대해 원고가 소송을 원하고 있으니 이 부분에 대해서는 소송이 진행되겠죠.

img/23/11/05/18b9ebd639156fae3.png






4. 대리 침해
다른이들이 저작권을 침해하게 했다는 의미로서 대리 침해가 아닌가 싶습니다.
대리 침해가 인정되려면 (1) 피고가 침해행위를 감독할 권리와 능력을 가지고 있어야 하며, (2) 침해 행위와 직접적인 금전적 이윤관계가 있음을 증명해야 한다고 합니다. 그리고 이를 입증할만한 사실을 제시하지 못하므로 기각.

img/23/11/05/18b9ebe3dde56fae3.png






5. DMCA 침해
피고들이 저작권 관리 정보(copyright management information, CMI)를 삭제했다는 것인데, 어떤 저작물의 CMI가 삭제되었는지를 설명하지 못하고 있습니다. 기각.

img/23/11/05/18b9ebe9bab56fae3.png






6. 퍼블리시시티권 침해
자신들의 이름으로 광고를 했다는 것인데, 그런 적이 없으니 그런 사실을 증명할 수가 없고, 기각.

img/23/11/05/18b9ebeb30956fae3.png






7. 결론
데비안 아트랑 미드저니에 대한 침해 건은 전부 기각되고, 스테빌리티에 대해서도 직접 침해 하나만 살아남았습니다.
침해했네 유죄 땅땅땅이 아니라, 지금 소장대로는 스테빌리티가 앤더슨의 이미지 16개에 대해 저작권을 직접 침해한 건에 대해서만 소송이 진행된다는 의미겠죠.






사족
원고들의 기본 주장은 "스테빌리티가 이미지들을 허락 없이 스크랩하고 이 이미지들을 스테이블 디퓨전에 압축해서 넣었으며, 스테이블 디퓨전의 출력물은 이 압축본들의 조합에 불과하다"입니다.
이게 오히려 원고들의 발목을 잡고 있다고 생각합니다. 애초에 구글링 조금만 해보면 이 주장이 말도 안된다는 것을 쉽게 알 수 있습니다. 애초에 50억장이 넘는 이미지를 수 gb 남짓한 파일에 넣는다는 것부터 불가능하죠.
실제로도 결정문에서 해당 주장에 대한 근거가 부족하다고 지적받고 있습니다.


일례로 대리침해를 주장하는 근거를 스테빌리티가 이미지의 압축본을 뿌려서 다른이들로 하여금 침해하도록 조장했다는 것에서 찾고 있는데, 증명이 불가능하다보니 기각되었던 것입니다.
그리고 데비안 아트 관련 건은 복잡해지니까 위에서 언급 안했는데, 데비안 아트를 언급하는 부분에서는 판사가 여러번 해당 이론을 더 분명히 할 것과 제대로 된 사실을 근거로 제시할 것을 요청하기도 했습니다.
또한 이 압축 이미지 이론을 가지고 ai출력물이 파생저작물이라고 주장했는데 이 또한 인정되지 않았습니다. 오히려 모델 훈련이 전부 저작권 자료로만 이루어진게 아닐 수 있다는 의문만 남겼죠.

img/23/11/05/18b9ec0fa6d56fae3.png



그리고 또 중요한 점은 실질적 유사성입니다. ai생성물이 기존 저작물과 비슷하지 않다면 과연 이것이 침해일 것인가에 대해 판사는 부정적입니다.

img/23/11/05/18b9ec1626c56fae3.png



일단 침해에 대한 사실이 확인되어서 고소가 진행되긴 할테지만, 과연 저 압축 이미지 이론으로 얼마나 의미 있는 결과를 만들어 낼 수 있을지 모르겠습니다.
오히려 법원에서 ai출력물이 파생 저작물이 아니라는 것을 확인해주고, ai생성물이 기존 저작물과 실질적 유사성이 없다면 저작권 침해가 아니라는 점만 확인시켜준거 아닌가 싶슴다.








(추가)사족의 사족

직접 침해에 대한 기각 요구가 거부된 것을 보면 일단 침해 자체는 인정되는 모양입니다.
다만 이게 과연 배상이나 처벌까지 가는 수준인가에 대해서는 개인적으로 회의적입니다.

1. 데이터셋 구축 측면
좀 말장난이 되는 것 같지만, Laion 데이터셋은 실제 이미지가 포함된 데이터셋이 아닙니다.
단순히 이미지의 주소와 이 이미지에 대한 주석 등이 모여있는 엑셀파일 같은 것에 가깝습니다. 특정 인터넷 주소와 주석의 조합이라는 면에서 보면 북마크, 즐겨찾기 같은 것이라고도 볼 수 있고요.
이 단계에서는 침해 자체를 인정받기 어려울 것 같습니다.




2. 훈련(학습) 단계 측면
여기에서는 분명하게 저작권 침해가 발생합니다.
훈련을 위해서는 반드시 저작권이 있는 자료인 이미지 파일이 훈련을 실행하는 컴퓨터로 임시적으로나마 전송 및 복제되니까요.
다만 용인이 되는 저작권 침해일 수 있다고 생각합니다.


(1) 전송 및 복제의 목적이 저작물의 원래 용도로 사용하기 위한 목적이 아닙니다.
예를 들자면 본문에서 언급한 바와 같이 구글 이미지 검색과 같은 것을 생각해 볼 수 있습니다. 구글 이미지 검색을 해보면 저작물들의 사본이 쏟아져내리는 것을 볼 수 있습니다. 저작권 침해이지만 용인되는 사례입니다. 다시 찾아보기 귀찮아서 정확하다고 확신은 못드리겠는데, 이미 이미지 검색 관련 판례가 있습니다. 여기에서도 공정이용이 적용됩니다. 이미지를 감상, 향유 등과 같이 본래의 목적으로 사용하지 않고 정보 획득의 보조 역할로 사용하는 것이기에 변형적 이용으로 인정이 되어서 저작권 침해가 용인된 바 있습니다.


(2) 훈련 과정에서 이미지의 원본이 사용되지 않습니다.
이상하게 잘못 퍼져있는 그리고 위 소송의 원고인 작가 3인이 주장하고도 있는 이야기인 압축 이미지 이론과는 달리 실제 SD의 훈련 과정에서는 이미지의 원본을 사용하지 않는다고 알고 있습니다. 애초에 이미지 원본을 쓰면 요구하는 계산능력이 엄청 커져서 AI회사들이 더 싫어할겁니다. 이미지를 분석한 결과를 학습에 사용하는 것인데 다분히 공정이용이 적용될 수 있는 사안이라고 생각합니다. 물론 이 분석 과정이 저작권 침해일지, 침해라면 여기에도 공정이용이 적용될 수 있는지 여부에 대해서도 생각해 봐야 되긴 합니다. 다만, 이 분석 또한 이미지를 원래 목적으로 사용하는 것이 아니기 때문에 변형적 이용일 것이라고 생각합니다.


(기타) 공정이용에 대해서도 이상하게 이윤추구 여부를 가지고 판단한다는 정보들도 많이 떠도는 것 같습니다. 관련 조항이나 논문들을 보면 전혀라고 까지는 아니지만, 거리가 먼 이야기라고 생각합니다. 공정이용 초기 판례들(100년전쯤?)에서는 이윤추구 여부를 따지는 경우도 보이긴 하지만 최근 판례들을 보면 이윤추구랑은 연관을 짓지 않는 것으로 보이거든요. 판례들이나 관련 논문들을 보면 가장 중요한 것은 변형적 이용, 즉 원래 목적과 다르게 사용했는지의 여부입니다.
공익성을 따지는 경우도 봤는데 한국이나 미국이나 공정이용에서 공익성을 따진다는 것은 못찾겠더라고요.
그런데 이게 또 애매한게 (제가 마지막으로 알아봤을 때 까지는)국내에서는 공정이용 관련 판례가 없어서 국내에서는 어떻게 적용될 것인가는 완전 미지수이긴 합니다. 조항 자체는 한미FTA를 거치면서 신설된 것이라서 그런지 미국꺼 판박이긴 합니다만...

img/23/11/05/18b9fe8cfcf56fae3.png





3. 이미지 생성 측면
이쪽은 스테빌리티가 책임질 영역이 아니라고 생각합니다.
사용자가 SD를 사용해서 생성한 이미지가 기존 저작물이랑 실질적인 유사성을 가진다면 침해가 되겠고, 아니면 그냥 아닌거겠죠.

로그인하고 댓글 작성하기
루리웹 오른쪽
루리웹 유머
루리웹 뉴스 베스트
PC/온라인
비디오/콘솔
모바일

루리웹 유저정보 베스트