평소에 든 생각

AI가 만든 창작물의 저작권은 누구 것일까요? | ChatGPT | Dall-E 2 | Midjourney | 인공지능

RayShines 2023. 2. 9. 00:00
반응형

이제 인공지능은 글을 쓰고, 그림을 그리고, 코드를 짭니다. 이것이 가능한 이유는 과거에 인간들이 창조해 낸 결과물들을 인공지능이 무제한으로 학습할 수 있기 때문입니다.


OpenAI가 시장에 출시한 ChatGPT가 순식간에 사용자 1000만 명을 넘어섰습니다. 예상한 바와 같이 현재 무료로 사용 가능한 ChatGPT는 곧 월 20$ 정도의 정액 요금을 받을 것으로 보입니다. 그리고 또 한 가지 예상한 바와 같이 ChatGPT가 무분별한 사용에 대한 우려의 목소리가 커지고 있습니다. 뉴욕의 공립학교들은 교내에서는 ChatGPT를 사용을 차단했습니다. 그리고 ChatGPT를 만든 OpenAI는 인공지능이 쓴 글을 감지해 낼 수 있는 도구를 공개하기도 했습니다.


작년 12월 OpenAI의 CEO인 샘 알트만은 트위터에서 다음과 같이 이야기했습니다. “ChatGPT는 믿을 수 없을 정도로 많은 제한점을 가지고 있습니다. 하지만 뭔가 엄청난 것을 창조한 것 같은 착각을 불러일으킬 만큼은 훌륭합니다.” 예전에 소설가 이문열이 집필을 할 때 워드프로세서를 사용하는 것에 대해서 하는 말을 들은 적이 있습니다. 그는 컴퓨터를 이용하면 당연히 조금 편하게 작업할 수 있지만 “완성감이 너무 빨리 온다”는 것을 단점으로 들었습니다. 샘 알트만의 말과 일맥상통하는 면이 있습니다. ChatGPT를 이용해서 초안을 작성한 뒤 글을 쓰면 시간도 절약되고 자료 조사도 거의 필요 없이 상당 부분 완성된 글이 나옵니다. 그것을 조금만 고치면 꽤 괜찮은 결과물이 될 것이라는 생각이 들고, 마치 자기 자신이 쓴 것과 같은 느낌도 들지 모릅니다. 자신이 생각보다 훌륭한 무엇인가를 해냈다는 느낌, 그리고 전에 없던 신속한 완성감이 느껴지는 것이겠지요.


비디오게임 일러스트레이터인 Rutkowski는 소송을 제기했습니다.

Grzegorz Rutkowski는 평생을 카라바조, 렘브란트 등의 거장의 화풍과 기법을 연구하고 습득하는 데 바쳐왔고 그가 내놓는 결과물의 독특한 분위기 탓에 비디오 게임의 배경 일러스트레이터로 각광받고 있습니다. 그런데 그는 다른 의미로 또 가장 인기 있는 작가라고 합니다. 그의 작품이 이미지 생성 AI을 이용해 가장 많이 표절되기 때문입니다. 그리고 이때 가장 많이 사용되는 시스템은 ChatGPT를 만든 OpenAI의 이미지 생성 인공지능인 Dall-E 2, 그리고 Stability AI사의 Stable Diffusion입니다. Rutkowski의 화풍을 그대로 베낀 AI의 그림들이 포럼들을 온통 뒤덮자 그는 더 이상 이 상황을 방관할 수 없어 소송을 제기했습니다. 아래의 이미지를 보시면 Rutkowski의 원작과 AI가 생성해낸 결과물이 얼마나 유사한지 알 수 있습니다.

 

Rutkowski가 그린 원작입니다.

 

 

Rutkowski의 작품을 학습하여 AI가 그려낸 그림입니다.

 

 

AI는 이미 존재하는 인간의 창조물을 카피하고 학습하여 새로운 결과물을 산출합니다.

인공지능의 개발사들은 이미지 생성 인공지능의 알고리듬이 인터넷에 무한히 쌓여 있는 이미지들을 이용하여 자사의 인공지능들을 학습시킵니다. 충분히 큰 사이즈의 학습 표본이 있다면 인공지능은 텍스트 기반의 단서가 주어지면 그 맥락에 맞추어 이미지를 뽑아냅니다. 지금 Rutkowski이 가장 걱정하는 것은 구글 서치 인덱스, 그리고 여러 이미지 데이터 베이스에서 자신의 작품을 학습한 AI들이 쏟아내는 표절작들이 그 자신의 작품들을 모두 밀어내는 것입니다. 마치 나의 복제인간이 진짜 나를 대체하고 나를 밀어내는 그런 상황이 되는 것이지요.


하지만 AI가 학습을 할 때 원작자의 동의를 전혀 구하지 않습니다.

이런 문제는 비단 이미지 분야에서 뿐 아닙니다. 모든 종류의 창작물, 법적 문서, 엔지니어들의 도안, 그리고 코드까지도 같은 문제에 봉착하게 될 것입니다. ChatGPT가 쓰는 글도 인간이 이미 써놓은 글들을 학습한 뒤 조합한 글을 쏟아내는 방식입니다. 마이크로소프트의 GitHub Copilot도 비슷한 방식으로 새로운 코드들을 짜냅니다. 그런데 문제는 이 AI들이 이미 세상에 존재하는 창작물들을 학습할 때 원작자에게 그 어떤 형태의 허락도 받지 않는다는 것에 있습니다. 원작자들이 자신의 창작물이 AI의 학습자료르 쓰이길 원치 않을 가능성도 얼마든지 있습니다. 하지만 지금까지는 그런 제약이 전혀 없었습니다. 학습자료들이 없었다면 지금의 ChatGPT도, Dall-E 2도, Midjourney도, Stable Diffusion도 존재할 수 없었음은 명확합니다.


인공지능을 옹호하는 사람들도 인공지능이 생성해 내는 창작물은 인간이 이미 창조한 창작물의 수정 버전일 뿐이라는 것을 인정합니다. 하지만 거대한 기술적인 흐름은 거스를 수 없으니 받아들이고 대응책을 찾아야 한다는 것이지요. 인공지능이 창작의 장벽을 낮춰 대중화에 기여할 것이라는 의견도 있습니다. 동그라미도 간신히 그리는 사람도 이제 적당한 단어 조합만 찾으면 그림을 뚝딱 그려낼 수 있고, 영어를 한마디도 못한다고 해도 영문으로 된 블로그를 운영할 수 있게 될 것이라는 것입니다.


마이크로소프트는 OpenAI에 100억 달러를 투자했습니다. 마이크로소프트는 소프트웨어 분야의 최강자였고 디지털 혁신의 선발주자였습니다. 하지만 그 자리를 구글에게 내주였죠. 구글은 the First AI Company를 표방하며 Moonshot Project라는 것을 추진하기도 했습니다. 달에 가는 것처럼 불가능한 프로젝트들을 성공시키겠다는 것이었고, 그중 하나가 인공지능이었습니다. 하지만 알파고가 바둑에서 인간을 이긴 것 외에는 성과가 전혀 없었습니다. 구글이 주춤하는 사이 마이크로소프트는 인공지능 분야에서 구글의 헤게모니를 와해시키려고 호시탐탐 노리고 있습니다. OpenAI의 현재 가치는 290억 달러 정도로 생각되는데, 그중 100억 달러가 마이크로소프트의 돈이라고 한다면 3분의 1이 마이크로소프트의 소유라는 뜻도 됩니다. 그리고 OpenAI는 상장을 하지 않기로 했습니다. 앞으로 OpenAI가 내놓는 결과물들은 시장에 출시되는 종종 마이크로소프트의 제품들에 탑재될 것입니다. 실제로 마이크로소프트는 MS Word, Excel, Teams 등에 ChatGPT를 접목시킬 구체적 계획을 갖고 있다고 합니다.


인간의 거리낌 없이 무한정 결과물을 쏟아내는 AI의 속도를 따라갈 수 없을 것입니다.

현재 뭔가를 창조한다고 알려진 AI들은 모두 기존의 결과물을 모방하고 학습하는 방식으로 새로운 결과물을 산출해 냅니다. 인간도 무엇인가를 창조해 낼 때 모방부터 시작합니다. 완전히 새로운 것은 없다는 말이 있고, 모방은 창조의 어머니라는 말도 있듯이 누구나 자기가 좋아하는 그 무언가를 따라 하는 것으로 창조활동을 시작합니다. 그리고 우리가 좋아하는 만화가의 그림을 베껴서 그려볼 때 원작자의 동의를 구하진 않습니다. 가장 큰 이유는 상업적으로 이용하는 것이 아니기 때문이겠지요. 그리고 정말 프로페셔널이 되어서 작품활동을 한다고 하면 그때는 대중들의 엄격한 평가를 받을 수밖에 없습니다. 누군가의 작품을 따라 하는 것으로는 먹고살기가 참 어렵습니다. 인터넷으로 연결된 수백만 명의 감시를 피해 갈 방법은 그다지 많지 않습니다. 뭔가 새롭지 않으면 안 되는 것이지요. 그리고 인간은 뭔가를 베꼈다면 적어도 자신은 그것을 알 수밖에 없다고 생각합니다. 그로 인한 죄의식을 느낄 수도 있을 것입니다. 물론 그렇지 않은 사람도 있겠지만요. 그리고 인간은 표절 작품을 무한정 쏟아낼 수도 없습니다. 인간이 가진 분명한 물리적 한계가 있으니까요. 그런데 AI는 죄의식도, 양심의 거리낌도 없고, 1년 365는 단 1분도 쉬지 않고 수백만 페이지의 소설을 써내고, 수백만 장의 이미지를 그려내고, 수백만 줄의 코드를 짜낼 수 있습니다. 그리고 원작자들은 절대 그 속도를 따라가지 못할 것입니다. 이것에 대한 Rutkowski는 알고 있었던 것이겠지요. 구글 검색 엔진의 인덱스에서 인공지능의 표절작들에게 양으로 압도당하면 설 자리르 잃게 될 것이 뻔히 보였던 것입니다. 벌써 ChatGPT가 쏟아낸 무분별한 글들이 구글 인덱스를 잠식하고 있다고 들었습니다. 예상되었던 일이라서 놀랍지 않습니다만, OpenAI가 이를 색출해 내는 도구를 소개했다는 것은 다소 놀라웠습니다.


이번 소송 결과에 따라 많은 것이 바뀔 것입니다. 사법제도가 현재의 AI 시스템을 제제할 것인지, 옹호할 것인지, 아니면 AI 개발자들로 하여금 원작자들이 동의한 콘텐츠로만 구성된 학습 표본을 사용하도록 할 것인지 등의 윤곽이 결정되겠지요. 하지만 그 결과가 나오는 데는 오랜 시간이 걸릴 것이고 그동안에도 수많은 AI들이 더 진보된 형태로 출시될 것이며, 콘텐츠가 창조되는 방식은 완전히 바뀔 것입니다.


참고 자료 : wsj

반응형