평소에 든 생각

인공지능과 책의 차이 | 인공지능의 거짓말 | 생성형 AI가 가져오는 착시 | ChatGPT Bing Bard | 생성형 AI

RayShines 2023. 3. 24. 00:00
반응형

ChatGPT, Bing, 그리고 구글의 Bard에 이르기까지 생성형 AI의 시대입니다. 그런데 생성형 AI의 가장 큰 문제점이 거짓말을 한다는 것이라고들 하지요.

 

생성형 AI들은 기본적으로 인터넷에 넘치도록 쌓여 있는 자료들을 미리 학습하고, 적절한 자극이 있으면 그에 맞추어서 글을 생성해 냅니다. 이번에 구글이 내놓은 Bard의 본체인 laMDA(language model for dialogue applications)는 인터넷 포럼이나 웹사이트들에서 긁어온 1.56조 개의 단어를 학습한 AI라고 합니다. 대표적인 백과사전이랄 수 있는 브리태니커 백과사전이 총 32권에 4,400만 개의 단어를 담고 있으니 laMDA는 그 35,454배에 달하는 정보를 학습했다는 의미입니다. 그것이 옳든 그르든지 간에 아무튼 브리태니커 백과사전 35,000세트 분량의 정보를 암기하고 있다는 것이지요.

 

알다시피 인터넷의 정보들은 검증되지 않은 것들이 매우 많고, 개인의 의견을 사실인 것처럼 보이도록 적어둔 것들도 많으며, 작정하고 거짓말을 하는 내용도 있습니다. 그리고 포럼에 따라 특정 의견들을 지지하는 경향이 매우 높을 수도 있고, 특정 인종이나 종교, 지향 등에 따라 급진적인 의견을 내놓는 곳도 있을 수 있습니다. 그래서 알고리듬이 어떤 식으로 설정되느냐에 따라 그다지 바람직하지 않은 일이 벌어질 수도 있습니다.

 

그런데 이런 의문이 생깁니다. 위에서 이야기했던 것처럼 우리는 인터넷에 있는 정보들이 모두 정확한 정보일 수 없다는 것에 대해서 알고 있습니다. 우리는 링크를 클릭해서 들어간 뒤 그 글을 누가 쓴 것인지 봅니다. 공신력이 있는 정보인지, 아니면 유명한 인플루언서인지, 아니면 출처가 명확한지를 확인해 봅니다. 만약 최신성이 중요한 정보라면 글이 작성된 날짜를 확인하게 될 것입니다. 경제에 조금이라도 관심이 있는 사람들은 크레디트 스위스가 아직 영업 중이라는 글을 보고 그게 최신 정보라고 곧이곧대로 믿는 사람들은 그다지 많지 않을 것입니다. 우리는 기본적으로 링크에 들어갈 때 그 링크를 통해 얻어진 정보가 적절한 정보인지, 정확한 정보인지 판단을 하겠다는 의지를 갖고 클릭을 합니다.

 

실제로 링크를 클릭하며 웹을 볼 때는 문제 해결이나 의사 결정과 관련된 부분의 활성이 더 증가한다고 합니다. 위에서 말한 것처럼 이 정보가 옳은지 의심하면서 읽게 되기 때문에 발생하는 일일 것입니다. 그리고 방해가 되는 광고로부터 받는 자극은 배제하고, 불필요하거나 찾는 내용의 맥락과 다른 내용을 걸러내는 인지적 작용이 활발하게 일어날 수밖에 없을 것입니다. 또한 링크를 클릭할 때마다 전혀 다른 문체의 파편화된 내용들이 연달아 등장하기 때문에 책을 읽을 때 느껴지는 자연스러운 동질감보다는 이질감이 훨씬 더 크고, 그래서 내용의 진위에 더욱 민감해지는 것이 아닌지 모르겠습니다.

 

반면 책을 읽을 때 인간의 뇌가 약간 다르게 움직인다는 연구가 있습니다. 책을 읽을 때는 언어, 기억, 시각적 정보를 처리하는 부분이 활발하게 움직인다고 합니다. 우리는 일단 책을 고르고 나면 그냥 쭉 읽습니다. 페이지를 넘길 때마다 새로운 링크를 클릭한다고 생각하지 않습니다. 앞의 내용과 연결이 되는 내용을 주욱 읽게 됩니다. 비교적 균일한 문체와 내용들이 자연스럽게 이어지도록 쓰여진 것이 책이니까요.

 

결과가 줄글의 형태로 나오기 때문에 URL와 키워드에 할당되는 광고가 붙을 자리가 없다는 것 역시 중대한 차이임은 분명합니다. 공고하고 높게 쌓여있던 점유율 95%라는 구글 검색 엔진의 아성과 거기서 나오는 엄청난 광고 수입을 무너뜨릴 수 있는 변화이니까요.

 

하지만 ChatGPT나 Bing, Bard처럼 줄글을 생성해 내는 생성형 AI와 구글식 검색의 차이는 바로 이 AI들이 글을 써낸다는 것입니다. 그래서 착시가 발생합니다. 그 글이 담고 있는 내용의 진위, 옳고 그름과 무관하게 꽤나 그럴듯해 보이기 때문입니다. 다들 그런 경험들이 있습니다. 책에 쓰여 있는 내용이면 대부분 꽤 그럴듯해 보입니다. 책이라는 물리적 매체가 주는 신뢰감도 한몫을 할 것임이 분명합니다. 그리고 또 한 가지 무시할 수 없는 요소가 책은 사실 아무나 쓰지 않는다는 것입니다. 저자들의 수준 차이나 역량의 차이를 말하는 것이 아닙니다. 책이라는 형태의 장문을 쓰고, 이것을 발간하는 데까지 투자되어야 하는 시간과 돈과 노력은 매우 높고 강력한 진입장벽이 됩니다. 저도 블로그를 쓰고 있지만, 블로그는 사실 진입장벽이랄 게 없습니다. 아무 글이나 마구 써도 됩니다. 이 글은 안 팔린다고 하면서 출간을 거부당할 리도 없고, 이런 내용은 시의적절하지 않으니 조금 더 때를 기다려보자는 말을 들을 리도 없습니다. 그냥 써서 올리면 됩니다. 남들이 읽든 말든 말이죠. 오히려 구글 애드센스의 진입장벽이 더 높죠. 그런데 생성형 AI들이 학습할 때 쓰는 자료들에 바로 이런 블로그에 산적해 있는 글, 각종 커뮤니티에 쓰여져 있는 과도하게 편향된 글들이 포함되어 있습니다. 그리고 AI들은 이 글이 얼마나 좋은 글인지, 혹은 나쁜 글인지 판단하지 않은 채 일단 무조건 쌓아놓고, 단서를 주면 다시 그럴듯해 보이는 줄글로 쏟아냅니다. 그리고 우리는 그 줄글을 보고는 마치 저자가 쓴 책을 읽는 것 같은 착각에 빠지게  될 수도 있습니다.

 

인공지능은 거스를 수 없는 흐름인 것은 분명합니다. 큰돈이 모이고 있으니 더 그럴 것 같습니다. 모든 기술들이 처음 등장할 때는 우려가 발생하고, 디스토피아적인 상상을 자극하기도 합니다. 앞으로 AI가 가져올 세상이 어떤 모습인지 아무도 정확히는 모르겠지만, 우리가 적응하는 속도보다 변화의 속도가 훨씬 더 빠른 것만은 사실인 것 같습니다.

 

출처 : 생각하지 않는 사람들(니콜라스 카)

반응형