AI와 창작의 관계를 이야기할 때, 가장 먼저 떠올려야 할 것은 바로 ‘모델’이다. 전통적 창작에서 작가들이 자신만의 작업 환경을 고르고 재료를 연구하는 것처럼, AI를 활용한 창작에서는 AI 모델이 바로 그 창작적 탐구의 시작점이 된다. 여기서 ‘모델’이란 AI를 만들기 위해 설계된 인공 신경망을 말한다. 이 신경망 구조는 엄청난 양의 데이터를 학습해 완성된 AI 모델이다. 이러한 모델은 언어, 이미지, 소리 등의 데이터를 처리하는 다양한 종류가 있으며, 각각 특별한 목적에 맞게 만들어진다. 연구자들은 계속 이 모델을 발전시켜 더 정확하고 특별한 목적에 맞게 더 빠르고 다양한 업무를 수행할 수 있게 설계한다.
-01_“모델들” 중에서
멀티모달 AI의 능력은 창작에만 국한되지 않는다. 작품 비평과 해석에도 활용될 수 있다. 방대한 양의 예술 비평 관련 데이터를 학습하고 이미지, 사운드, 텍스트를 동시에 인식할 수 있는 멀티모달 AI는 작품을 보고, 듣고, 해석하며 비평하는 기능을 수행할 수 있다. 물론 AI의 비평 능력이 인간 전문가 수준에 도달했다고 보기는 어렵다. 그러나 이미 일부 AI 모델들은 작품의 스타일, 시대적 배경, 사용된 기법 등을 분석하고 설명하는 데 놀라운 능력을 보여 주고 있다. 예를 들어 마이크로소프트(Microsoft)의 KOSMOS-2 모델은 이미지와 텍스트를 동시에 이해하고 분석할 수 있으며, 예술 작품에 기본적 설명과 해석을 제공할 수 있다.
-03_“멀티모달리티” 중에서
초현실주의는 비합리적인 잠재의식과 꿈의 세계를 탐구해 표현의 혁신을 꾀한 예술 운동이다. 제1차 세계대전 이후 이성과 인습을 반대하고 문명의 구속에서 인간의 자유와 해방을 촉진하기 위해서 시작되었던 초현실주의는 무의식의 세계를 현실의 공간에 위치시키려는 시도라고 할 수 있다(위키피디아). AI로 만들어 가는 창작은 바로 이 초현실주의적 사고에 가깝다. 다만 무의식에서 의식으로 이어지는 인간적 사고와는 다르게 학습 데이터(현실, 이성, 의식)에서 시작해 생성 결과물(초현실, 비이성, 무의식)로 어떻게 보면 반대 방향으로 흘러가는 구조다. 그런데 사람의 무의식도 결국 의식적 사고가 없다면 존재하지 않기 때문에 무의식과 의식, 이성과 비이성, 현실과 초현실은 유기적으로 영향을 줄 수밖에 없다.
-06_“현실에서 초현실” 중에서
GPU 사용에 대한 자본의 격차, 언어로 인한 정보의 격차와 더불어 또 하나의 중요한 문제는 데이터의 격차다. 이는 특히 이미지 생성 모델에서 두드러지게 나타난다. 초기의 이미지 생성 모델들은 ‘서울’ 또는 ‘한국’과 같은 키워드로 이미지를 생성할 때, 실제 한국의 모습보다는 아시아권 문화가 혼재된 이미지를 생성하는 경향이 있었다. 이는 학습 데이터의 편향성과 부족함을 보여 주는 예시다.
-09_“기술의 격차, 창작의 격차” 중에서