거대 모델은 기본적으로 막대한 양의 데이터를 소화할 수 있는 컴퓨팅 자원을 필요로 한다. 수천 대 규모의 그래픽 처리 장치(GPU)와 메모리 반도체가 필요하다. H100, A100과 같은 고성능 GPU는 기본적으로 한 대당 기본적으로 1000만 원이 넘는다. AI 기업은 이 비용을 감당해야 하고 결국 비용을 충당하기 위해선 투자받거나 소비자에게 그만큼 비싼 가격에 서비스를 제공할 수밖에 없다.
이 문제에 대응하기 위해 만들어지고 있는 모델이 있다. 골리앗을 상대하며 등장한 다윗, 바로 경량화 AI다. 경량화 AI는 용량이 큰 범용 AI 모델과 달리 사용자가 필요로 하는 기능만 탑재한 모델이다. 범용적으로 쓰이는 파운데이션 모델에서 불필요한 부분은 빼고 필요한 것만 가져와 몸집을 줄였다. 전문적인 분야에 쓰인다고 해 전문 AI라고도 불린다.
-01_“거대 모델과 경량화 AI” 중에서
하지만 클라우드는 만능이 아니다. 단점도 존재한다. 바로 보안이다. 클라우드 컴퓨팅엔 개인 목적으로 저장해 둔 데이터들이 다른 사람에게 공개되거나 하루아침에 사라질 수 있는 위험이 있다. 챗GPT 대화 이력이 전혀 상관없는 제삼자에게 노출된 이유도 이 때문이다.
-04_“데이터 보안과 전문 AI” 중에서
문화산업 분야에선 범용 AI 모델보다 전문 AI 모델을 필요로 한다. 저작권 문제가 없고 사용자 친화적인 모델을 원한다. 물론 기업들은 관련 모델을 하나둘씩 내놓고 있다. 일례로 LG AI연구원은 초거대 멀티모달 AI인 엑사원을 응용한 ‘엑사원 아틀리에’ 서비스를 내놨다. 아틀리에는 AI가 입력된 이미지에 대해 사람처럼 자연스럽게 설명하는 것을 넘어 엑사원 언어 모델과 결합해 사용자가 원하는 태스크(Task)까지 수행할 수 있는 AI 서비스다. 사용자가 일일이 텍스트로 원하는 내용을 설명할 필요가 없다. 한 장의 이미지와 요청 사항을 입력하면 수행한다. 마케팅 문구를 만든다고 할 때 원하는 내용을 구구절절 입력하지 않고 이미지 하나로 해결할 수 있는 것이다. 학습 데이터 역시 합법적으로 구매한 데이터만 사용해 저작권 이슈를 차단했다. 이처럼 생성형 AI는 점점 사용자가 안심하고 편하게 사용할 수 있도록 진화해 가고 있다.
-06_“생성형 AI와 전문가” 중에서
구찌는 AI를 도입하기 위해 현재 조직에서 AI가 필요한 곳은 무엇인지 분석했다. 또 보유하고 있는 데이터를 일원화해 AI가 정확하고 신뢰할 수 있는 데이터만 학습하게 했다. 이 데이터에는 구찌에서만 사용하는 용어도 포함했다. 회사마다 서로 사용하는 용어가 있는데 이 모든 것을 데이터화한 후 AI에 학습시킨 것이다. 이렇게 만든 모델은 직원들이 직접 검토했다. 회사에서 경험이 많고 일을 잘하는 직원들이 실제로 사용했을 때 이상이 없는지, 신뢰하고 사용할 수 있는지를 검토했다. 비교적 긴 시간을 갖고 AI 도입을 준비하고 검토까지 착실하게 진행한 것이다. 이 모델은 AI 도입의 모범 사례로 꼽힌다.
-09_“전문 AI 구축 방법” 중에서