AI의 역사는 이후 호황과 불황으로 대조적 부침을 거듭하는데, 새로운 붐은 1980년대 ‘머신 러닝’의 부상과 더불어 찾아왔다. AI 연구자들은 인간 두뇌의 구조와 기능으로부터 영감을 얻어 데이터를 기반으로 학습한 시스템들을 서로 연결한 인공 신경 네트워크를 개발하기 시작했다. 이런 변화는 커다란 전환점으로 작용했고, 이미지 인식이나 자연어 처리처럼 이전에는 불가능하다고 여겼던 직무를 수행할 수 있게 되었다. 그 결과 다양한 전문가 시스템이 인기를 끌었고 정부의 기금 지원도 늘기 시작했다.
-01_“AI의 기원과 진화” 중에서
GANS는 생성기(Generator)와 판별기(Discriminator)로 구성된다. 생성기는 기존 데이터와 비슷한 모조 데이터를 생성하고, 판별기는 그 데이터가 실제 데이터인지 구별한다. 둘 사이의 경쟁 학습은 모조 데이터와 실제 데이터를 구별할 수 없는 단계에 이를 때까지 진행된다. GANs는 진짜 같은 비디오나 오디오, 딥페이크를 생성하는 데 사용되지만 엑셀 형식의 합성 데이터를 만드는 데도 이용된다.
-03_“생성형 AI 개론 ” 중에서
인터넷에서 무료로 사용할 수 있는 챗GPT나 다른 AI 모델은 사용자가 입력하는 데이터를 훈련용으로 활용할 수 있다. 많은 AI 챗봇은 약관에서 사용자의 입력 내용이 “서비스 개발과 향상을 목적으로” 사용될 것이라고 밝혀 놓았다. 대규모 언어 모델이나 AI 시스템과 별반 연관성이 없어 보이는 기업들이 챗GPT나 다른 생성형 AI 툴을 서비스에 내장하고 사용자들의 입력 데이터를 훈련 용도나 상업적 목적에 활용하는 상황도 문제일 수 있다.
-06_“생성형 AI와 프라이버시” 중에서
데이터 수집 자체를 금지하는 것은 해답이 될 수 없다. 생성형 AI 개발을 둘러싼 여러 나라와 기업들 간의 치열한 경쟁 상황을 고려할 때, 그와 같은 조치는 현실적으로 불가능할 뿐 아니라 기술혁신을 가로막는 치명적 부작용을 초래할 수 있기 때문이다. 만에 하나 인터넷의 공개 데이터 수집을 전면 금지한다면 생성형 AI의 개발 자체가 불가능해질 수도 있다. AI의 훈련 재료가 사라져 버리는 셈이기 때문이다.
-09_“생성형 AI와 프라이버시의 균형 잡기” 중에서