텍스트, 오디오, 이미지 등의 기존 콘텐츠를 활용하여 유사한 콘텐츠를 새로 만들어내는
인공지능(
AI) 기술.
생성형 인공지능은 단순히 콘텐츠의 패턴을 학습하여 추론 결과로 새로운 콘텐츠를 만들어내는 것을 넘어 콘텐츠의
생성자와 만들어진 콘텐츠를 평가하는 판별자가 끊임없이 서로 대립하고 경쟁하며 새로운 콘텐츠를 생성해내는 기술이다. 특히, 이미지 분야에서는 특정 작가의 화풍을 모사한 그림으로 사진을 재생성하거나 가짜 인간 얼굴을 무제한으로 생성하여 쇼핑, 영화 등의 산업에서 활용한다. 음성 분야에서는 특정 장르의 음악을 작곡하거나 특정 노래를 원하는 가수의 음색으로 재생성하는 등으로 활용한다.
상업적 혹은 사회적인 쟁점으로 가장 대중적으로 알려진 생성형 인공지능으로는 ‘인물 합성 기술(deepfake)’이 있다.
생성형 인공지능 기술에는
기계 학습 모델 중 생성 모델(generative model)이 사용되며, 대표적인 생성 모델로는 오토인코더(autoencoder)와 생성적 대립 신경망(
GAN: Generative Adversarial Network)이 있다.
한편 생성형 인공지능은 정치인의 선동 영상 혹은 가짜 뉴스, 특정 인물로 조작된 음란물,
보이스 피싱 등에도 악용될 수 있다. 이로 인한 사회문제는
인공지능 활용의 윤리적 문제에 관한 경각심과 사회적 합의에 관한 쟁점을 일으켰다.