[생성 AI 길라잡이] GPT-4o 이미지 생성은 왜 새삼스레 주목받는가?
지난 3월 25일 출시된 오픈AI의 GPT-4o 이미지 생성 기능이 전 세계적인 반향을 일으키고 있다. 지금까지 오픈AI의 생성형 AI로 제공되는 이미지 기능은 2023년 9월 출시된 DALl-E3를 기반으로 했는데, 이번에 출시된 버전은 GPT-4o의 멀티모달 기능을 활용한 새로운 버전이다. 멀티모달은 텍스트, 이미지, 음성, 비디오 등 다양한 유형의 데이터를 복합적으로 조합해 인식 및 활용하는 인공지능 처리 방식이다.지금까지 활용된 DALL-E3는 문장을 입력하면 인공지능이 이를 인식해 이미지로 변환하는 형태였다. 텍스트로만 이미지를 구상하다 보니 원하는 구도나 이미지 형태, 스타일 등을 원한다면 세세하고 구체적으로 하나하나 건드려야 했다. 이미지를 이미지로 전환하거나 인식하는 능력도 부족했고, 이미지 구축 중 환각 현상이나 프랙털 등 초현실적인 느낌도 개입했다. 상업적 이용까지는 어렵고, 작례를 생성하는 수준에 가까웠다. 이런 한계를 해결한 버전이 이번에 공개된 GPT-4o 이