영상·음성으로도 소통…생성형AI의 진화

2023.11.01 18:30 수정 : 2023.11.01 18:30기사원문

직장인 A씨는 출근길에 '챗GPT'와 늘 대화를 나눈다. 스마트폰 애플리케이션(앱) '챗GPT'를 통해 여행사진으로 대화를 시작하거나 음성명령으로 독감 증상에 대한 질의응답도 한다. 이때 영어는 한국어로 번역해주고, 한국인 발음도 명확하게 인식하기 때문에 '언어장벽'은 없다.

오픈AI가 지난해 11월 전 세계에 선보인 '챗GPT'가 1년 동안 빠르게 진화하며 생성형 인공지능(AI) 대중화를 앞당기고 있다. 텍스트 생성을 넘어 이제는 '보고, 듣고, 말할 수 있는' 챗봇 역할을 톡톡히 하고 있다.

특히 내년부터는 멀티모달 기반의 생성형 AI 경쟁이 더욱 뜨거워질 전망이다. 멀티모달은 인간과 텍스트, 이미지, 음성, 영상 등 다양한 형태로 AI 서비스를 주고받을 수 있는 기술이다.

1일 글로벌 시장조사기관 그랜드뷰리서치에 따르면 전 세계 생성형 AI 시장 규모는 2022년 101억4000만달러(약 13조7711억원)에서 오는 2030년에는 1093억7000만달러(약 148조5353억원)에 이를 것으로 전망된다. 즉 향후 멀티모달 AI가 다양한 산업과 융합하면서 연평균 35.6% 급성장할 것이란 게 그랜드뷰리서치의 분석이다.

오픈AI도 6일 미국에서 개최하는 자체 개발자대회를 통해 새로운 멀티모달 AI 프로젝트를 선보일 것으로 알려졌다. 앞서 오픈AI는 올해 9월 이미지 생성 AI '달리'의 세 번째 버전 '달리 3'를 공개하면서 챗GPT와 통합시킨 바 있다. 누구나 텍스트 입력만으로 AI 아티스트가 될 수 있도록 지원한 것이다. 이에 6일 공개될 멀티모달 AI에 세간의 관심이 집중되고 있다.

특히 멀티모달 AI가 산업 현장에 본격적으로 접목될 경우 파급력이 클 것으로 전망된다.

LG의 초거대 AI '엑사원 2.0' 기반 멀티모달 AI 플랫폼 '아틀리에'가 대표적이다. 이미지를 언어로 표현하고 언어를 이미지로 시각화하는 아틀리에는 LG그룹의 전문 디자이너들이 주로 사용할 것으로 예상된다.

업계 관계자는 "신제품 출시를 앞두고 디지털 마케팅 등 각종 이미지를 만드는 과정에서 인력, 비용, 시간이 굉장히 많이 투입된다"며 "하지만 멀티모달 등 생성형 AI와 협업하면 한 달에 이미지 10개를 만들었던 프로젝트도 10배 가까이 제작분량을 늘릴 수 있다"고 전했다.

elikim@fnnews.com 김미희 임수빈 기자

영상·음성으로도 소통…생성형AI의 진화

Hot 포토

많이 본 뉴스