"챗봇 다음은 영상"… AI 빅테크, 4K화질·음향 ‘신기술 경쟁’
2024.12.25 09:00
수정 : 2024.12.25 18:28기사원문
#2 구글도 지난 16일 영상 제작 AI '비오2'(VEO2) 데모 영상을 공개했다. 물안경을 쓴 닥스훈트가 물을 채운 풀장 바닥으로 잠수해 움직이는 장면이다. 다이빙하는 순간 발생하는 기포와 함께 수영장 바닥에 복잡하게 일렁이는 수면반사 현상을 완벽하게 표현했다.
글로벌 빅테크 기업들이 앞다퉈 동영상 제작을 위한 생성형 AI를 내놓으면서 '영상 AI 전쟁'이 본격화되고 있다. 기술이 발전하며 '진짜보다 더 진짜 같은' 영상을 누구나 쉽게 제작할 수 있다는 기대감도 커지고 있다. 한편 현재 소라는 챗GPT와 연동돼 요금이 월 최대 200달러에 달해 소비자의 AI 비용 부담이 늘어날 것이라는 전망도 나온다.
■구글·오픈AI·메타 ‘3파전’ 예상
25일 정보통신업계에 따르면 △오픈AI의 소라 △구글의 비오2 △메타(옛 페이스북)의 '무비 젠'(Movie Gen) 등 3개가 영상 AI의 3파전을 벌이는 양상이다. 각각 챗GPT, 구글, 인스타그램 등의 기존 이용자를 기반으로 서비스 유입을 빠르게 늘릴 것으로 보인다.
데모 영상이 공개된 비오2는 영상 제작 AI의 품질을 한 단계 끌어올렸다는 평가를 받고 있다. 4K(초고화질) 화질을 지원하고, 2분 이상의 영상을 만들 수 있다. 특히 비오2는 기존 동영상 AI로 구현하기 힘들었던 물리법칙이나 세부적인 묘사를 더 사실적이고 자연스럽게 할 수 있는 강점을 가졌다.
소라는 누구나 쉽게 사용할 수 있다는 강점을 내세워 시장을 선점하고 있다. 텍스트 프롬프트 기반으로 원하는 영상을 설명하면 최대 1080p(고화질) 영상에 20초 분량의 영상을 짧은 시간 안에 만들어준다.
메타가 만든 무비 젠도 자사의 서비스와 연계된다는 점이 가장 중요한 강점으로 보인다. 페이스북과 인스타그램 등을 이용하는 전 세계 이용자들이 쉽고 빠르게 서비스에 접근할 수 있을 것으로 예측된다. 최대 16초 길이의 영상을 만들 수 있는 무비 젠은 영상과 텍스트 프롬프트로 주변 소리, 악기 배경음악, 음향 효과 등을 포함한 최대 45초 길이의 오디오를 생성해낸다.
■생성형 AI 새 먹거리로 부상
빅테크들이 너도나도 영상 AI에 뛰어드는 것은 AI 챗봇을 넘어서 '영상 제작 AI'가 다음 먹거리 중 하나가 될 수 있다는 기대감 때문인 것으로 분석된다. 실제 지난 10일 오픈AI가 영상 AI 소라를 상용 서비스로 개방하자 이용자가 몰리면서 일시적으로 서비스 이용이 제한되기도 했다.
AI업계에선 생성형 AI만으로는 수익을 내기 어렵다는 지적이 제기돼 왔다. 생성형 AI 시장이 포화상태에 이르면서 가격경쟁이 시작됐기 때문이다. 이 가운데 영상 생성형 AI는 AI업계의 새 수익창출 기반으로 떠오르고 있다. 아울러 기존 자사 서비스에 이용자들을 고정시키는 록인(Lock-in) 효과도 기대할 수 있다. 챗GPT 유료 이용자가 소라를 이용하듯이 비오2도 유튜브 프리미엄, 크리에이터 등 유료 요금제와 연계될 가능성이 높다. 메타 역시 자사의 페이스북, 인스타그램, 등 SNS와 연계해 동영상 제작 기능을 활용하면서 충성도를 끌어올릴 계획이다.
■딥페이크 우려 목소리도
다만 영상 AI 기술 발전에 따른 부작용을 우려하는 목소리도 높다. 업계에서는 △영화·광고 업계 등 일자리 축소 △영상 저작권 문제 △딥페이크 문제 등을 대표적으로 꼽고 있다.
유현재 서강대 신문방송학과 교수는 "영상 제작 AI가 본격적으로 사용된다면 윤리와 안전 문제가 불거질 것"이라며 "특히 딥페이크를 포함해 '미디어 범죄'로 분류되는 수많은 파생범죄들이 늘어날 것으로 예상된다"고 했다.
wongood@fnnews.com 주원규 기자