AI가 영상편집, 문서스캔, 폰트제작까지 척척..보이저엑스

      2021.08.04 14:51   수정 : 2021.08.04 14:51기사원문
[파이낸셜뉴스] 딥러닝(인간두뇌와 닮은 인공신경망) 등 인공지능(AI)이 동영상 편집과 문서 스캔을 비롯해 손글씨 폰트까지 만들어주는 시대가 성큼 다가왔다. 차세대 딥마인드(구글 AI '알파고' 개발사)로 꼽히는 보이저엑스가 ‘AI 대중화’에 속도를 내면서다. 이와 관련 유력 벤처캐피털(VC)인 소프트뱅크벤처스, 알토스벤처스, 옐로우독은 각각 100억원씩, 총 300억원을 보이저엑스에 투자했다.

보이저엑스가 지닌 AI 기술 혁신성은 물론 서비스 시장성과 글로벌 경쟁력을 동시에 인정한 결과다.

보이저엑스는 현재 △AI 기반 영상 편집기 ‘브루(Vrew)’ △모바일 스캐너 ‘브이플랫(vFlat)’ △손글씨 폰트제작 ‘온글잎’ 등을 개발 및 서비스하고 있다.


브루 장재화 리더, 브이플랫 김무궁 리더, 온글잎 석영수 리더는 4일 파이낸셜뉴스와의 서면인터뷰를 통해 “글로벌 사용자 비율이 상대적으로 높은 브루와 브이플랫 성장 속도를 높이기 위해 이용자 목소리에 집중하고 있다”면서 “실제 AI 서비스를 이용한 사람들의 근원적 수요(니즈)를 화두로 비즈니스모델(BM)을 글로벌로 확장하겠다”고 강조했다.


다음은 브루 장재화 리더, 브이플랫 김무궁 리더, 온글잎 석영수 리더와의 일문일답.

―대규모 투자 유치 후 제시한 인재경영이 인상적이다.
▲브루 장재화 리더, 브이플랫 김무궁 리더, 온글잎 석영수 리더=보이저엑스는 AI 서비스를 개발하는 사람과 팀을 육성하는 회사를 목표로 설립됐다. 좋은 서비스를 만들면 돈을 잘 버는 것이 조금 쉬워질 것이고, 좋은 서비스를 만들려면 좋은 사람을 모아 좋은 팀을 키워야한다. 투자를 받은 만큼 우선 인재채용을 적극적으로 진행하고 있다. 지금 40명 정도 일하고 있으며 연내 100명, 내년 상반기에 150명까지 늘리는 것을 단기 목표로 세웠다. 또 서비스를 개발할 때부터 글로벌 사용자를 목표로 하고 있어서 이미 브루와 브이플랫은 글로벌 사용자 비율이 높다. 사용자 목소리에 집중하는 보이저엑스 문화가 모든 사용자에게 유용한 편의를 제공하는데 유효했던 것 같다. 글로벌 성장 속도를 더 높이기 위해 글로벌 사용자 목소리에도 더욱 귀를 기울이고 있다.

―보이저엑스가 개발한 AI 서비스 현황은.
▲장재화 브루 리더=브루는 AI 도움으로 쉽게 영상을 만들 수 있는 서비스다. 브루에 입력한 영상을 분석한 뒤, 음성기반으로 맥락이 있는 클립 단위를 자동으로 생성해준다. 기존에 파워포인트에서 문서를 작성하는 것 같은 방법으로 영상을 편집할 수 있다. 또 브루는 긴 영상도 짧은 시간에 분석하는 기술이 적용돼 있다. 1시간짜리 영상의 경우, 약 3분 정도면 AI가 영상 클립들을 생성해서 순서대로 나열하고 클립마다 자막도 생성해준다. 이 과정에서 박수소리, 웃음소리, 뜸들이는 소리 등 불필요한 부분을 찾아내서 제거하는 기술도 적용돼 있다.

▲김무궁 브이플랫 리더=브이플랫은 스마트폰으로 문서를 스캔할 수 있는 모바일 스캐너 앱이다. 모바일 기기에서 딥러닝 모델을 실시간 실행한다. 이를 통해 브이플랫은 하얀 책상 위에 놓인 하얀색 종이 문서도 빠르고 정확하게 인식할 수 있다. 책처럼 곡면인 문서도 AI를 이용해서 평면 문서로 만들어준다. 문서 촬영 중 생긴 그림자와 노이즈를 제거하고 깨끗한 문서로 만들어 준다. 문서 촬영 중 함께 찍힌 손가락은 AI가 자동으로 지워준다.

▲석영수 온글잎 리더=온글잎은 AI로 손글씨 폰트를 제작해주는 폰트제작 플랫폼이다. 사람이 몇 개 글자를 손으로 써서 넣어주면 AI가 나머지 한글 1만1172자 전체를 만들어준다. 기존에 한글 폰트를 만드는 일은 5000만원이 넘는 비용과 3개월 이상 시간이 소요됐다. 향후 AI로 폰트 제작비용과 시간을 100분의 1로 줄이는 것이 목표다.

―AI 서비스에 대한 개인과 기업 수요는.
▲장재화 브루 리더=브루는 월간활성사용자(MAU)가 1년 전에 비해 약 30% 늘었다. 그 중에서도 전체 사용자의 약 70%는 한번 이상 브루를 써 본 사람들이다. 그만큼 서비스 만족도가 높다는 의미다. 특히 한국과 일본에서 인기가 많은 데, 애플 운영체제(OS)인 iOS 사용자의 80%는 일본이다. 가장 많이 사용되는 기능은 자동 자막 생성이다. 최근에는 자막을 자동으로 번역해주는 기능이 추가돼서 유튜브나 학습용 영상에 번역 자막을 만드는 것이 쉬워졌다.

▲김무궁 브이플랫 리더=브이플랫은 MAU가 100만명을 넘어섰다. 1년 전에 비해서 사용자는 5배, 스캔량은 6배, 광학문자인식(OCR) 사용은 95배나 증가했다. 지난해까지는 인도 사용자 비율이 높았지만, 올해 들어 한국 사용자도 늘고 있다. 브이플랫 전체 이용자 중 한국 사용자 비율은 30% 정도이며, 나머지는 해외 사용자이다. 특히 브이플랫은 금융, 보험업계에서 많은 관심을 보이고 있다. 금융 소비자들이 문서를 스캔해 제출하는 일이 많이 발생하기 때문이다.

▲석영수 온글잎 리더=온글잎은 꾸준히 매출이 발생하고 있다. K-팝스타는 물론 유튜브 크리에이터, 기업, 개인까지 이용자 범위가 넓다. 광범위하게 손글씨 수요가 있다는 것을 확인해서 조금 더 본격적인 사업을 준비하고 있다. 예를 들어 사랑하는 가족, 자녀의 손글씨를 폰트로 제작해 선물하거나 기념할 수 있는 상품 등이다. 아직 갈 길이 멀지만 고딕체와 같은 정교한 폰트를 만드는 것도 계속 시도하고 있다.


―인간과 협업할 수 있는 AI에 대한 견해.
▲장재화 브루 리더=기계가 인간보다 잘 할 수 있는 부분은 통상 ‘비인간적’이라 부르는 작업이다. 비교적 제한된 지적 역량으로 반복이 필요한 일이다. 하지만 딥러닝은 단순한 수식으로 환원하기 힘든 작업들도 굉장히 잘 처리하기 때문에 이전보다 훨씬 더 넓은 영역에서 작업이 가능하다. 하지만 본질적으로 ‘모호하지 않고’, ‘정답이 있는 작업’을 잘 처리하기 때문에 기존처럼 비인간적 작업을 대신 처리해 주는 것에 더 효용이 있다. 이런 관점에서 딥러닝은 인류가 약한 부분을 채워주면서 인류와 협업할 수 있는 훌륭한 도구가 되리라 생각한다.

―‘딥페이크 불법 합성물’에 대한 우려가 높다.
▲장재화 브루 리더=딥페이크로 영상을 조작해 악용하는 사례가 있다는 점에 대해서 경계심을 가져야 한다. 포토샵으로 이미지를 편집하는 것처럼 어떤 매체가 디지털로 표현되면 수정이 용이하고 위·변조가 쉽기 때문이다. 영상은 지금까지 기술 미비로 수정이 매우 비싼 매체였다.
하지만 딥러닝 기술 등장으로 이미지 등 다른 매체와 비슷하게 수정이 점점 용이해지고 있다. 딥페이크도 그 부작용 중 하나다.
지금까지는 영상 수정이 너무 비싸서 무비판적으로 영상은 ‘진실’이라고 생각했지만, 앞으로는 영상 자체도 무조건 진짜라고 생각하지 않고 비판적으로 받아들여야 하지 않을까 생각한다.

elikim@fnnews.com 김미희 기자

Hot 포토

많이 본 뉴스