[파이낸셜뉴스] 아마존웹서비스(AWS)가 멀티모달 인공지능(AI)을 사용해 영상 검색 기능을 개발하는 스타트업 트웰브랩스(Twelve Labs)가 AWS에서 자체 기반 모델을 구축하고 확장하고 있다고 4일 발표했다.
트웰브랩스는 자연어를 영상 내 동작, 객체, 배경 소리 등과 매핑하는 기반 모델을 통해 영상 검색, 장면 분류, 요약, 클립 챕터 구분이 가능한 애플리케이션을 지원한다. 이러한 기술은 스포츠, 미디어, 엔터테인먼트, 게임 등 다양한 산업에서 활용 가능하며, 개발자는 AWS 마켓플레이스에서 제공되는 모델을 통해 대량의 영상 데이터를 효과적으로 관리하고 분석할 수 있다.
트웰브랩스는 AWS 세이지메이커 하이퍼팟을 사용해 다양한 데이터 형식을 동시에 이해할 수 있는 기반 모델을 훈련한다. 이를 통해 영상, 이미지, 텍스트, 음성을 통합적으로 분석하며, 병렬 처리로 모델 훈련 속도를 크게 높였다. 훈련 작업은 AWS 컴퓨팅 인스턴스에 분산되어 몇 주 또는 몇 달 동안 안정적으로 수행된다. 이를 통해 트웰브랩스는 컴퓨팅 비용을 효율적으로 관리하면서도 모델의 성능을 지속적으로 개선했다.
3년간의 전략적 협력 계약(SCA)을 통해 트웰브랩스는 AWS와 협력해 고급 영상 이해 모델을 전 세계로 확장하고 새로운 산업 분야로의 진출을 모색하고 있다. AWS 액티베이트 프로그램은 트웰브랩스가 생성형 AI 기술을 글로벌 수준으로 확장하는 데 필요한 지원을 제공하며, 수백 페타바이트 규모의 영상 데이터에서 초 단위로 정확한 통찰력을 도출하도록 돕는다. 또 AWS 마켓플레이스를 통해 트웰브랩스는 혁신적인 영상 인텔리전스 서비스를 글로벌 고객들에게 제공하고 있다.
이재성 트웰브랩스 최고경영자(CEO)는 “영상 데이터의 약 80%가 검색이 어려운 형태로 존재하는데, AWS의 기술이 이를 해결하고 인간처럼 영상을 이해하는 데 중요한 역할을 하고 있다며” “트웰브랩스가 멀티모달 AI의 경계를 넓히며 더 많은 산업에서 영상 데이터를 활용할 수 있도록 계속 혁신해 나갈 것”이라고 덧붙였다.
wongood@fnnews.com 주원규 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지