코난테크놀로지가 스마트폰에 자체 개발한 음성인식(STT), 음성합성(TTS), 대형언어모델(LLM)을 탑재한 차별화된 On-Device AI 기술력을 14일 공개했다.
코난테크놀로지는 이날 공식 유튜브채널에 ‘코난 온디바이스’라는 타이틀로 데모영상을 업로드했다. ‘코난 온디바이스’ 데모는 삼성전자의 갤럭시S24 울트라 모델에서 실시했다. 마이크 버튼을 탭해 한국어로 말하면 자동으로 음성이 인식되고, 실시간 번역 후 상대방에게 영어 음성으로 제공된다. 사용자가 말한 내용을 번역해 상대방 언어의 음성으로 들려주고, 사용자 언어와 상대방 언어 번역 결과가 스마트폰 화면에 대화 창으로 표시되는 방식이다. 현재 한국어와 영어 외에도 향후 업데이트를 통해 지원 언어를 추가할 계획이다.
음성인식은 기존의 챗GPT에서도 가능했지만 이에 더해 음성합성 기능이 추가됐다. 네트워크 연결 없이 디바이스 자체에서 사람의 말을 인식하고 상대방 언어로 번역해서 말 해주는 과정이 한번에 AI를 통해 처리되는게 특징이다. 또한 모바일 기기 자체의 CPU만 사용하기 때문에 저렴한 가격으로 각종 엣지 디바이스에서 효율적으로 이용할 수 있다.
제공형태는 안드로이드 및 리눅스 버전이다. 13개 언어를 인공지능(AI)으로 동시 통역하는 ‘코난 챗봇 플러스’는 현재 서울지하철 주요 역사 및 롯데백화점, 파라다이스카지노 등에 설치돼 외국어 및 관광객들의 의사소통을 돕고 있다.
실시간 번역에는 코난 LLM이 사용됐다. 온디바이스에 최적화 된 ‘코난 LLM-4B’ 모델이 새로 개발 및 탑재됐다. LLM을 통한 즉시 번역으로 온디바이스 생성AI의 응답성이 개선됐다.
‘코난 온디바이스’는 S24 울트라 퀄컴 스냅드래곤에서 작동됐으며, 저가의 퀄컴 ARM 계열 프로세서도 동작이 가능하다. 스마트폰 외에도 △카메라 △센서 △드론 △웨어러블 △스마트홈 디바이스 등에 적용할 수 있다. 또한 △내비게이션 △자율주행 보조장치와 같은 차량 디바이스에서 음성지시를 통해 운전자를 보조하고 운행을 제어하는 것은 물론 각종 공장과 제조사에서 음성으로 기계를 운영시켜 제품에 지능을 부여할 수 있다.
김영섬 코난테크놀로지 대표이사는 “그동안 축적해온 생성 AI 기술 역량을 결집시켜 각 하드웨어(HW)에 최적화된 온디바이스 AI 기술을 구현하고 다양한 수요처들과 비즈니스 기회를 만들고 매출로 연결시키겠다”고 말했다.
solidkjy@fnnews.com 구자윤 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지