IT 정보통신

코난테크놀로지, 초거대언어모델 자체 개발 박차.. 엔비디아 H100 입고

파이낸셜뉴스

입력 2023.06.16 11:45

수정 2023.06.16 11:45

코난테크놀로지, 초거대언어모델 자체 개발 박차.. 엔비디아 H100 입고

코난테크놀로지가 초거대언어모델 자체개발에 박차를 가한다고 16일 밝혔다. 엔비디아 최신 그래픽처리장치(GPU) 장비 입고로 국내를 넘어 글로벌 빅테크와 겨룰 수 있는 AI 기술 경쟁력을 갖출 것으로 기대를 모은다.

정부는 인공지능(AI) 일상화를 발표했고 챗GPT에 대한 민간의 관심 역시 커지는 상황이다. 이에 따라 코난테크놀로지는 생성형 AI 시장에 선도적으로 대응하기 위해 코난 초거대언어모델(LLM) 개발에 힘을 쏟고 있으며 올해 3·4분기 중 개발을 완료해 발표하는 것을 목표로 하고 있다.

이를 위해 지난 2월 국내에서 가장 먼저 NVIDIA의 H100 장비 8대를 발주했다.
대량 데이터와 파라미터 기반 LLM 학습에는 고성능 GPU 서버가 필요하기 때문이며 4달여간의 기다림 끝에 이번주 입고됐다. 입고 또한 국내 최초라는 것이 회사 측 설명이다. 이로써 코난 GPT를 개발하는데 걸리는 시간을 크게 단축해 개발 우위에 설 수 있을 것으로 보인다. H100 입고 전에는 미국 클라우드 업체 H100 인스턴스를 대량으로 리스해 사용해왔다. 내달 중 13B 파운데이션 모델을 갖추고 H100 입고를 계기로 3·4분기 중 20B 파운데이션 모델을 확보하는 것이 코난LLM 개발 타임라인이다.

통상 AI 산업의 핵심 요소는 장비, 인력, 데이터다. 코난테크놀로지는 지난해 120명에서 올해 157명으로 개발인력을 지속적으로 증원 중이다. 확충된 AI 연구 개발인력을 통해 급변하는 기술들에 대응할 태세를 마련했고 2007년부터 운영한 PulseK AI 분석 서비스를 통해 축적된 약 205억건의 고품질의 한국어 데이터를 갖추고 있다. 특히나 초거대언어모델 구축에 가장 중요한 대량의 한국어 데이터를 보유하고 있다는 점에서 의미를 가진다.

아울러 이번 H100 입고까지 더해져 인공지능 선두 기업으로서의 행보를 증명했다. 이로써 코난테크놀로지는 코난 GPT와 코난 챗GPT(가제)를 필두로 한 LLM 개발에도 박차를 가할 수 있게 됐다. 특히 코난테크놀로지 LLM은 기존 챗GPT와 하이퍼클로바 API에 의존하는 다른 회사와 크게 차별화된다.
코난 GPT의 경우 전체 학습 토큰은 1조개 이상, 이 중 한국어 토큰은 5000억개 이상이다. 한국어 토큰의 경우 국내 빅테크와 겨뤄도 비교우위에 서는 수준이기 때문이다.


김영섬 코난테크놀로지 대표이사는 "차별화 된 환경에서 자체개발 초거대 AI언어모델을 출시해 회사 기밀이나 개인정보 보안 등이 중요한 B2G, B2B시장에 성공적으로 진출하겠다"고 포부를 전했다.

solidkjy@fnnews.com 구자윤 기자

fnSurvey