우리말 능통한 AI 만들자… 불붙은 '자국어 LLM’ 개발 경쟁

      2024.05.27 18:27   수정 : 2024.05.27 18:27기사원문
글로벌 빅테크 기업들의 인공지능(AI) 거대언어모델(LLM) 개발에 맞서 각국의 문화와 언어에 특화된 '소버린 AI'에 대한 관심이 갈수록 높아지고 있다.

유럽, 인도, 일본, 중국 등은 자국의 문화와 환경에 맞는 AI 모델 개발에 나서고 있다. 국내에서도 네이버, SK텔레콤 등이 한국 문화와 언어에 특화된 모델 상용화에 앞장서고 있다.



■국경 있는 AI…'소버린 AI'가 뜬다

27일 업계에 따르면 주요 국가들은 AI 주권 및 자체 능력을 키우고, 각국에 특화된 모델을 개발하기 위해 문화, 역사, 특성에 맞는 AI 모델 개발에 속도를 내고 있다.

영국 정부는 GPT4 같은 파운데이션 모델 훈련을 위해 1억파운드(약 1742억원) 및 슈퍼컴퓨터에 9억파운드(약 1조5682억원)를 투입키로 했다.
오픈AI, 구글 등 미국 기업을 중심으로 형성 중인 AI 패권을 견제하고, 영국 문화와 역사에 초점을 맞춰 설계된 '브릿GPT'를 개발하겠다는 목표다. 일본도 민간 기업들과 함께 일본어에 기반한 자체 AI 모델 개발을 추진하고 있다. 일본 소프트뱅크도 일본 전역에 AI 데이터센터를 구축해 자체 생성형 AI를 개발할 계획이다.

인도의 스타트업 크루트림은 20가지 이상의 인도 언어를 이해하고 10가지 언어로 콘텐츠를 생성할 수 있는 거대언어모델(LLM)을 개발했다. 인도만의 문화, 맥락, 문법 등 문화적 정체성을 아우를 수 있는 모델이다. 이탈리아 대표 통신사 패스트웹은 올해 1·4분기 실적발표에서 이탈리아어로 훈련된 첫 LLM 개발 소식을 알렸다. 이외에 중국, 프랑스도 각각 화웨이, 미스트랄AI 등 자국의 AI 대표 기업 키우기에 집중하고 있다.

■韓도 신조어·사투리까지 'OK'

국내 기업들도 한국어 특화 모델 개발에 앞장서고 있다. 네이버는 초대규모 AI 모델 하이퍼클로바X를 공개한 이후 B2C 및 B2B 분야 공략에 나섰다. SKT도 AI 개인비서 애플리케이션(앱)이자 자체 AI와 챗GPT 등 범용 AI가 결합된 '에이닷'을 공식 출시했다.

네이버의 하이퍼클로바X와 SKT의 에이닷엑스 모두 한국어 및 환경에 특화돼 있다는 점이 특징이다. '오운완', '그잡채', '룸곡높��' 등 신조어를 비롯해 사투리 질문에 대한 답변이 가능하다. 클로바X의 경우 '가가 가가', '하모' 등 심화된 사투리를 비롯해 '제4이통'과 같은 줄임말에 대한 답변 정확도와 섬세함이 챗GPT 대비해서도 높았다. 챗GPT는 제4이통을 묻는 질문에 대해선 '4세대 이동통신'과 같은 엉뚱한 답변을 내놓기도 했다.

네이버와 SKT는 이 같은 한국어 특화 AI 모델 활용 범위를 B2B 쪽으로 넓히는 데 집중하고 있다.

네이버는 지난달 초대규모 AI 하이퍼클로바X를 경량화한 신규 모델 '대시'를 공개했다.
SKT는 이르면 내달 중 한국 통신 분야에 특화된 텔코LLM을 공개할 예정이다. SKT는 중장기적으로 각 지역 대표 통신사와 맺은 글로벌 텔코 얼라이언스(GTAA)를 기반으로 한 각 지역 특화 LLM 서비스를 목표로 하고 있다.
각 주요국의 '소버린 AI' 역량이 GTAA에 대한 시너지로 이어질 수 있을 것이란 기대감도 일각에선 나온다.

jhyuk@fnnews.com 김준혁 기자

Hot 포토

많이 본 뉴스