IT 정보통신

AI 빅테크 맞서 자국어 LLM 개발 경쟁 치열

김준혁 기자

파이낸셜뉴스

입력 2024.05.27 15:51

수정 2024.05.27 16:20

각국 문화 이해 가능한 특화형 개발 추세
인도·유럽·日 등 상황에 맞는 모델 집중
국내선 SKT·네이버가 선도
신조어·합성어·사투리 등도 답변 가능
SKT, 조만간 한국어 특화통신 LLM 공개
글로벌 텔코LLM 구축에 있어 '소버린 AI' 시너지 기대
네이버, B2B 효율·비용 겨냥 경량모델 선봬
연합뉴스
연합뉴스

[파이낸셜뉴스] 글로벌 빅테크 기업들의 인공지능(AI) 거대언어모델(LLM) 개발에 맞서 각국의 문화와 언어에 특화된 '소버린 AI'에 대한 관심이 갈수록 높아지고 있다.

유럽, 인도, 일본, 중국 등은 자국의 문화와 환경에 맞는 AI 모델 개발에 나서고 있다. 국내에서도 네이버, SK텔레콤 등이 한국 문화와 언어에 특화된 모델 상용화에 앞장서고 있다.

전 세계 각국 자체 AI 개발 추진 현황
국가 내용
영국 영국판 자체 대규모 AI 모델 개발을 위해 정부가 1조5000억원 이상 투자
영국의 문화, 역사 등에 초점을 맞춘 챗GPT 모델 ‘브릿GPT‘ 모델 개발
인도 AI 스타트업 크루트림이 인도에서 법적으로 허용한 공영어 20개 이상의 언어를 학습한 LLM을 개발
인도 정부는 인력 개발 및 자국 내 인프라 지원을 촉진하는 ‘주권 AI 이니셔티브‘를 추진 중
인도 대기업 릴라이언스 그룹은 인도의 다양한 언어를 훈련한 생성형 AI를 개발 중
일본 정부가 민간과 함께 일본어에 기반한 자체 AI 모델을 개발 중...자연재해 대응에 특화된 AI 개발에 초점
소프트뱅크는 일본 전역에 AI 데이터센터 구축해 자체 생성형 AI 개발 목표
이탈리아 대표 통신사 패스트웹이 이탈리어어로 훈련된 LLM 개발 소식을 알림...엔비디아 슈퍼컴으로 이탈리아 기업과 행정기관에 생성형 AI 기반의 컴퓨팅 기능 제공을 기대 중
프랑스 오픈AI 대항마로 떠오른 ‘미스트랄AI‘ 육성에 집중
중국 중국 대표 ICT 기업인 화웨이를 중심으로 중국어 자연어 처리에 특화된 ‘판구 알파‘ 등을 밀고 있음
국경 있는 AI…'소버린 AI'가 뜬다

27일 업계에 따르면 주요 국가들은 AI 주권 및 자체 능력을 키우고, 각국에 특화된 모델을 개발하기 위해 문화, 역사, 특성에 맞는 AI 모델 개발에 속도를 내고 있다.

영국 정부는 GPT4 같은 파운데이션 모델 훈련을 위해 1억파운드(약 1742억원) 및 슈퍼컴퓨터에 9억파운드(약 1조5682억원)를 투입키로 했다.
오픈AI, 구글 등 미국 기업을 중심으로 형성 중인 AI 패권을 견제하고, 영국 문화와 역사에 초점을 맞춰 설계된 '브릿GPT'를 개발하겠다는 목표다. 일본도 민간 기업들과 함께 일본어에 기반한 자체 AI 모델 개발을 추진하고 있다. 일본 소프트뱅크도 일본 전역에 AI 데이터센터를 구축해 자체 생성형 AI를 개발할 계획이다.

인도의 스타트업 크루트림은 20가지 이상의 인도 언어를 이해하고 10가지 언어로 콘텐츠를 생성할 수 있는 거대언어모델(LLM)을 개발했다. 인도만의 문화, 맥락, 문법 등 문화적 정체성을 아우를 수 있는 모델이다. 이탈리아 대표 통신사 패스트웹은 올해 1·4분기 실적발표에서 이탈리아어로 훈련된 첫 LLM 개발 소식을 알렸다. 이외에 중국, 프랑스도 각각 화웨이, 미스트랄AI 등 자국의 AI 대표 기업 키우기에 집중하고 있다.

네이버 클로바, 에이닷 로고(왼쪽부터).
네이버 클로바, 에이닷 로고(왼쪽부터).
韓도 신조어·사투리까지 'OK'

국내 기업들도 한국어 특화 모델 개발에 앞장서고 있다. 네이버는 초대규모 AI 모델 하이퍼클로바X를 공개한 이후 B2C 및 B2B 분야 공략에 나섰다. 비슷한 시기 SKT도 AI 개인비서 애플리케이션(앱)이자 자체 AI와 챗GPT 등 범용 AI가 결합된 '에이닷'을 공식 출시했다.

네이버의 하이퍼클로바X와 SKT의 에이닷엑스 모두 한국어 및 환경에 특화돼 있다는 점이 특징이다. '오운완', '그잡채', '룸곡높옾' 등 신조어를 비롯해 사투리 질문에 대한 답변이 가능하다. 클로바X의 경우 '가가 가가', '하모' 등 심화된 사투리를 비롯해 '제4이통'과 같은 줄임말에 대한 답변 정확도와 섬세함이 챗GPT 대비해서도 높았다. 챗GPT는 제4이통을 묻는 질문에 대해선 '4세대 이동통신'과 같은 엉뚱한 답변을 내놓기도 했다.

네이버와 SKT는 이 같은 한국어 특화 AI 모델 활용 범위를 B2B 쪽으로 넓히는 데 집중하고 있다.

네이버는 지난달 초대규모 AI 하이퍼클로바X를 경량화한 신규 모델 '대시'를 공개했다.
SKT는 이르면 내달 중 한국 통신 분야에 특화된 텔코LLM을 공개할 예정이다. SKT는 중장기적으로 각 지역 대표 통신사와 맺은 글로벌 텔코 얼라이언스(GTAA)를 기반으로 한 각 지역 특화 LLM 서비스를 목표로 하고 있다.
각 주요국의 '소버린 AI' 역량이 GTAA에 대한 시너지로 이어질 수 있을 것이란 기대감도 일각에선 나온다. jhyuk@fnnews.com 김준혁 기자

fnSurvey