IT 정보통신

구글, 신경망 번역, 두달만에 이용량 50% 증가

서영준 기자

파이낸셜뉴스

입력 2017.02.09 14:24

수정 2017.02.09 14:24

관련종목▶

구글이 신경망 기계번역(GNMT)을 도입한지 두달만에 한국어-영어 번역의 이용량이 50%나 증가했다. GNMT는 기존 구문 기반 기계번역(PBMT)이 문장을 단어와 구 단위로 쪼개서 하나하나 개별적으로 번역한 것과는 달리, 전체 문장을 하나의 번역 단위로 간주해 한꺼번에 번역한다. 따라서 자연스러운 번역이 가능하다. 여기다 기계학습(Machine Learning)의 한 분야인 딥러닝Deep Learning)까지 가세하면서 번역의 정확도가 시간이 지날수록 높아지고 있다.

구글은 9일 서울 강남구 대치동 구글캠퍼스에서 인공지능(AI) 포럼을 개최했다. 이날 포럼에서는 구글 마이크 슈스터 리서치 전문가가 화상 연결을 통해 구글 번역의 성과와 GNMT에 대해 설명을 진행했다.

■"GNMT 적용 후 번역 품질 개선"
구글은 지난해 9월 처음으로 번역에 GNMT를 적용하고, 11월에는 한국어를 포함한 8개 언어 총 16개 언어 조합에 GNMT를 적용했다. 슈스터는 "구글은 10년 전부터 문장을 단어로 쪼개서 일일이 번역하는 PBMT를 사용했다"며 "GNMT를 추가하면서 번역 품질의 개선을 이뤘다"고 말했다.


현재 구글 GNMT 번역의 품질은 6점 만점을 기준으로 평균 5점 정도의 수준을 나타내고 있다. 인간의 번역도 점수로 환산하면 5점 중반 정도의 수준에 그치고 있다. 슈스터는 "문장 자체가 어려워 번역을 하기에 쉽지 않은 경우가 있어 인간도 번역 점수가 6점이 되지 않는다"며 "GNMT를 적용함으로써 인간의 번역 품질에 근접했다고 평가할 수 있다"고 설명했다.

번역 정확도가 높아지고, 번역에 걸리는 시간까지 줄어들면서 구글 번역을 찾는 이용자도 늘고 있다. 실제 지난해 11월 한국어-영어 번역에 GNMT을 도입한 후 두달만에 구글 번역 이용량이 50% 증가했다. 그는 "아시아권 언어는 그동안 번역을 하기에 어려운 언어로 인식돼 왔다"며 "GNMT 도입 후 아시아 언어에 대한 번역의 품질이 굉장히 높아졌다"고 했다.

구글 마이크 슈스터 리서치 전문가가 9일 화상 연결을 통해 구글 번역의 성과와 신경망 기계번역에 대해 설명을 진행하고 있다.
구글 마이크 슈스터 리서치 전문가가 9일 화상 연결을 통해 구글 번역의 성과와 신경망 기계번역에 대해 설명을 진행하고 있다.

■네이버 파파고, 한국어 번역 강점
구글이 GNMT를 활용해 번역의 품질을 높이는 가운데, 국내에서는 네이버가 구글의 뒤를 쫓고 있다. 네이버는 구글과 달리 한국어에 특화된 번역을 강점으로 내세운다. 구글의 경우 한국어보다는 전 세계에서 사용되는 103개 언어에 대응하고 있어 네이버와는 차이가 있다.

네이버랩스가 자체 개발한 통번역 애플리케이션 파파고는 한국어-영어, 한국어-중국어, 한국어-일본어에 GNMT를 적용하고 있다. 이 가운데 한국어-중국어의 경우 구글보다 먼저 GNMT를 적용했다. 파파고는 올해 중으로 스페인어, 프랑스어, 인도네시아어, 태국어, 대만어, 베트남어 등 6개 언어 간의 번역 서비스에도 GNMT를 확대할 예정이다. 네이버 관계자는 "번역 서비스 품질만 놓고 보면 구글과 큰 차이가 없는 수준"이라며 "한국어의 경우 구글보다 높은 품질을 자부한다"고 말했다.

네이버 외에도 한컴그룹도 통번역 분야에서 두각을 나타내고 있다. 한컴그룹은 지난 8일 퓨처로봇과 업무협약을 체결하면서 2018년 평창동계올림픽에 통역 안내 로봇을 선보일 예정이다. 통역 안내 로봇에는 한컴그룹의 통번역 서비스인 한컴 말랑말랑 지니톡이 적용될 계획이다.

■기계학습 통해 스팸 메일 걸러낸다
구글은 이날 AI의 한 분야인 기계학습에 대해서도 발표했다. 기계학습은 하나의 프로그램에 일일이 작동법을 입력하는 대신 예시를 통해 기계 스스로 훈련시키는 기술을 의미한다.
가령 고양이 이미지를 보여주면서 고양이라는 답이 나올 때까지 관련 데이터들을 주입시키고, 오류를 수정해 나가는 방식이다.

구글의 서비스 가운데 기계학습이 적용된 사례는 구글 포토, 구글 어시스턴스, 지메일 등이다.
구글코리아 박영찬 테크리더는 "지메일의 경우 현재 스팸 메일을 걸래내는 비율이 99.9%에 달한다"며 "기계학습을 통해 지메일에서 스팸 메일이 자동적으로 걸러낼 수 있도록 학습한 결과"라고 설명했다.

syj@fnnews.com 서영준 기자

fnSurvey