딥시크, 데이터 학습보다
추론문제 해결 자체 집중
‘제로 인간’ 선호 머지않아
추론문제 해결 자체 집중
‘제로 인간’ 선호 머지않아

새해 인공지능의 화두는 딥시크다. 산업계와 학계에서 딥시크에 대한 논의가 폭넓고도 촘촘하나, 아직 이야기하지 않은 재미있는 구석이 남아 있다. 우선 모두의 궁금증들을 '빨리 감기' 해보자. 제작비용이 정말 10분의 1 수준일까. 숨겨진 간접비용 등 산정방식에 따라 달라질 수 있으나, 파운데이션 모델로 불리는 거대 인공지능을 활용하여 작은 모델을 학습하는 증류기법(Distillation)이나 연산 포맷의 단순화 등으로 학습비용이 줄어들고 있는 것만큼은 사실이다. 개인정보 유출 문제는 어떨까. 플랫폼 기업이나 다른 범용인공지능 서비스도 그러하듯 이것은 정도의 문제이고, 딥시크가 요구하는 정보의 범위와 활용방식이 명확해질 때까지는 조심하자.
엔비디아나 인공지능 모델의 백본이 되는 반도체 기업에 호재일까. 인공지능 서비스 구현의 진입장벽이 낮아져 중장기적으로 반도체 수요가 늘어날 것으로 예상된다. 딥시크가 가성비를 높인 인공지능 기술을 공개함으로써 국내 인공지능 산업이 활성화될까. 진입장벽이 낮아지고 적용 범위가 넓어지는 효과가 기대되지만 산업 전망을 진단하는 기업 당사자의 이해관계를 배제할 수 없다는 점은 명심하자.
제작사가 공개한 기술문서에 따르면 딥시크는 완전히 새로운 기법을 도입하기보다는 기존의 인공지능 기술을 영리하게 활용하고 있다.
기술적 측면에서 보면 딥시크는 GPT와 같은 기존 인공지능 모델의 친척 정도로 보는 것이 적절하다. 그러나 같은 레고블록이라도 어떻게 사용하느냐에 따라 얼마든지 다른 결과물이 나올 수 있으니, GPT와 대비되는 특징 하나가 눈에 띈다. GPT가 인간이 만든 데이터를 학습하는 것에서 출발하여 마지막 출력단 정렬 과정에서 강화학습을 사용하였다면, 딥시크의 기반 모델인 딥시크R1제로는 인간의 데이터 학습보다는 추론문제 해결 자체에 집중한다. 그 결과 종종 인간에게 생소한 언어를 사용하지만 수학이나 코딩과 같은 논리적 문제 해결 분야에서 두각을 보인다. 알파고가 바둑의 기보라는 인간 데이터를 베이스로 강화학습하여 이세돌 기사와 세기의 대결을 펼쳤다면, 이후 출시된 알파고 제로에서는 인간 데이터를 사용하지 않은 제로 베이스의 강화학습을 사용하여 경량화와 성능 향상이라는 '두 마리 토끼'를 모두 잡은 것과 같은 모양새다. 쉽게 말해 딥시크 이전과 이후의 인공지능, 이 두 흑백요리사의 레시피는 다음과 같다. GPT와 알파고가 인간의 데이터를 재료 삼아 인공지능으로 요리해 낸 것이라면, 딥시크 제로와 알파고 제로는 순수한 인공지능 베이스를 인간의 양념에 재어 놓았다고 볼 수 있다. 이는 인간의 문제해결 방식이 인공지능의 학습에 족쇄가 될 수도 있으며, 때로는 제로 베이스가 나을 수도 있음을 시사한다.
빈 석판, 백지, 제로 베이스를 뜻하는 타불라 라사(tabula rasa)에서 출발하여 후천적으로 학습하는 제로 인공지능이 존재감을 드러내고 있다. 인간의 지식은 비싸지만 제로 인공지능이 생산하는 지식은 상대적으로 싸다. 그리고 인간과 인공지능의 지식을 증류하여 가성비를 높인다. 식품업계의 제로 열풍처럼 인공지능도 '제로 인간'을 선호할 날이 다가온다. 더 똑똑하고 체질 좋은 인공지능을 원한다면 인간다워야 한다는 조건을 놓아주어야 할까. 그런데 그때는 누가 주인이고, 누가 자비스가 될 것인가.
KAIST 뇌인지과학과 부교수 신경과학-인공지능 융합연구센터장
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지