엔비디아, 신형 AI 칩 공개.. "GB200, H100보다 추론 성능 30배"
2024.03.19 09:27
수정 : 2024.03.19 09:27기사원문
인공지능(AI) 반도체 선두 주자 미국 엔비디아가 18일(현지시간) 차세대 AI 칩과 가속기를 선보였다.
엔비디아는 이날 미국 캘리포니아주 새너제이 SAP 센터에서 개발자 콘퍼런스 'GTC(GPU Technology Conference) 2024'를 열고 차세대 AI 칩 블랙웰 'B200'와 AI 가속기 'GB200'을 공개했다.
블랙웰은 게임 이론과 통계학을 전공한 수학자이자 흑인으로는 최초로 미국국립과학원에 입회한 데이비드 헤롤드 블랙웰을 기리기 위해 붙여진 이름이다.
젠슨 황 CEO는 "1.8조 파라미터 모델을 학습하려면 기존엔 8000개의 호퍼 GPU와 15메가와트가 필요했다면 이제는 2000개의 블랙웰 GPU가 4메가와트만 소비하면서 할 수 있다"고 말했다.
AI 가속기인 GB200은 'B200' 두 개와 하나의 그레이스 중앙처리장치(CPU)로 구성돼 있다.
GB200은 H100 대비 최대 30배의 거대언어모델(LLM) 추론 성능 향상을 제공하며 비용과 에너지 소비는 최대 25분의 1 수준이라고 엔비디아는 설명했다. 또한 GB200는 1750억개의 파라미터로 GPT-3 거대언어모델(LLM) 벤치마크(성능실험)를 한 결과 기존 H100보다 성능이 7배 이상이며 학습 속도도 4배 이상 빠르다고 전했다.
특히 엔비디아는 각 뉴런마다 8비트가 아닌 4비트를 사용해 컴퓨팅, 대역폭, 모델 크기를 2배로 늘렸다는 점을 강조했다.
solidkjy@fnnews.com 구자윤 기자