구글 검색 'AI 오버뷰' 장착, 구글에서 검색하면 AI 기반 결과 나온다
2024.05.15 03:44
수정 : 2024.05.16 09:23기사원문
【실리콘밸리=홍창기 특파원】
구글이 구글의 멀티모달((Multimodal) 인공지능(AI) 모델 제미나이(Gemini)와 음성으로 자연스럽게 대화할 수 있는 '제미나이 라이브'를 조만간 출시한다. 또 구글은 이날 추론과 기획이 가능한 AI 에이전트 '프로젝트 아스트라'도 공개했다. '프로젝트 아스트라'는 인간처럼 보고 듣고 배우는 미래형 AI 에이전트 개발을 위한 구글의 AI 비전이다.
구글은 이날 미국 캘리포니아주 마운틴뷰 본사에서 연례개발자회의(I/O)를 개최하고 제미나이 1.5를 대규모 업그레이드를 발표했다.
구글 제미나이는 텍스트와 이미지, 비디오, 코드 등 멀티모달 현존하는 가장 광범위한 AI 모델이다. 100만 토큰이었던 '제미나이 1.5 프로'의 토큰 처리 능력이 200만개로 확장됐다.
구글은 제미나이 1.5프로가 멀티턴 대화와 오디오 및 이미지 인식 기능 등이 대폭 향상됐다고 밝혔다. 코드 생성과 논리적 추론, 멀티턴 대화, 오디오 및 이미지 인식 기능 등 향상된 것이다. 순다르 피차이 구글 CEO는 "멀티모달인 제미나이는 우리가 할 수 있는 질문을 확장하고 우리가 얻을 수 있는 답변을 지식에서 잠금 해제해 제공해 준다"고 강조했다.
구글은 일부 개발자 및 클라우드 고객 대상으로 200만 토큰의 컨텍스트 윈도우를 지원한다. AI 모델이 한 번에 처리할 수 있는 정보의 양을 '콘텍스트 윈도(context window)'라고 한다. 이는 단어·이미지·영상·오디오·코드 등의 의미를 가진 '토큰(token)'이라는 단위로 구성된다.
이와 함께 구글은 제미나이 1.5 플래시를 검색과 포토, 워크스페이스 등 구글 제품 전반에 탑재한다.
구글 검색에 'AI 오버뷰'를 통해 구글 검색 결과에 대한 빠른 요약과 관련 링크를 제안하는 것이 대표적이다. 이용자가 더욱 효율적으로 정보를 탐색하고 복잡한 질문에 대한 답을 찾도록 돕겠다는 것이다. 구글 워크스페이스의 경우 제미나이 1.5 프로 기반으로 이메일을 요약해준다.
구글은 이날 더 빠르고 더 효율적이면서 경량 모델인 '제미나이 1.5 플래시'를 처음으로 공개했다. 제미나이 1.5 플래시는 대규모, 빈도가 높은 작업에 최적화됐다는 것이 구글의 설명이다.
'제미나이 라이브'를 통해 사용자는 제미나이와 최첨단 음성 기술 사용해 직관적으로 대화할 수 있다. 구글은 최신형 동영상 생성 모델인 비오(Veo)와 텍스트·이미지 변환 모델인 이마젠 3(Imagen 3)도 소개했다.
또한 이날 구글은 최신 6세대 TPU '트릴리움'도 발표했다.
트릴리움은 가장 뛰어난 성능과 에너지 효율성을 자랑한다. 이전 세대 대비 칩당 컴퓨팅 성능이 4.7배나 향상됐다. 구글은 트릴리움이 최고 성능 인프라로 클라우드 고객의 디지털 트랜스포메이션을 지원한다고 설명했다.
또한 구글은 AI 원칙을 기반으로 한 '책임감 있는 AI'를 실천한다고도 선언했다. AI 생성 콘텐츠 식별 '신스ID' 워터마크를 확장해 이미지와 음성 뿐만 아니라 텍스트와 영상에도 적용한다는 방침이다.
한편, 제미나이 1.5 프로는 우선 구글 워크스페이스 랩스에서 테스트할 수 있다. 또 제미나이 1.5 플래시도 개발자가 AI 애플리케이션을 학습하고 배포할 수 있는 구글의 머신 러닝 플랫폼인 버텍스 AI에서 테스트용으로 사용할 수 있다.
theveryfirst@fnnews.com 홍창기 기자