AI가 사진 속 정보 검색 척척… 구글 '제미나이 시대' 연다
2024.05.15 19:10
수정 : 2024.05.15 19:10기사원문
순다르 피차이 구글 최고경영자(CEO)가 14일(현지시간) 구글의 멀티모달((Multimodal) 인공지능(AI) 모델 제미나이(Gemini)의 AI 사진 검색 기능' 애스크 포토'(Ask photo)를 설명하면서 든 예시다.
■25년 만에 검색엔진에 AI 탑재
이날 연례개발자회의(I/O)에서는 피차이 CEO를 비롯해 데미스 허사비스 구글 딥마인드 CEO, 리즈 리드 검색(서치) 부문 부사장, 씨씨 샤오 제미나이 담당 구글 어시스턴트 부사장, 제임스 마니카 기술 및 사회 수석부사장 등이 무대에 올랐다. 이들은 무대에서 인공지능(AI)를 121번이나 언급, AI 선구자는 구글이라는 점을 인식시키기 위해 노력했다.
구글은 이날 제미나이가 탑재된 정식 검색 엔진을 공식 출시했다. 구글의 검색 엔진에 AI가 탑재된 것은 구글 검색이 등장한 이후 25년만에 가장 큰 변화다. 구글은 이전에도 제미나이를 탑재한 AI 검색서비스를 해왔지만 정식 버전은 아니었다. 피차이 CEO는 이를 '제미나이의 시대'라고 명명했다.
이날부터 미국에서 바로 사용할 수 있는 AI 오버뷰는 빠른 요약과 관련 링크를 제안, 이용자가 효율적으로 정보를 탐색하고 복잡한 질문에 대한 답을 찾도록 도와준다. 이에 대해 리즈 리드 구글 검색 부사장은 "검색에서 고객의 수고를 덜어주는 것이 목표다"라며 AI 오버뷰의 성능을 자신했다.
■음성대화, 텍스트로 영상 제작
구글은 또 이날 추론과 기획이 가능한 AI 에이전트 '프로젝트 아스트라'도 공개했다. '프로젝트 아스트라'는 인간처럼 보고 듣고 배우는 미래형 AI 에이전트 개발을 위한 구글의 AI 비전이다. 구글은 '프로젝트 아스트라'개발을 위한 첫 단계로 연내에 제미나이와 음성으로 자연스럽게 대화할 수 있는 '제미나이 라이브'를 출시한다.
피차이 CEO는 "2월에 선보인 멀티모달 AI 제미나이 1.5프로의 경우 대화와 오디오 및 이미지 인식 기능 등이 대폭 향상됐다"라고 밝혔다. 코드 생성과 논리적 추론 등이 발전했다는 설명이다. 그는 "제미나이 1.5 프로는 한국어를 포함해 35개 언어로 출시할 것"이라고 덧붙였다.
아울러 구글은 이날 빠르고 더 효율적인 경량 제미나이 모델인 '제미나이 1.5 플래시'를 처음으로 공개했다. 최신형 동영상 생성 모델인 비오(Veo)와 텍스트를 이미지로 바꿔주는 이마젠 3(Imagen 3)도 소개했다. 다만 이날 구글이 선보인 AI 서비스는 오픈AI가 이미 서비스하고 있는 기능과 유사한 것이 많아 오픈AI와의 경쟁은 피할 수 없을 것으로 보인다.
텍스트를 통해 동영상을 생성하는 비오, 이마젠 3, AI 음악 생성 모델인 릴리아 등이 그것이다. 구글의 이같은 서비스는 경쟁사인 오픈AI가 이미 소라(Sora)와 달리(DALL-E) 등을 통해 서비스하고 있다. 제미나이의 최첨단 음성 기술을 통해 대화할 수 있는 '제미나이 라이브'도 오픈AI의 챗GPT 음성 기능과 상당히 유사하다.
한편, 이날 구글은 하드웨어 최신 6세대 서버용 AI 반도체(TPU) '트릴리움'도 발표했다. 트릴리움은 뛰어난 성능과 에너지 효율성을 갖췄다. 이전 세대 대비 칩당 컴퓨팅 성능이 4.7배나 향상됐다. 구글은 트릴리움이 최고 성능 인프라로 클라우드 고객의 디지털 트랜스포메이션을 지원한다고 설명했다.
theveryfirst@fnnews.com