"제미나이가 정보 처리량 많고, GPT-4o가 응답 속도 빨라"
[한스경제=박정현 기자] 생성형 인공지능(AI) 시장을 선도하고 있는 오픈AI의 '챗GPT' 신모델과 역전을 노리는 구글의 '제미나이' 업그레이드가 하루 차이를 두고 앞뒤로 발표됐다. GPT-4o는 음성 질문에 자연스럽게 답하며 영화 '그녀(her)'를 연상시켰다. 제미나이는 수십억명 글로벌 사용자의 검색 데이터를 활용해 입체적인 검색을 가능시켰다. AI 비서를 둔 경쟁이 더 치열해짐에따라, 영화 아이언맨의 만능 AI 비서 자비스의 현실화도 머지 않아 보인다.
구글은 지난 14일 최대 연례 개발자 콘퍼런스 '구글 I/O 2024'에서 '제미나이 1.5 시리즈'를 공개됐다. 구글이 선보인 제미나이 기반의 멀티모달 AI비서 ‘프로젝트 아스트라’는 오픈AI가 바로 전날 공개한 AI 비서 ‘GPT-4o’와 자연스럽게 성능 비교가 이뤄졌다.
아스트라는 영상·음성·텍스트 등 다양한 데이터를 처리할 수 있는 멀티모달 AI다. 사용자가 보여주는 주변 환경과 음성 질문을 기반으로 답변을 내놓는다. "여기가 어디야?"라고 물으면 거리를 인식해 ‘이곳은 런던 킹스크로스 역 주변’이라고 말해주고, “내 안경이 어디 있는지 기억해?”라고 물으면 “아까 테이블 위 사과 옆에 있던데”라고 주변 환경을 기억할 수도 있다.
이는 오픈AI가 전날 공개한 GPT-4o와 사실상 똑같은 서비스다. GPT-4o도 청각과 시각으로도 상황을 추론하고 표현할 수 있도록 업그레이드됐다. 또 두 모델 모두 '기억'이 가능하다는 공통점이 있다. 그레그 브로크먼 오픈 AI 공동창업자가 GPT-4o와 대화하는 상황에서 그의 뒤로 아내가 V자를 하고 사라지자, GPT-4o는 "누가 머리 위로 V자를 하고 사라졌네요"하고 말한다. 카메라로 보이는 주변 정보를 실시간으로 보고 기억했다가 질문에 답을 할 때 사용하는 것이다.
'오픈 AI'와 '구글'은 비슷한 AI 모델을 같은 시기에 발표하며 비교의 대척점에 서게 됐다. AI 비서 부문의 경우 영어만 지원될 뿐더러 연내 출시 예정인 아스트라보다 비슷한 기능으로 먼저 선출시된 GPT-4o가 스포트라이트를 받았다. 그러나 아스트라의 기반이 되는 제미나이와 GPT-4o를 비교했을때 AI 이용자 커뮤니티 반응이 한 쪽으로 편향되지는 않은 상태다. 차이가 크게 두드러지는 부분은 음성 능력인데, GPT의 음성이 더 자연스럽고 실시간으로 반응하며 목소리 변조까지 가능했다.
또 제미나이는 구글의 다양한 서비스와 깊이 통합돼 있어, 사용자가 구글 서치, 포토, 안드로이드 등에서 제미나이의 기능을 직접 경험할 수 있는 반면, GPT-4o는 다양한 플랫폼에서 독립적으로 사용할 수 있다는 특징이 있다.
능력은 제미나이 1.5 Pro가 100만 토큰을 유지하는 것으로 처리할 수 있는 정보의 양이 우수했다. 토큰은 AI 모델이 답변을 생성하는 동안 검토, 확인 할 수 있는 텍스트 범위의 크기를 의미한다. 제미나이의 경우 1시간 분량의 영상, 11시간 분량의 음성, 3만 줄 이상의 코드, 70만 개가 넘는 단어 등 방대한 양의 정보를 다룰 수 있다.
GPT-4o는 토큰 효율을 높였다. 예를 들어 "안녕하세요. 제 이름은 GPT-4o입니다. 저는 새로운 유형의 언어 모델입니다. 만나서 반갑습니다!"라는 문장에 토큰 45개가 쓰였다면 27개로 줄이는 등 70% 가량 개선했다. 응답 시간도 평균 0.32초로 인간의 응답 속도와 가깝게 줄였다.
컴퓨터 시스템의 성능을 평가하는 벤치마크 테스트에서는 GPT-4o가 우세했다. GPT-4o는 벤치마크 테스트에서 이전 제품보다 30% 향상된 평균 속도를 보였다. 제로샷 COT MMLU(일반 지식 질문)에서도 88.7%라는 새로운 최고 점수를 기록했다.
제미나이 1.5 프로 또한 기존 제미나이 1.0 프로 대비 성능이 87% 향상됐다.
김현종 위레이저 대표는 “기존 대규모 언어모델(LLM)에 이미지, 음성, 영상을 모두 붙인 GPT-4에 더해 직접 처리할 수 있게 만든 모델이 GPT-4o”라며 “구글의 제미나이와 사실상 동등한 수준으로 올라서게 된 것”이라고 말했다. 사용자 데이터가 충분히 쌓이지 않아 두 모델의 우위는 아직 속단할 수 없지만, 확실한 건 스타트업으로 출발한 오픈AI의 AI 경쟁력이 구글과 동등하거나 그 이상으로 넘어가고 있다는 사실이다.
순다르 피차르 구글 CEO는 오픈 AI가 구글 I/O 하루 전 GPT-4o를 발표한 것을 두고 "다른 기업의 혁신은 반가운 일"이라고 말했다. "우리는 인류 역사상 가장 중요한 기술 중 하나인 AI를 개발하고 있다"며 "(AI 발전은) 장기적인 관점에서 바라봐야 한다"고 강조했다. AI라는 거대한 변곡점에서 하루이틀의 해프닝은 중요하게 집중할 부분이 아니라는 뜻으로 해석된다.
AI모델이 텍스트에서 음성으로 넘어가는 건 분명한 기조로 보인다. 보고 듣고 말하는 '사람 같은 AI'가 AI 시장의 트랜드가 된다면 어떤 AI 모델이 더 자연스러운지, 감정이 풍부한지, 재빠른지가 승부를 가를 수 있다.
박정현 기자 awldp219@sporbiz.co.kr



