AI NEWS

구글, AI 혁신의 새로운 기준 제시! Gemini 2.5 Pro 공개

구글이 Gemini 2.5 Pro를 출시하며 AI 능력이 크게 향상되었습니다. 이는 지금까지의 가장 똑똑한 모델로 평가받고 있습니다. 다음은 기사의 주요 내용입니다.

향상된 추론 능력
Gemini 2.5 Pro는 문제를 해결할 수 있는 "사고 모델"로 설계되었습니다. 정보를 분석하고 논리적인 결론을 도출하며, 정보에 기반한 결정을 내릴 수 있습니다. 이는 강화 학습 및 연쇄 사고 촉진과 같은 방법을 통해 이루어지며, 이전의 Gemini 2.0 Flash Thinking을 발전시킨 것입니다.

성능 기준
이 모델은 LMArena 리더보드를 큰 차이로 선두하고 있으며, 이는 인간이 선호하는 출력을 생성하는 데 높은 성능을 나타냅니다. 또한, GPQA와 AIME 2025와 같은 수학 및 과학 기준에서도 1위를 차지하고 있으며, 인류의 마지막 시험에서 18.8%의 점수를 기록했습니다. 이는 인간의 지식과 추론의 경계를 포착하기 위해 설계된 어려운 데이터셋입니다.

코딩 및 다중 모달리티
Gemini 2.5 Pro는 시각적으로 매력적인 웹 애플리케이션, 능동 코드 애플리케이션 생성 및 코드 변환과 수정 등 고급 코딩 작업에서 뛰어난 성능을 보입니다. 또한 텍스트, 오디오, 이미지, 비디오 및 전체 코드 저장소 등 다양한 데이터 유형을 이해할 수 있는 기본적인 다중 모달리티를 지원합니다.

컨텍스트 창 및 데이터 처리
이 모델은 100만 토큰의 컨텍스트 창을 가지고 있으며, 200만 토큰으로 확장할 계획입니다. 이를 통해 방대한 데이터 세트를 처리하고 여러 정보 출처에서 복잡한 문제를 다룰 수 있습니다. 긴 보고서, 교과서 및 대형 코드 저장소를 효율적으로 분해하는 능력을 갖추었습니다.

사용 가능성
Gemini 2.5 Pro는 Gemini Advanced 구독자와 개발자가 Google AI Studio를 통해 사용할 수 있으며, 향후 몇 주 안에 Vertex AI에 배포될 예정입니다. 사용자는 Gemini 앱 및 기타 통합된 Google 서비스를 통해 모델에 접근할 수 있습니다.

고급 기능
이 모델은 정확한 타임스탬프가 있는 오디오 입력, 이미지의 바운딩 박스 감지, 포괄적인 다중 페이지 보고서 생성을 지원하며, 코딩 작업 흐름을 간소화할 수 있는 능력을 가지고 있습니다.

전반적으로 Gemini 2.5 Pro는 AI 능력에서 큰 도약을 나타내며, 특히 추론, 다중 모달리티 및 다양한 영역에서 복잡한 작업을 처리하는 데 뛰어난 성능을 보입니다.