2025年03月25日,谷歌推出了 Gemini 2.5 Pro,具备高级推理能力的多模态 AI 模型,支持文本、图像、音频和视频等多种输入形式。该模型上下文窗口达到 100 万 token,显著提升了长上下文处理和多模态理解的性能。
主要特性
- 增强推理能力:提升复杂任务的处理准确性。
- 顶尖性能:在多个基准测试中处于领先地位。
- 高级编码:在代码生成、转换和智能体任务方面表现出色。
- 原生多模态:处理多样化输入,包括文本、图像、音频和视频。
- 长上下文窗口:支持高达 100 万 token 的上下文长度。
性能表现
Gemini 2.5 Pro 在多个领域展现了卓越的性能:
- 综合推理:在 Humanity’s Last Exam 测试中取得 18.8% 的成绩。
- 数学能力:在 AIME 2025 单次尝试中达到 86.7% 的准确率。
- 代码生成:在 LiveCodeBench v5 测试中得分 70.4%。
- 代理式编码:在 SWE-bench Verified 测试中获得 63.8% 的分数。
- 事实性:在 SimpleQA 测试中得分 52.9%。
使用方式
Gemini 2.5 Pro 现已在 Google AI Studio 和 Gemini Advanced 用户的 Gemini 应用程序中提供,并将很快在 Vertex AI 中推出。未来几周内将推出定价功能,以满足规模化生产的需求。