今天,我们推出了 Gemini 3.1 Flash-Lite,速度最快且成本效益最高的 Gemini 3 系列模型。它专为高工作量的开发者提供高质量的服务。
从今天开始,3.1 Flash-Lite 将在 Google AI Studio 和 Vertex AI 中通过 Gemini API 提供预览版本给开发者,企业用户也可以通过 Vertex AI 使用。
价格为 1.50/1M 输出令牌,3.1 Flash-Lite 提供了更高的性能和更低的成本。它比 2.5 Flash 快 2.5 倍,输出速度增加 45%,根据 Artificial Analysis 的基准测试。它的低延迟对于高频工作流程至关重要,使其成为开发者构建响应式、实时体验的理想模型。
Gemini 3.1 Flash-Lite 比 2.5 Flash 快且质量高。
3.1 Flash-Lite 在 Arena.ai Leaderboard 上获得了 1432 分 Elo 分数,并在推理和多模态理解基准测试中超过了其他同级别的模型,包括 86.9% 的 GPQA Diamond 和 76.8% 的 MMMU Pro–甚至超过了前几代的更大 Gemini 模型,如 2.5 Flash。
除了其原始性能之外,Gemini 3.1 Flash-Lite 还带有 AI Studio 和 Vertex AI 中的思考层级,给开发者提供了控制和灵活性来选择模型如何“思考”一个任务,这对于管理高频工作量至关重要。3.1 Flash-Lite 可以处理高工作量的任务,如大规模翻译和内容审核,成本是关键。它也可以处理更复杂的工作量,需要更深入的推理,如生成用户界面和仪表板、创建模拟或遵循指令。
3.1 Flash-Lite 可以快速分析和分类大量内容,如图像。
早期访问的开发者和公司,如 Latitude、Cartwheel 和 Whering,已经开始使用 3.1 Flash-Lite 来解决复杂问题。早期测试者称赞 3.1 Flash-Lite 的效率和推理能力,说它可以处理复杂输入的精度与更高级别的模型相似,遵循指令并保持一致性。
我们期待看到您如何使用 3.1 Flash-Lite 和 Gemini 3 系列模型。