Gemini 3.1 Flash-Lite:为大规模智能而打造

1
分类业界资讯
作者Google
来源跳转
发表时间

内容

今天,我们推出了 Gemini 3.1 Flash-Lite,速度最快且成本效益最高的 Gemini 3 系列模型。它专为高工作量的开发者提供高质量的服务。

从今天开始,3.1 Flash-Lite 将在 Google AI Studio 和 Vertex AI 中通过 Gemini API 提供预览版本给开发者,企业用户也可以通过 Vertex AI 使用。

成本效益高且不妥协

价格为 0.25/1M输入令牌和0.25/1M 输入令牌和 1.50/1M 输出令牌,3.1 Flash-Lite 提供了更高的性能和更低的成本。它比 2.5 Flash 快 2.5 倍,输出速度增加 45%,根据 Artificial Analysis 的基准测试。它的低延迟对于高频工作流程至关重要,使其成为开发者构建响应式、实时体验的理想模型。

Gemini 3.1 Flash-Lite 比 2.5 Flash 快且质量高。

3.1 Flash-Lite 在 Arena.ai Leaderboard 上获得了 1432 分 Elo 分数,并在推理和多模态理解基准测试中超过了其他同级别的模型,包括 86.9% 的 GPQA Diamond 和 76.8% 的 MMMU Pro–甚至超过了前几代的更大 Gemini 模型,如 2.5 Flash。

适应性智能能力在开发者中

除了其原始性能之外,Gemini 3.1 Flash-Lite 还带有 AI Studio 和 Vertex AI 中的思考层级,给开发者提供了控制和灵活性来选择模型如何“思考”一个任务,这对于管理高频工作量至关重要。3.1 Flash-Lite 可以处理高工作量的任务,如大规模翻译和内容审核,成本是关键。它也可以处理更复杂的工作量,需要更深入的推理,如生成用户界面和仪表板、创建模拟或遵循指令。

▶ 类别生成

▶ 天气仪表板

▶ SaaS 报告

▶ 图片分类器演示

3.1 Flash-Lite 可以快速分析和分类大量内容,如图像。

早期访问的开发者和公司,如 Latitude、Cartwheel 和 Whering,已经开始使用 3.1 Flash-Lite 来解决复杂问题。早期测试者称赞 3.1 Flash-Lite 的效率和推理能力,说它可以处理复杂输入的精度与更高级别的模型相似,遵循指令并保持一致性。

我们期待看到您如何使用 3.1 Flash-Lite 和 Gemini 3 系列模型。

评论

(0)
未配置登录方式
暂无评论