Gemini 3 深度思考:推动科学、研究与工程发展

分类业界资讯
作者Google
来源跳转
发表时间

内容

我们最专业的推理模式现已更新,以解决现代科学、研究和工程挑战。

一般摘要

Gemini 3 Deep Think 进行了重大升级,以帮助解决科学、研究和工程挑战。Google AI Ultra 订阅者现在可以在 Gemini 应用程序中访问更新的 Deep Think。研究人员、工程师和企业可以通过 Gemini API 表达对早期访问的兴趣,以测试 Deep Think。

摘要由 Google AI 生成。生成式 AI 是实验性的。

Gemini 3 Deep Think 标志

您的浏览器不支持音频元素。

收听文章

此内容由 Google AI 生成。生成式 AI 是实验性的

4:06 分钟

今天,我们发布了对 Gemini 3 Deep Think 的重大升级,这是我们专门的推理模式,旨在推动智能的边界并解决现代科学、研究和工程领域的挑战。

我们与科学家和研究人员密切合作,更新了 Gemini 3 Deep Think,以解决艰难的研究挑战 —— 在这些挑战中,问题往往缺乏明确的边界或单一的正确解决方案,数据往往混乱或不完整。通过将深厚的科学知识与日常工程实用性相结合,Deep Think 超越了抽象理论,推动了实际应用。

新的 Deep Think 现在可在 Gemini 应用程序中供 Google AI Ultra 订阅者使用,我们还首次通过 Gemini API 将 Deep Think 提供给选定的研究人员、工程师和企业。您可以在 此处 表达对早期访问的兴趣。

以下是我们的早期测试人员如何使用最新的 Deep Think:

  • 罗格斯大学的数学家 Lisa Carbone 正在研究高能物理社区所需的数学结构,以弥合爱因斯坦的重力理论和量子力学之间的差距。在一个几乎没有现有训练数据的领域中,她使用 Deep Think 审查了一篇高度技术性的数学论文。Deep Think 成功地找到了以前在人类同行评审中未被发现的微妙逻辑缺陷。
  • 在杜克大学,Wang 实验室利用 Deep Think 优化了复杂晶体生长的制备方法,以便发现半导体材料。Deep Think 成功地设计了一种生长薄膜的配方,薄膜大小超过 100 μm,达到以前方法难以实现的精确目标。
  • 谷歌平台和设备部门的研发负责人 Anupam Pathak(前 Liftware 首席执行官)测试了新的 Deep Think,以加速物理组件的设计。

提升推理能力,注入数学和算法严谨性

去年,我们展示了 Deep Think 的专用版本可以成功地解决一些最艰难的推理挑战,实现了数学和编程世界锦标赛的金牌标准。最近,Deep Think 使得专用 代理 能够进行研究级别的数学探索。

更新的 Deep Think 模式继续推动智能的边界,在最严格的学术基准中达到新的高度,包括:

  • 在人类最后的考试中设定新的标准(48.4%,无工具),这是一个旨在测试现代前沿模型极限的基准
  • 在 ARC-AGI-2 中实现了前所未有的 84.6%,由 ARC 奖基金会验证
  • 在 Codeforces 中获得了惊人的 Elo 评分 3455,Codeforces 是一个由竞争性编程挑战组成的基准
  • 在 2025 年国际数学奥林匹克中达到金牌级别的表现

探索复杂的科学领域

除了数学和竞争性编码之外,Gemini 3 Deep Think 现在还在化学和物理等广泛的科学领域中表现出色。我们的更新 Deep Think 模式在 2025 年国际物理奥林匹克和化学奥林匹克的书面部分中展示了金牌级别的结果。它还展示了高级理论物理学的熟练程度,在 CMT 基准测试中获得了 50.5% 的分数。

加速现实世界的工程应用

除了其领先的性能之外,Deep Think 还旨在推动实际应用,使研究人员能够解释复杂的数据,工程师能够通过代码建模物理系统。最重要的是,我们正在努力将 Deep Think 带到研究人员和从业者最需要的地方 —— 首先是通过 Gemini API 等界面。

使用更新的 Deep Think,您可以将草图转换为 3D 打印的现实。Deep Think 分析绘图,建模复杂的形状,并生成文件以使用 3D 打印创建物理对象。

面向 Google AI Ultra 订阅者和通过早期访问计划的 Gemini API

Google AI Ultra 订阅者可以从今天开始在 Gemini 应用程序中访问更新的 Deep Think 模式。科学家、工程师和企业也可以现在 表达兴趣,参加我们的早期访问计划,以通过 Gemini API 测试 Deep Think。

我们迫不及待地想看看您会发现什么。

评论

(0)
未配置登录方式
暂无评论