火山引擎正式发布豆包大模型2.0(Doubao-Seed-2.0)系列,同步上线面向企业和开发者的 API 服务,个人用户可通过火山方舟体验中心或豆包 App「专家」模式体验。
该版本围绕大规模生产环境需求完成系统性优化,凭借高效推理、多模态理解、复杂指令执行等能力,可更好应对真实世界复杂任务,且推理成本较业界顶尖模型降低约一个数量级,其日均 Tokens 使用量较推出初期已增长超500倍。

豆包大模型2.0提供四款差异化模型,适配不同场景的延迟、成本需求:
此次更新实现多模态理解能力的全面升级,在视觉理解领域达到业界顶尖水平,Pro 版在空间理解 MMSIBench、运动理解 MotionBench、视频理解 VideoMME 等测评中领先 Gemini3pro,图表理解 CharXiv-RQ 能力也大幅提升。
针对视频场景,模型强化了时间序列与运动感知理解,在 TVBench 等关键测评中领先,EgoTempo 基准得分超人类,长视频评测中超越多数顶尖模型,可实现实时视频流分析、主动指导等交互,适配健身、穿搭等陪伴场景,还能精准推理台球走位、识别运动动作并给出专业指导。
模型的 LLM 与 Agent 能力也实现大幅强化,通过补充长尾领域知识,更好适配专业场景任务:
同时模型指令遵循的一致性和可控性增强,擅长长链路多步骤任务,可完成“找资料 - 归纳 - 结论”的连续工作流,还能结合工具完成从数据处理、内容创作到生图排版的全流程任务。基于其构建的智能客服 Agent 可实现客户对话、问题转接、售后回访等全链路服务。
此外,Code 版模型可稳定调用主流 IDE 工具,前端能力优化显著,支持自定义技能,与 TRAE 结合能大幅提升开发效率,仅需5轮提示词即可构建出“AI 春节庙会”这类复杂 Web 应用,相关素材已开源。
为解决 Agent 时代 Tokens 使用量激增问题,火山引擎同步更新 Coding Plan 套餐包,开发者可在火山方舟调用该模型,新用户首月最低8元即可使用,实现不同编程任务的模型精准匹配。