中文Google NotebookLM 推出“电影级视频概览”新功能
谷歌NotebookLM上线“电影级视频概览”,用户导入研究资料或笔记即可由Gemini3、Nano Banana Pro、Veo3等模型自动生成沉浸式定制讲解视频,现仅向18岁以上Google AI Ultra订阅用户开放且仅支持英语,推动产品从研究辅助向创意生产力工具升级。
浏览作者 AIBase 的公开文章、摘要与延伸阅读。肖恩子的知识花园
中文谷歌NotebookLM上线“电影级视频概览”,用户导入研究资料或笔记即可由Gemini3、Nano Banana Pro、Veo3等模型自动生成沉浸式定制讲解视频,现仅向18岁以上Google AI Ultra订阅用户开放且仅支持英语,推动产品从研究辅助向创意生产力工具升级。
中文Anthropic为Claude Code新增官方语音模式,输入/voice并按住空格口述即可实时转文字并提交处理,功能正向约5%用户灰度推送且将扩大覆盖,开发者可减少键盘输入更快下指令、重构与排错,协作和迭代效率提升。
中文工信部人形机器人与具身智能标委会发布《人形机器人与具身智能标准体系(2026版)》,首次覆盖全产业链全生命周期,明确软硬件集成、数据与模型训推部署闭环及安全伦理要求,填补规范空白并缓解数据荒与标准碎片化,推动人形机器人在工业和医疗等场景规模化落地与生态协同。
中文谷歌发布新一代图像生成模型Nano Banana2,基于Gemini3.1Flash Image架构,提升理解与响应并修复中文乱码、语义混乱和伪影,使中文文本生成更清晰可用,输出从2K升至4K,支持最多5角色跨图一致与单图融合14元素,后续将逐步接入Gemini、搜索、AI Studio、Flow及付费API与Ads完成替换。
中文谷歌全面重塑并上线AI创意工作室Flow,整合Whisk与ImageFX并于3月支持项目无缝迁移,基于Nano Banana生成图像可直接接入Veo转为高品质视频,同时加入文本驱动局部重绘、素材收藏、镜头控制与片段延长等编辑能力,形成统一生产力工作流并提供免费与付费方案,标志其AI创意工具由分散实验走向成熟产品化。
中文MiniMax升级Agent架构,发布Expert2.0与云端助手MaxClaw,Expert2.0以自然语言定义SOP并自动编排工具配置,已沉淀1.6万专家Agent并提供免费创建与分成共享计划,MaxClaw降低部署与Key门槛并支持多IM协作与云存储,推动Agent从模型输出转向工作流内的生产力集群。
中文通义千问发布并开源Qwen3.5系列,新增122B-A10B强化多步推理与工具调用,35B-A3B以架构与数据优化超越前代更大模型,27B主打高能效降门槛,同时阿里云百炼上线对齐35B-A3B的Qwen3.5-Flash生产级API,支持100万tokens上下文与原生工具链,推动企业落地与技术普惠。
中文Anthropic为Claude Max用户上线Claude Code远程控制,终端输入/rc生成链接或二维码,手机App或浏览器接管会话而计算与文件仍在本地且上下文不丢,研究预览先给Max后续扩至Pro,使移动端持续调试与长任务监控更便捷且更安全。
中文火山引擎发布豆包大模型2.0系列并上线企业与开发者API,围绕生产环境优化推理、多模态与复杂指令执行,推理成本较顶尖模型降约一数量级且日均Tokens增长超500倍,提供Pro/Lite/Mini/Code四款以覆盖深推理、性价比、低延迟与编程场景,视觉与视频理解及多项基准领先并强化Agent与工具调用能力,同时更新Coding Plan以降低开发者用量成本、提升落地效率。
中文字节Seed团队于2026年2月12日发布Seedance2.0,采用统一音视频多模态联合生成架构,支持15秒多镜头立体声输出与文图音视频混合参考(最多9图)并可定向编辑续拍,已上线即梦AI和豆包,提升复杂运动与多人交互可用率、降低影视广告电商制作成本,推动AI视频迈入工业化但一致性与细节仍待优化。