蚂蚁开源Ling-2.6-flash，104B总参数、7.4B激活参数，主打代理场景下的高推理效率与低token消耗，采用混合线性注意力和稀疏MoE，在4×H20上最高340 tokens/s、长输出吞吐最高约提升4倍，并以1500万token维持有竞争力表现，在工具调用、多步规划和任务执行基准上接近或达到同级SOTA，但复杂场景仍存在工具幻觉、中英切换和复杂指令服从不足。

inclusionAI/Ling-2.6-flash · Hugging Face

Ling-2.6-flash：响应更快，执行更强，Token 效率更高

高质量文章分享，包括深度思考、方法论、认知提升、人生哲学或优质写作内容，不限技术领域，强调内容价值与启发性。

佳文共赏

与编程开发、系统架构、算法、AI 工程、运维实践等相关的技术文章，包含实操经验、教程、问题解决方案。

技术博客

以介绍、推荐、整理或分析单个或多个开源项目为核心主体的内容。

开源项目

可直接使用、收藏或参考的工具、网站、模板、插件、资料库等实用资源为主的内容。

资源推荐

用于系统学习或深入理解某个主题的教程、课程、文档、手册、学习路线等内容。

开源项目 全部文章

Ling-2.6-flash：响应更快，执行更强，Token 效率更高

开源项目全部文章