核心发现
AI 辅助虽然提升了短期表现,但会显著损害独立解决问题的能力和坚持性,且这种效应在仅约 10 分钟的短暂交互后就已显现。
三个实验设计
| 实验 | 任务 | 样本量 | 关键设计 |
|---|
| 实验1 | 分数运算(数学推理) | N=354 | AI 组先用 GPT-5 完成 12 题,然后突然撤掉 AI 做 3 题测试;对照组全程无 AI |
| 实验2 | 分数运算(改进版) | N=667 | 增加前测排除基线能力差异;对照组也有侧边栏(显示前测答案)以控制界面变量 |
| 实验3 | 阅读理解(SAT 真题) | N=201 | 验证效应是否跨领域泛化 |
主要结果
1. 独立表现下降
- 实验1:AI 组测试题正确率(57%)显著低于对照组(73%),效应量 d=-0.42
- 实验2:复现成功,AI 组测试正确率 71% vs 对照组 77%,d=-0.19
- 实验3:阅读理解领域同样成立,AI 组 76% vs 对照组 89%,d=-0.42
2. 坚持性(Persistence)受损——更关键的发现
- 跳过率(Skip rate):AI 组在失去 AI 后更频繁放弃答题
- 实验1:AI 组 20% vs 对照组 11%(显著)
- 实验3:AI 组 8% vs 对照组 1%(显著)
- 这意味着用户不仅"变笨了",而且"更不愿意尝试了"
3. 直接抄答案危害最大
实验2的后测分析显示,AI 使用模式决定下游损害程度:
- 61% 的人用 AI 直接获取答案 → 测试表现最差(65% 正确率),且相比前测显著退步
- 27% 的人用 AI 获取提示/澄清 → 表现接近对照组(76%),甚至略有进步
- 12% 的人未使用 AI → 表现最好(89%)
机制解释
作者认为核心机制是 "期望即时答案"的条件反射:
- AI 从不拒绝帮助(除非安全问题),提供即时完整回答
- 人类因此失去了"独自挣扎解决问题"的体验
- 而坚持性(persistence)是技能习得的基础,也是长期学业成就、工作适应力和韧性的最强预测因子之一
研究意义与警示
- 首次大规模因果证据:以往关于"AI 导致技能退化"的讨论多为相关性研究或小样本,本文通过 RCT 提供了因果推断
- 时间尺度惊人:负面效应在仅 10-15 分钟的 AI 使用后即出现,长期日常使用的累积效应令人担忧
- 设计启示:当前 AI 系统本质上是"短视的合作者",优化即时帮助而非长期能力。好的合作者(如导师)知道"何时不帮助",AI 也需要学会"脚手架式"辅助,平衡即时帮助与培养自主性
简言之,这篇论文发出了明确警告:如果 AI 只追求"当下有用",可能正在侵蚀人类最宝贵的能力——独立思考和坚持不懈解决问题的意愿。