内容

如果你去你最喜欢的社交媒体网站,会发现上面充斥着大量彼此看起来可疑地相似的帖子:

这些帖子下的许多评论也由 AI 生成。越来越多的学术论文《纽约时报》评论文章也是如此,而且显然还有获奖短篇小说。如果你经常使用 AI,你大概已经注意到周围有多少 AI 写作了(经常使用 AI 的人过去在识别 AI 写作方面表现相当不错),如果没有,我向你保证,它比你想象的要多得多。

不过,问题不只是 AI 写作的千篇一律,虽然这种同质化最终会让人厌烦到一个程度,以至于我发现自己连有趣的话题都不想写,只要我内心的“AI 检测器”一响。更糟的是,提示词糟糕的 AI 写作,每个词承载的信息量都很低,只会把你带进空转的思维怪圈。我们受过训练,会把精心打磨的句子和看起来很有思想的文本视为人类费力工作的成果,因此当我们看到这些 AI 写的评论时会格外留意。但其中往往并没有真正的人类意义,这些帖子只是“意义形状”的注意力吸血鬼,消耗你的脑力去解码,却不给你等价的理解回报1

但用 AI 写作的代价,不只是让读者失去兴趣,它还可能削弱一项重要人类能力的发展。我很幸运,自己写作已经几十年了,也形成了自己的风格;无论我是在写书、发推文,还是写博客,这种风格我觉得都会显现出来。要达到这种程度,背后其实做了很多让人烦透了的功夫:好老师、反复重写、还有恶毒的网络评论,都起了作用。如果 AI 能帮我把文字写得不错,我本可以跳过这一切,但那样我也就放弃了某些东西,而这些东西后来证明对我的职业生涯和幸福感都非常重要。

这并不是在谴责以任何方式使用 AI 辅助写作。我认为 AI 对优秀写作者来说可以是极其出色的工具(我会让 AI 检查我所有的写作,并扮演不同读者视角,看看我有没有漏掉什么重要内容)。对于那些沟通表达较吃力的人,AI 可以帮助他们更好地传达想法,而写作对每个人来说未必都是思考本身。另外,只要多花一点心思,AI 写作也能变得不那么陈词滥调、更有个人色彩,也更值得使用(适度使用)。所以,我真正反对的不是用 AI,而是把它当成默认选项,或者更糟,完全不经思考地使用。如何在使用 AI 和发挥我们自身思维能力之间取得平衡,将是未来几年最关键的挑战之一。

最清楚能看到这一点的地方是教育领域。两篇研究论文来自部分重叠的研究团队(其中包括沃顿的同事),很好地说明了:用 AI 是为了跳过思考,还是为了辅助思考,这两者之间有何区别。第一篇论文是在土耳其一所高中进行的实验,约一千名学生学习数学。一组可以使用普通版 ChatGPT,另一组不能使用任何 AI。使用 ChatGPT 的学生作业完成得更好,也觉得自己学得更多,但在考试时,他们的表现却不如没有使用 ChatGPT 的同学。原因在于,原本设计成“有帮助”的 AI,其实只是直接给了他们答案,而真正的学习需要脑力投入。切断努力,也就切断了学习。这就是为什么 AI 在课堂学习中的初始效果会如此令人担忧。

然而,在第二篇论文中,我们看到了不同的结果。该研究由许多相同作者参与,他们在台北的十所高中开展了一门为期五个月的 Python 课程,参与学生接近一千人。由 AI 辅导老师为学生提供个性化题目序列的学生,在不借助 AI 帮助的期末考试中,成绩高出 0.15 个标准差。按某些估算,这相当于额外增加了六到九个月的学业时间,而且没有增加授课时间或教师工作量。相反,AI 帮助因材施教。这也符合其他关于 AI 辅导的研究,说明在正确使用时,定制化导师能显著提升学习效果。

AI 的使用方式差别其实很小,却会导致结果天差地别。更糟的是,人性往往会把我们推向错误的选择。学习要求我们直面自己的无知,并进行艰难的思维劳动,而这些事真的很难受。这也是为什么学生会把有趣的讲座评为比在课堂上做难题更有教育意义,尽管他们实际上从做难题中学到更多。想从 AI 学习中获益,你需要从“让 AI 帮你解决问题”转向“让 AI 推动你自己去解决问题”。

幸运的是,三大 AI 公司都提供了一些工具,至少能通过让 AI 更像导师来支持学习。不幸的是,这些功能并不直观。Gemini 最容易用:点击加号,选择“引导式学习”。ChatGPT 则需要在聊天框输入“/learn”。Claude 则需要点击加号,选择“使用风格”,再选“learning”(Anthropic 已宣布这种做法会调整,但尚未正式说明变化)。在所有情况下,若条件允许,都应尽量使用推理模型或高级模型,尤其是在 STEM 学科上。而且,这些模式只能帮助那些本来就想学习的人;如果你想作弊,它们并不会阻止你。

AI 不必削弱你的思考能力,但如果用得不好,它确实会这么做,而且“用得不好”往往就是默认状态。我在沃顿的同事把这称为“认知投降”,他们记录了人们如何停止思考问题,直接让 AI 代劳,哪怕 AI 是错的。我认为,问题的一部分出在这些工具的设计方式上。

我做这张图不是为了这篇文章……

当 AI 系统需要复杂的来回对话,而且经常出错时,人类必须在每一步都保持参与。而智能体式系统(agentic systems)则被设计成让你的生活更轻松,因为它们就是直接帮你把事情做了。这对完成任务很有帮助,但对学习任何东西、保持真实,或者避免认知投降都不利。如果你提出一个很难的请求并得到了答案,就很容易顺势接受 AI 的回复。

在我们最近发表的论文中,我与 Fabrizio Dell’Acqua 以及来自哈佛、MIT、华威大学、BCG 等机构的同事一起做了一项实验(我三年前在这里写过相关内容,不过学术论文发表总是很慢!),我们对波士顿咨询集团(Boston Consulting Group)的 758 名顾问进行了实验,其中一半获得了 GPT-4 的使用权限。使用 AI 的顾问整体表现远胜于未使用 AI 的顾问。但我们也让顾问去解决一个我们知道 AI 会失败的问题。在这个任务上,使用 AI 的顾问显著更不可能给出正确答案,而没有使用 AI 的顾问则表现更好。AI 给了他们一个看起来很权威、但实际上错误的答案,而大多数人——那些在其他所有任务中都表现出色的顶尖顾问——都没能识破。当然,现在 AI 已经能直接解决这个问题了,所以眼下的问题其实不再是错误率,而是因为屈从于同样的投降冲动,而没能学会如何成为一名优秀顾问。

同样,这也不必成为默认状态。在 Anthropic 做的一项小型研究中,程序员借助 AI 完成一项新任务。那些完全放任 AI 代劳的人,甚至无法回答自己做了什么,这就是投降的迹象。但那些让 AI 解释它在做什么的人,或者只让 AI 帮他们完成部分工作的人,似乎避免了这种结局。

解决办法的一部分也许在工具本身,但这终究有限。如果在 ChatGPT 每次回答前都先问一句:“你希望我推动你自己思考,还是直接给你答案?”或者告诉你“如果由你自己来写,这样会更真实”,大多数时候都会让人烦不胜烦。但在某些场景下,我们确实需要这些提醒。台北那项研究暗示了一个方向,即系统层面的约束,而不是依赖用户意志力;但在消费级产品里,我们几乎看不到这种设计,商业压力则主要朝相反方向推动。

这个问题很大程度上最终还是取决于我们自己。说清楚一点,我并不反对一定程度的认知投降。我现在已经不记电话号码了,因为手机替我记着。我很高兴我的孩子们不必学习草书。我也不介意计算器替我做日常运算,电脑替我安排课程。这些曾经有用的技能,我们也许确实应该放弃。

AI 不一样,因为这项技术足够通用,几乎任何认知任务都可以在某种程度上被外包给它。我不想对写作过于矫情:并没有哪条原则规定,一封润色过的邮件就必须来自人脑,就像一串算术题也不必非得如此。但我们也不想放弃一切;而且,对于任何具体任务,我们大多还不知道哪些重要、哪些不重要。做出这样的判断,将会是一个真正的挑战。

重点不是避免 AI,而是要有意识地使用它,通过有意识地选择是否使用 AI,而不是出于条件反射般的依赖或回避。更广泛地说,我们已经到了一个阶段:究竟要把什么样的工作交给 AI,这些默认值正在被设定——由追求无摩擦使用体验的 AI 公司来设定,由雇主来决定什么算“善用 AI”,也由那些不断变化的“AI 素养”概念在教学中塑造。讽刺的是,这一切很多都在缺乏真正规划或思考的情况下发生。我怀疑,一旦一代工人和学生围绕这些默认值形成了习惯,要逆转它们会非常困难。我们能做的最重要的事,就是不断追问:什么该交出去,什么该留给自己……而不要指望任何人,包括 AI,替我们回答这个问题。

评论

(0)
未配置登录方式
暂无评论