当AI能写出十四行诗时,人类还剩下什么

1950 年，图灵在《计算机器与智能》中写下了一个著名的问题：机器能否思考？为了让这个问题不再是纯数学的哲学论证，他设计了一个极具人文色彩的“模仿游戏”，也就是后来被我们熟知的图灵测试。在这个测试中，图灵提出了两个经典问题，其中一个是“请以福斯桥为主题，为我写一首十四行诗”。这个看似简单的问题，在今天已经变得不那么简单了。因为如今无论是 ChatGPT 还是 Claude，都能在几秒内完成这样的创作。人们开始疑惑： AI 是不是已经通过了图灵测试？机器真的，拥有思考和创作能力了吗？

一、机器会写诗，但不会“Surprise”

英国作家理查德·比尔德在最近的一篇长文《Computers can‘t surprise》中，直接点出了这个问题的核心。他说，AI 确实能够写出符合格律的十四行诗，但它无法真正让人“惊喜”。这是什么意思呢？我们先回到 1950 年。图灵当年设计的测试，其实是在问一个哲学问题：机器能否通过模仿人类，让人类无法区分它与真人的差异？

在这个测试中，图灵设想了一台想要冒充人类的机器。他必须懂得一个 1950 年代的常识：普通人并不写诗。这种对人类社会的理解，才是智能的体现。听起来很有道理，但图灵一定没有想到，他设想中的未来计算机，早已经被现实超越。如今的大语言模型能够轻松应对各种文学创作的要求，甚至可以写出比大多数人类更“规范”的诗歌。但是，这真的意味着机器拥有了创作能力吗？

70 多年前，神经科学家杰弗里·杰斐逊爵士在一次演讲中提出了一个尖锐的观点：只有当一台机器能够因为自身真实体验到的思想与情感，而非符号的偶然组合，去写出一首十四行诗时，我们才可以承认机器等同于大脑。这个观点至今依然是判断 AI 创作本质的一个核心标准。AI 的创作只是符号的组合与概率的计算，而非源于内心的表达。

二、人类早就把写作变成了技术

你可能会问，既然 AI 能做到这一步，那人类的创作又有什么特别的呢？答案或许出乎你的意料：因为人类自己，早就开始将写作变成一种可拆解、可教授的技术了。

时间拉回到 1936 年，美国爱荷华大学首次举办了作家工作坊。这在当时是一个里程碑式的事件。在爱荷华工作坊出现之前，人类的创作被认为是依赖缪斯灵感的神秘行为。而在之后，写作逐渐变成了一门可以被教授、被拆解的学科。这个工作坊确立了创意写作的核心逻辑：第一步，厘清什么样的写作才算有效；第二步，建立一套流程，引导写作者逐步逼近这种理想输出。这个逻辑被此后几乎所有的创意写作艺术硕士项目沿用。

核心前提就是：只要掌握了一组可学习的规则，文本至少可以达到看起来像样的文学水准。如今，对于想要成为编剧的人来说，很少有人不熟悉悉德·菲尔德提出的“三幕结构”，或者是克里斯托弗·沃格勒的“英雄之旅”。这些结构模板被很多创作者视为秘籍，因为它们为情节推进、场景设置、戏剧张力提供了一条看似最优的路径。

但这种创作方式，本质上就是一种逆向工程。人类创作者会先拆解《》《证人》这类经典影片的叙事机制，分析它们为何能打动观众，然后提炼其中可迁移的要素，重新组合后期望复现相近的艺术效果。这种逆向工程，和大语言模型的思考方式高度相似。程序员会事先确定所需的目标答案，再回过头来不断调整输入结果，逐步引导人工神经网络收敛到预设的解决方案。

所以问题来了：既然人类写作和 AI 创作都是依赖规则和逆向工程，那两者的创作本质是不是一样的呢？其实不然，因为程序化的创作方式在人类这里就已经显现出了局限性，而 AI 只是将这种局限性无限放大了。

三、生产劣质作品其实是人类的顽疾

你发现了吗？每年都有大量年轻人获得创意写作学位，但没有人会指望这些人都能产出伟大的美国小说。很多新人作家的创作初衷，其实和 ChatGPT 所鼓励的指令式思维高度相似。他们会直接提出明确的创作要求，比如“我想写一本像去年夏天那本畅销书一样的作品”，或者“我要写一部介于李·查德和安妮·埃尔诺之间的，兼具文学性和叙事性的小说”。

这种创作方式忽略了创作最核心的情感与体验，最终的成果往往与最初的意图相去甚远。这种局限性，其实在早在 1580 年就被英国的菲利普·西德尼爵士探讨过。他在《诗辩》中试图提炼卓越创意写作的本质，最终得出了一个结论：当写作真正奏效时，它既能教化读者，也能带来愉悦。相比神学、历史或哲学，文学以一种更易接近的形式，为如何过好一生提供指引。这个观点点出了创意写作的独特性：它无法被完全拆解为规则，因为它的核心是人类的生命体验与思想情感。

有意思的是，这种程序化创作的弊端，在视觉艺术领域也同样存在。好莱坞会通过焦点小组测试观众对影片的反应，然后根据反馈修改影片。但如果焦点小组真的能稳定产出艺术成功，那电影院里应该全是经典爆款，而不是大量水准平平的作品。

这就引出了一个核心观点：生产劣质艺术作品，本就是人类的固有问题。AI 只是将这个问题放大了。2023 年，美国编剧工会发起了罢工行动，最终争取到了针对生成式人工智能的重要保护条款，其中明确禁止以 AI 取代人类编剧。但是这场胜利并没有明显提升优秀艺术电影的产出，因为即便是人类编剧，依然在创作大量乏善可陈的作品。即便是完全不借助 AI，我们也会持续写下很快被遗忘的小说、剧本。

当人类创作者缺乏灵感时，就会依赖那些标准化的模板和套路，而这些套路最终被原样编入了大语言模型中。正如图灵所预见的那样，数字计算机事实上可以非常接近地模仿人类计算机的行为。实际上，在制造失败的艺术作品这件事上，人类几乎把所有的取巧之道都教给了人工智能。

无论是人类在阁楼里依赖模板的创作，还是 AI 在英伟达芯片里的生成，失败的创造性写作运作方式其实大同小异。都是从公共领域的文本中，识别并选取那些通常会被放在一起的语言单元，将熟悉的词语组合重新拼装成看似可信的句子。这种语言使用方式有一个明确的称呼：陈词滥调。

从这个意义上说，大语言模型本质上就是一台“陈词滥调的机器”。它们被训练来利用人类的一个顽固弱点：用最小的努力生成尽可能多的内容。这个弱点在类型文学领域表现得尤为明显。类型文学，比如刑侦小说、间谍惊悚片、言情作品，本身就依赖高度可识别、而且被市场反复验证的叙事公式。这些公式化的内容正是大语言模型最擅长复刻的。

所以 AI 大概率能在 2030 年前创作出畅销书。但问题在于，这并不是文学的问题，反而提醒我们：并不是所有的写作都具有同等的价值。AI 能写出类型文学的畅销书，说明这类作品的核心是市场需求与叙事公式。而真正的文学创作，核心是原创性、生命体验与思想表达。

四、AI 永远无法翻越的那座山

1842 年，埃达·洛夫莱斯在讨论最早的计算机之一时，写下了这样��话：分析机根本无意创造任何东西，它只能完成我们知道如何命令它去完成的任务。她用斜体强调了这句话，就是为了凸显机器的执行性与人类思维的创造性之间的本质差异。

而原创性，始终是人类艺术领域最值得珍视的价值。不同的艺术领域对原创性的追求也有所不同。视觉艺术领域就比文学领域更强调“创造新意”的现代主义要求。最典型的就是特纳奖，这个每年颁发给英国最具代表性当代艺术展览的奖项，核心判断标准就是“新”。如果作品没有新的形式、新的表达，那就无法被视为真正的艺术。

视觉艺术家的职业核心就是对形式的好奇，他们通过探索新的创作方式，引导观众用新的视角观看世界。而文学领域则有所不同，它往往更偏爱那些令人感到安心的熟悉形式。这也是英国专门设立金匠奖的原因，这个奖项的核心宗旨是表彰那些“拓展小说形式可能性”的作品。而这个奖项的存在也恰恰说明，大多数的小说创作并没有真正实现形式上的创新。

文学领域对形式创新的忽视，也让它在面对 AI 时显得尤为脆弱。尽管新技术不断为文学创作打开新的可能性，但是写作领域却长期缺乏对如何阅读的想象力。我们将书籍搬到 Kindle、Audible 等数字平台，充其量只是一次数字化的搬运，并没有改变阅读的本质，也没有探索出文学与数字技术结合的新形式。

这种自满的延续让文学成为了 AI 复刻的重灾区，也在无形中提高了 AI 写出畅销书的概率。如今的主流出版体系更偏爱那些符合市场期待、遵循既有套路的作品，而真正敢于尝试新形式、敢于承诺这本书不会和其他书一样的选题，反而成了罕见之物。

而 AI 创作的本质决定了它永远无法实现真正的原创性，因为 AI 的运作是概率性的。大语言模型的核心工作就是计算出“最可能出现”的词语序列，它的每一个创作选择都是基于海量数据的统计概率，而非基于情感与思考的主动选择。而恰恰是这种最可能的路径，最不可能通向真正伟大的写作。

真正的文学创作往往需要打破常规，需要不服从概率的勇气。就像格雷格·巴克斯特在回忆录中写的那样：如果文学是一场发生在勇敢者与平庸者之间的街头斗殴，那我带来的，是我所知道最凶悍的一群人，纯杀手和疯子。这些文学的匪徒不会向最可能出现的下一个词低头。而这种不服从概率的力量，是 AI 永远无法拥有的。

我们再回到图灵测试。其实从本质上来说，图灵测试是一种关于“说谎”的测试。它的核心问题从来不是机器是否拥有智能，而是机器能否采用足够像人的策略，假装成它并非本来的样子。艺术的任务恰恰是穿透这种谎言，看见背后的真实。那些真正伟大的原创作品之所以拥有跨越时间的生命力，正是因为它们承载了被真实体验过的“思想与情感”。

五、那个缺失的环节

法国艺术家马 Marcel·杜尚曾经将艺术称为“那个缺失的环节，而非已经存在的环节”。这个洞见恰恰是对 AI 模仿型创作范式的直接反驳。大语言模型被困在数据的反馈循环之中，只能不断重复既有的序列。它无法实现不同内在生命之间那种电光火石般的短路。

而这种短路在写作中最容易出现的领域，就是回忆录。人所记住的东西只属于那个人自己，那是一座尚未被数字化的储藏室，存放着真实而不可替代的人类经验。这也是图灵当年意识到的人工智能永远无法做到的事情。

根据图灵的传记作者记载，图灵在构思图灵测试的时期，脑海中始终有一个怀疑的声音：计算机永远不可能变得善良、机敏、美丽或者友好，它不会拥有主动性、幽默感，不会分辨是非，不会犯错，不会坠入爱河，也不会享受草莓和奶油的滋味。

图灵用这些最朴素的人类体验与机器的能力做对比，最终发现：回忆录这种依赖个人记忆与生命体验的创作，是 AI 无法突破的边界。

正是基于这个想法，理查德·比尔德发起了“通用图灵机”这个项目。这是一个关于写作与阅读的全新尝试。这个项目是一个可不断扩展的在线网格，形似棋盘，写作者可以认领一个网格并在其中的每一个方格里写下大约一千字的个人记忆。读者则可以在不同的记忆与声音之间自由穿梭，以主动的方式进入艺术存在的“间隙”之中。

这个项目的核心是鼓励将写作视为一种思考方式，而这正是艺术长期以来为人类提供的核心能力。无论是观看、聆听、写作还是阅读，本质上都是人类思考的方式。而一段意识到自己正在被回忆的记忆几乎是人类所能进行的最困难、也最精巧的思考之一。

这也是为什么图灵在设计他的测试时始终无法将文学排除在外。人工智能至今仍然无法模拟将写作本身作为思考、阅读或记忆的过程。它可以通过“阅读一切”来学习写作的规则，但是永远无法通过这种方式获得真正的创作能力。

就像回忆录并不会因为毫无遗漏的全盘记忆而变得更好，真正的回忆录价值在于对记忆的重新组织、重新解释与重新思考。法国实验作家乔治·佩雷克的小说《消失》就是人类创作中生命体验与形式探索结合的典范。这部 1969 年发表的小说有一个极致的形式约束：全文完全没有出现字母“e”。这种系统性的形式约束如今的大语言模型可以在瞬间复制完成，甚至能做得更完美。但是计算机永远无法加入的是乔治·佩雷克的生命经验。在法语中，字母“e”的发音近似“eux”，意为“他们”。而乔治·佩雷克的父亲在战争中阵亡，母亲被纳粹从巴黎驱逐至奥斯威辛集中营，父母二人从他的生活中永远消失。在这部小说��，字母“e”也随之消失。正是这种真实的生命体验让这本书成为了一次反“消失”的写作，它以一种胜利的艺术行动，将缺席本身变成了最强烈的在场，让那些被扭曲的空白被迫显现出来。而这，是 AI 永远无法实现的创作。

六、我们都是讲述真实的 Y

在《计算机器与智能》的接近尾声处，图灵出人意料地提到：至少在心灵感应这一点上，统计证据是压倒性的。或许图灵自己也没有意识到，他口中的这种心灵感应恰恰存在于作家与艺术家与观众之间的交流中。这是人类所能达到的最接近心灵感应的状态，是在不同心智之间传递与接收最细腻的情感与思想。这种交流依赖的是真实的生命体验，依赖的是创作者与接受者之间的情感共鸣，而这，是 AI 永远无法匹敌的人类能力。

任何一个曾真实感受过草莓和奶油滋味的人，任何一个拥有独属于自己的记忆与体验的人，都能进行这种艺术的交流。而这种尝试本身，就值得被肯定。

在这场人类与机器的创造性较量中，Y 最终获胜了，因为人类与机器思维之间的边界从来就不是技术的高低，而是真实的生命体验。这个边界正被一个不愿、也不可能被外包的自我重新巩固。

真正的创作，从来不是规则的复刻，不是概率的计算，而是生命与生命的对话，是体验与体验的共鸣，而这，永远是人类独有的、不可替代的创造性。

或许我们不必纠结于 AI 能否取代人类的创作，而是应该思考：在 AI 可以模仿一切的时代，我们还能做些什么？答案或许就藏在那些真实的生命体验中，藏在我们各自的回忆录里。那些无法被数字化、无法被算法复制的个人记忆，才是人类创造力的最后一块领地。

用写作重新组合记忆，以这种独特的人类方式进行思考，本身就是一种对 AI 同质化创作的抵抗行为。它重新定位了图灵测试的意义，让我们从模仿游戏中那个试图误导他人的 X，变成了那个讲述真实的 Y。X 可以模仿人类的创作，可以复刻人类的套路，但它无法替你拥有记忆，无法代你完成思考，无法假装拥有真实的生命体验，也不可能真正创作出属于人类的文学。

对自我的认识，无论过去还是现在，始终是一种对认知主权的宣示。当我们在写作中书写自我，在创作中表达真实的情感与体验，我们就以无可辩驳的方式确认了自己的人类身份。