阿姆斯特丹如何借助AI讲好城市故事-夜雨聆风

阿姆斯特丹如何借助AI讲好城市故事

今天，几乎每座城市都在谈更新，谈文旅，谈品牌，谈流量，谈年轻人，谈城市IP。但城市IP如果只停留在符号层面，很容易变成空洞的视觉包装。真正有生命力的城市IP，应该来自城市自身的记忆深处。——而阿姆斯特丹所做的尝试，或许可以给很多城市参考。2025年，阿姆斯特丹迎来建城750周年。围绕这个特殊节点，阿姆斯特丹市档案馆与 Capgemini、微软合作，推出了“与历史聊天”（Chat with History）项目。

引子——1574年，一封来自汉堡商人的抗议信

1574年，一个来自汉堡的商人，带着谷物驶向阿姆斯特丹。他的名字叫 Jan Lambertsz。这原本应该是一趟普通的生意：从易北河流域收购谷物，运到荷兰港口出售，换回利润，再继续下一段航程。可事情很快失控。船在途中被扣押，货物损失了一半。等他终于抵达目的地，当地官员又告诉他：这批谷物不能在这里出售。

对于一个异乡商人来说，这几乎是灭顶之灾。Jan Lambertsz 没有坐以待毙。他的同乡 Mertyn 和 Heynric Gherytsz 兄弟，代表他向当局递交了一封正式抗议信。信里写得很清楚：汉堡商人一直按规矩缴纳通行费、关税，甚至为航海基础设施额外付费。既然他拥有合法许可，为什么到了阿姆斯特丹却无法交易？^[1]

这封信后来被保存了下来。之后发生了什么，我们已经不得而知。Jan Lambertsz 是否拿回了损失？那批谷物最后有没有卖出去？他是否还会再来阿姆斯特丹？历史没有给出答案。但近450年后，他的名字又一次浮现出来。

不是因为一位历史学家偶然翻到了这封信，也不是因为某本新书重新书写了这段往事，而是因为一次普通的AI问答。工作人员向系统提出一个关于16世纪贸易纠纷的问题。系统在档案中检索、识别、翻译、摘要，最终定位到这封抗议信。一个被尘封在纸堆里的普通商人，突然重新出现在今天的屏幕上。

这件事发生在阿姆斯特丹750岁生日之际。这是一个AI技术的应用案例，但真正重要的地方并不只是技术。它提示我们：一座城市的历史，不应该只是被妥善保存；它还应该能够被重新提问、重新讲述，并重新进入今天的公共生活。

一、城市故事的第一步，让资料可被进入

阿姆斯特丹市中心有一座庄严的建筑，名叫 De Bazel。这里是阿姆斯特丹市档案馆的所在地，也是这座城市750年记忆的栖身之所。从1275年荷兰伯爵弗洛里斯五世颁发那纸通行费豁免特许状算起，阿姆斯特丹已经走过七个半世纪。那份特许状被视为城市的“出生证明”，至今仍被小心保存在档案馆里。

如果走进档案馆库房，会看到一排排密集架从地面延伸到天花板。羊皮纸卷、商人信件、教会登记簿、城市图纸、港口记录、家族文书、照片和地图，层层叠叠地保存着这座城市漫长的生命。Capgemini 的项目介绍称，阿姆斯特丹城市档案馆保存着约50公里长的纸质档案，内容覆盖数百万份文档、地图、信件和登记簿。^[2]

这听起来是一座城市令人羡慕的记忆宝库。但问题是：宝库并不等于公共记忆。

很长一段时间里，档案馆保存的是城市历史，却未必真正向普通人敞开。它当然可以被访问，可以被研究，可以被申请查阅，但对于大多数人来说，档案馆仍然是一种“看得见却进不去”的知识系统。

第一道墙，是语言。16世纪的信件不是现代英语，也不是今天普通人熟悉的荷兰语。它们常常写成古荷兰语，且多为手写。字母连笔、缩写复杂、墨迹模糊，很多地方像虫子一样蜷曲在纸面上。你可以看到扫描件，却无法真正读懂它。

第二道墙，是检索。即使一份档案已经完成数字化，普通人也未必知道怎样找到它。你需要理解档案馆的分类方式，知道全宗、目录、索引、关键词之间的关系，也需要具备某种专业训练，才能在海量资料中定位到真正有用的内容。

第三道墙，是解释。哪怕你读懂了单份文献，也未必知道它与一座城市的经济、贸易、空间、制度和日常生活有什么关系。Jan Lambertsz 的抗议信本身只是一份文件，但它背后牵涉的是16世纪的港口贸易、城市治理、跨境商人网络、通行税制度和地方官僚体系。没有解释，一份档案很难自动变成一个故事。

所以，城市要讲好故事，第一步不是文案，而是知识组织。所谓“讲好城市故事”，不能只理解为写几句漂亮口号，或者提炼几个传播标签。更底层的工作，是把沉睡的资料变成公众可以进入的知识结构。

二、数字化不是终点，可被理解才是开始

过去许多年，阿姆斯特丹市档案馆一直在推进数字化工作。基础数字化的第一步，是扫描。让纸质档案变成图像，让人们可以通过网站远程查看。这个过程已经极大改善了档案的可访问性。

但扫描并不等于理解。一张16世纪手稿的高清图片，只是把原本放在库房里的困难搬到了屏幕上。纸张纹理更清楚了，墨迹更完整了，印章和折痕也被忠实记录了下来。可如果你仍然读不懂上面的文字，它就依旧是一份沉默的图像。

因此，真正关键的一步，是让手写文本变成机器能够识别、检索、分析的文字。这里涉及的不是普通意义上的OCR，而是 HTR，也就是 Handwritten Text Recognition，手写文本识别。传统OCR主要面对印刷文字，字体相对稳定，版面结构也更可预测；而历史手稿面对的是不同人的笔迹、不同年代的书写习惯、模糊破损的纸面，以及不断变化的语言形态。Transkribus 对 HTR 的解释是：它使用深度学习神经网络，将手写文本图像转换为机器可读字符；与印刷文本OCR不同，HTR必须处理人类手写中近乎无限的变化，包括不同字母形态、连笔和个人书写风格。^[3]

更具体地说，一份历史文档进入AI系统之前，通常要经过一条“档案数据流水线”：第一步是图像采集与清洗，尽可能提高扫描质量；第二步是版面分析，识别正文区、页边注、表格、印章、插图等不同区域；第三步是行检测，把页面切分成可识别的文字行；第四步是字符或词级别识别，将笔迹转化为机器文本；第五步是人工校对和置信度管理，对模型不确定的文字进行修订；第六步是结构化导出，把结果保存为可被后续检索、分析和长期保存的格式。

这意味着，所谓“让历史开口说话”，并不是把一堆扫描件直接丢给大模型。它背后真正困难的地方，是把非结构化、不可读、不可检索的历史材料，逐步转化为可计算、可索引、可追溯的知识对象。

这也解释了为什么许多城市虽然有大量档案、地方志、老照片和文献，却仍然讲不好自己的故事。因为资料存在，不等于知识形成；知识形成，也不等于公众能够进入；公众能够进入，才真正接近城市叙事的开始。

三、AI讲故事，不是凭空生成，而是检索增强

如果只从用户界面看，阿姆斯特丹的“Chat with History”像是一个聊天机器人。但如果从系统架构看，它更接近一个面向历史档案的 RAG 系统，也就是 Retrieval-Augmented Generation，检索增强生成。

RAG 的基本逻辑，不是让大模型凭记忆回答，而是在生成答案之前，先从可信知识库里检索相关材料，再把这些材料作为上下文交给模型组织回答。微软文档对 RAG 的解释是：它将搜索与大语言模型结合，使回答建立在用户自己的数据和检索到的依据之上；当需要基于私有数据或频繁变化的信息作答时，RAG 可以先检索相关信息，再把这些信息作为 grounding data 提供给模型，并生成带有来源引用的回答。^[4]

对于历史档案而言，RAG尤其重要。因为档案不是百科知识，也不是大模型训练语料中稳定存在的常识，而是具体、稀缺、局部、有来源的原始材料。如果没有检索和溯源，大模型很容易把“可能如此”说成“确有其事”，把风格化的历史叙事误认为真实档案内容。这对于公共文化系统来说是危险的。

一个更严谨的档案RAG系统，至少包含四个层次。第一层是原始档案层，包括扫描图像、元数据、目录信息、馆藏编号、版权与访问权限。第二层是文本化层，包括HTR转写结果、人工校对版本、不同语言的翻译文本，以及每一段文本对应原图的位置。第三层是索引层，包括关键词索引、向量索引、时间地点人物标签、主题分类、档案类型字段。第四层才是生成层，也就是用户看到的自然语言问答、摘要、解释、推荐和多语言输出。

这四层里，最容易被普通读者忽略的，是索引层。因为它决定了用户问出一个问题后，系统究竟能不能找到正确材料。现代AI检索通常不会只依赖关键词，而会引入向量检索。所谓向量，就是把一段文本转化为高维数字表示，让机器能够判断“语义相近”，而不只是“字面相同”。Azure AI Search 的技术文档解释说，向量搜索支持对内容的数值化表示进行索引和查询，因此可以匹配与查询向量最相似的内容；它也支持语义相似、多语言内容以及多模态内容的检索。^[5]

但向量检索也不是万能的。历史档案中有大量专名、地名、时间、货币单位、职位名称、机构名称，如果只靠语义相似，可能会漏掉关键的精确匹配。因此更稳健的做法，是混合检索：同时运行关键词搜索与向量搜索，再合并结果。Azure AI Search 的文档也明确提到，混合搜索会在同一个请求中并行运行向量搜索和关键词搜索，并把结果合并为统一排序的结果集。^[5:1]

这正是档案系统需要的技术特征：既要能找到“17世纪贸易纠纷”这种语义问题，也要能锁定“Jan Lambertsz”“Mertyn”“Heynric Gherytsz”这样的具体名字；既要能回答一个孩子的日常问题，也要能服务研究者对人物、地点、事件的精确追索。

四、多智能体的关键是把复杂流程拆开

Capgemini 在项目介绍中提到，“Chat with History”建立在 Microsoft Azure AI Foundry、Agentic Services 和 Microsoft Agent Framework 之上，系统包含 query handler、document retriever、summarizer 等不同代理，由框架进行协调。^[6] 这句话看上去技术味很重，但它其实解释了这个项目为什么不是一个普通聊天机器人。

普通聊天机器人像一个人包办所有工作：理解问题、想答案、组织语言、输出结果。多智能体系统则更像一个工作小组：有人负责听懂问题，有人负责拆解问题，有人负责查档案，有人负责翻译，有人负责核对来源，有人负责把复杂材料写成普通人能读懂的语言。

放到档案场景中，一个较成熟的多智能体系统可以被拆成几类角色。Query Agent 负责理解用户问题，把一句模糊的问题拆成时间、地点、人物、事件和可能的档案类型。Retrieval Agent 负责调用关键词检索、向量检索和元数据过滤，在不同索引中找到候选材料。Source Evaluation Agent 负责判断材料的可靠性、时间范围和相关度，避免把相似但无关的材料混进答案。Translation Agent 负责古荷兰语、现代荷兰语、英语和用户语言之间的转换。Summarization Agent 负责把多份档案材料组织为简洁叙述。Citation Agent 负责保留馆藏编号、页码、图像坐标、转写段落和引用关系。Safety & Uncertainty Agent 则负责标记“不确定”“推测”“缺少证据”的部分。

这听起来复杂，但对于公共历史系统来说非常必要。因为档案问答的目标不是“说得像真的”，而是“知道自己凭什么这样说”。

也正是在这个意义上，AI讲城市故事的关键并不只是“生成能力”，而是“证据链能力”。一个城市叙事系统如果不能回答“这个故事来自哪里”，就很容易从公共知识变成公共想象。技术真正要解决的，不只是让故事更动人，而是让故事有据可依。

五、从“搜索历史”到“体验历史”

2025年，阿姆斯特丹迎来建城750周年。围绕这个特殊节点，阿姆斯特丹市档案馆与 Capgemini、微软合作，推出了“Chat with History”。它的目标不是再做一个更复杂的档案检索网站，而是让公众可以像和一位熟悉城市历史的馆员对话一样，直接向档案提问。Capgemini 的客户案例中写到，用户可以通过简单界面，用自己的语言提出问题，比如“17世纪的儿童玩什么游戏？”或者“我的街道是什么时候建成的？”系统会基于已数字化、转写并从古荷兰语翻译为现代荷兰语的档案材料生成回答。^[7]

这是一种从“检索系统”到“对话界面”的转变。你不必知道某份文件属于哪个目录，也不必先掌握古荷兰语，更不必理解档案馆内部的分类系统。你只需要提出自己的问题：17世纪的阿姆斯特丹港口是什么样子？我的祖先是否可能在这里留下过记录？运河边曾经发生过哪些普通人的故事？城市最早的居民如何生活？

Capgemini 的生成式AI工程师 Lucas Puddifoot 对这个项目有一句很准确的概括：重要的不再是知道去哪里搜索，而是能够去探索。他进一步指出，AI把“寻找知识”转化为“体验知识”。^[8]

这句话真正点出了传统档案系统和新型AI叙事系统之间的差别。搜索，是你已经知道自己要找什么；探索，是你带着一个模糊的问题出发，并允许自己在途中遇见意外。对于专业研究者来说，搜索已经足够重要。他们知道关键词，知道史料类型，知道该去哪个目录下面找，也知道如何判断一份材料的价值。但普通人与城市历史之间的关系，往往不是这样开始的。

一个孩子可能只是好奇：几百年前的人吃什么？一个老人可能想知道：自己家族曾经住过的街区以前是什么样子？一个游客可能想问：这条运河边发生过什么故事？一个设计师可能关心：某个广场在不同时代承担过哪些公共生活？

这些问题未必专业，却非常真实。它们是人们进入城市记忆的入口。过去，档案馆更擅长回答专业问题。未来，城市或许需要学会回答普通人的问题。这不是知识的降级，恰恰是知识重新进入公共生活。一座城市如果只能被专家解释，那么它的历史就仍然停留在少数人的系统里。只有当普通人也能提问、理解、追索、联想，城市记忆才真正从档案馆走向社会。

六、城市故事需要角色，而不只是年表

“Chat with History”的下一步设想，是让系统拥有更具人格化的入口。项目团队希望引入虚拟向导，让用户不只是面对一个搜索框，而是和一个可以引导探索的角色对话。Capgemini 文章中提到，未来系统可能扩展到让用户与历史人物互动，例如 Alewijn，文中称其为“the first Amsterdammer”。^[9]

这个想法很有意思。因为它说明，城市历史的公共传播，不能只依靠信息量，还需要依靠角色、场景和关系。

人很难和“750年历史”建立关系，但可以和一个具体的人建立关系。人很难被“档案数字化工程”打动，但会被一个在450年前遭遇贸易纠纷的商人打动。人很难记住一座城市的完整年表，但可能记住一个孩子、一个船长、一个商人、一个修女、一个档案员、一个移民、一位画师、一名工匠。

这正是城市叙事最重要的转译能力：把年代转译为命运，把档案转译为故事，把空间转译为经验，把宏大的城市历史，转译为普通人可以进入的生命现场。

所以，AI在这里真正有价值的地方，不是把一堆资料总结得更快，而是帮助城市重新组织自己的叙事入口。一个好的城市AI系统，最终不应该只是“问答工具”，而应该成为一座城市的角色库、事件库、空间库、图像库、路线库和解释系统。

它可以告诉你某条街的建成年代，也可以带你理解这条街为什么出现；它可以检索一份旧地图，也可以把地图重新放回今天的城市现场；它可以找到某个人名，也可以让你意识到这个普通人与一座城市的贸易、制度、迁徙和生活方式有什么关系。

七、档案馆正在从仓库变成界面

如果从更长的城市史来看，档案馆的角色正在发生变化。过去，档案馆首先是保存机构。它的核心任务是保护文件、建立目录、维护秩序、服务研究。它像一座城市记忆的仓库，确保那些重要的证据不会散失。

后来，档案馆逐渐成为公共文化机构。通过展览、出版、教育活动和线上数据库，它开始主动面向市民开放。

而AI带来的新变化在于：档案馆可能进一步变成一座城市的叙事界面。所谓界面，就是人和复杂系统之间的连接方式。城市历史极其复杂。它包含制度、空间、人口、产业、灾害、贸易、战争、移民、建筑、道路、家庭、商业和日常生活。没有界面，普通人很难进入其中。

过去，这个界面可能是一座博物馆、一场展览、一本城市史、一条讲解路线，或者一位经验丰富的导览员。现在，AI提供了一种新的界面形式：对话。人们可以不再按照展陈规定的路线理解城市，而是从自己的问题出发，进入城市记忆。这会带来一种新的公共性。城市不再只是被讲述给公众听，而是允许公众向它提问。

从技术角度看，这个“界面”最终可能不止是聊天框，而是一个多模态的城市记忆系统：文字问答负责解释，语音交互降低使用门槛，虚拟形象提供情感入口，老地图负责空间定位，历史照片负责视觉证据，地理信息系统负责把事件重新放回城市现场。Capgemini 也提到，未来系统会扩展新数据集、改进语言模型，并加入语音交互以及老地图、照片等视觉上下文。^[10]

八、讲好城市故事，是一种新的公共能力

今天，几乎每座城市都在谈更新，谈文旅，谈品牌，谈流量，谈年轻人，谈城市IP。但城市IP如果只停留在符号层面，很容易变成空洞的视觉包装。真正有生命力的城市IP，应该来自城市自身的记忆深处。问题在于，记忆本身并不会自动转化为传播力。一份档案不会自己讲故事。一张老照片不会自己找到观众。一段地方志里的文字，也不会自动变成年轻人愿意转发的内容。中间需要一种转译能力。

过去，这种能力主要依赖作家、策展人、历史学者、建筑师、城市研究者和媒体编辑。未来，AI可能成为这个系统中的新成员。它不是取代人的判断，而是帮助人更快地连接资料、发现线索、生成入口、组织叙事。但也正因为如此，人类的判断会变得更重要。

AI可以检索档案，却不能天然知道一座城市最值得讲述的精神线索是什么。AI可以生成摘要，却不能自动判断一个故事对今天的公共生活意味着什么。AI可以让历史变得更容易访问，却不能替代我们对城市价值的重新选择。

阿姆斯特丹这个案例最值得学习的地方，恰恰在这里：它没有把AI当作炫技工具，而是把AI放进一个清楚的公共目标里——让城市历史从档案馆走向公众。这才是技术真正有意义的位置。

Jan Lambertsz 不是什么大人物。他不是国王，不是将军，不是哲学家，也不是城市规划者。他只是一个在16世纪来到阿姆斯特丹做生意的汉堡商人，遭遇了一场贸易纠纷，然后留下了一封抗议信。

在漫长的城市历史中，这样的人有无数个。他们修过路，开过店，搬过家，坐过船，缴过税，写过信，告过状，结过婚，也在某条街上度过过一个普通的下午。历史书很难记住他们，但城市记得。它把他们的名字、笔迹、契约、账本、照片和生活痕迹，藏在档案馆里，藏在街道背后，藏在建筑缝隙中，也藏在一代代人的讲述里。

过去，我们以为保存就是对记忆最好的尊重。现在也许应该再往前走一步。让记忆被重新看见，让档案被重新提问，让普通人的故事重新进入城市叙事。750岁的阿姆斯特丹，正在学习用AI讲述自己。而更多城市真正需要学习的，也许不是某一项技术，而是一种新的态度：城市的记忆，不该只睡在档案馆里。它应该醒来，并且向每一个愿意倾听的人开口。

参考资料

引用链接

Capgemini, “Bringing 750 years of history to life: Revolutionizing accessibility using agentic AI,” 2026-03-10. 文中关于 Jan Lambertsz、Mertyn、Heynric Gherytsz 兄弟及1574年抗议信的叙述，主要参考该文相关段落。https://www.capgemini.com/insights/expert-perspectives/bringing-750-years-of-history-to-life/↩︎
Capgemini, “Amsterdam brings 750 years of history to life with AI.” 关于阿姆斯特丹城市档案馆约50公里纸质档案及馆藏类型的介绍。https://www.capgemini.com/news/client-stories/amsterdam-brings-750-years-of-history-to-life-with-ai/↩︎
Transkribus, “Handwriting to Text — AI Recognition.” 关于 HTR 与 OCR 区别、深度学习识别手写文本的解释。https://www.transkribus.org/handwriting-to-text↩︎
Microsoft Learn, “Retrieval augmented generation (RAG) and indexes in Microsoft Foundry.” 关于 RAG 将搜索与大语言模型结合、让回答基于 grounding data 的解释。https://learn.microsoft.com/en-us/azure/foundry/concepts/retrieval-augmented-generation↩︎
Microsoft Learn, “Vector Search Overview — Azure AI Search.” 关于向量搜索、语义相似、多语言内容、多模态内容和混合搜索的说明。https://learn.microsoft.com/en-us/azure/search/vector-search-overview↩︎↩︎
Capgemini, “Bringing 750 years of history to life: Revolutionizing accessibility using agentic AI.” 关于 Microsoft Azure AI Foundry、Agentic Services、Microsoft Agent Framework、query handler、document retriever、summarizer 等多智能体架构的说明。https://www.capgemini.com/insights/expert-perspectives/bringing-750-years-of-history-to-life/↩︎
Capgemini, “Amsterdam brings 750 years of history to life with AI.” 关于 Chat with History 用户可以用自然语言提问，并基于数字化、转写、翻译的档案材料生成回答的介绍。https://www.capgemini.com/news/client-stories/amsterdam-brings-750-years-of-history-to-life-with-ai/↩︎
Capgemini, “Amsterdam brings 750 years of history to life with AI.” Lucas Puddifoot 关于“search”与“explore”、以及“search for knowledge”到“experiencing of knowledge”的表述。https://www.capgemini.com/news/client-stories/amsterdam-brings-750-years-of-history-to-life-with-ai/↩︎
Capgemini, “Bringing 750 years of history to life: Revolutionizing accessibility using agentic AI.” 关于未来加入历史角色 Alewijn 的设想。https://www.capgemini.com/insights/expert-perspectives/bringing-750-years-of-history-to-life/↩︎
Capgemini, “Amsterdam brings 750 years of history to life with AI.” 关于未来扩展新数据集、改进语言模型、语音交互及老地图、照片等视觉上下文的说明。https://www.capgemini.com/news/client-stories/amsterdam-brings-750-years-of-history-to-life-with-ai/↩︎