Cite:Richards, D., Worden, D., & Lavorel, S. (2026). Generative artificial intelligence use in automated urban ecological assessments requires substantial human oversight. Landscape and Urban Planning, 270, 105615.

城市规划越来越需要生态数据。一个城市有多少绿地,植被覆盖在哪里,哪些区域能够缓解径流、提供遮荫、减少土壤侵蚀,哪些地方具有生物多样性价值,未来面对气候变化应优先采取什么自然基解决方案,这些信息都会影响城市更新、绿地系统规划、蓝绿基础设施建设和气候适应政策。
这类城市生态评估通常成本较高。它需要空间数据、生态模型、地方知识、专业解释和报告写作能力。大型城市或研究资源充足的地区更容易积累相关成果,许多中小城市、发展中国家城市和热带地区城市则长期缺乏本地化生态报告。开放空间数据和生成式 AI 的发展,使自动化城市生态评估成为一个值得检验的问题:能否通过自动化数据处理和大语言模型,快速为全球城市生成生态评估报告?
这篇发表在 Landscape and Urban Planning 的文章围绕这一问题展开。作者构建了一套自动化城市生态报告流程,将 25 个公共数据集、空间分析模型、生态系统服务模型和 GPT-4o 大语言模型结合起来,为全球 72 个城市生成生态评估报告。随后,作者邀请 65 位来自 39 个城市的专家对这些报告进行模拟同行评审,判断这些 AI 辅助报告是否准确、可信,并能否服务城市规划决策。
Fig. 1 展示了自动生成报告的基本样貌。以新西兰 Christchurch 为例,报告包括城市生态系统概述、土地覆盖图、生态系统服务地图,以及未来自然基解决方案的情景图像。Fig. 1a 展示报告首页和导言部分,说明自动化流程已经能够生成一份结构完整的城市生态报告。Fig. 1b 展示土地覆盖地图和 AI 生成的生态描述文字,体现了空间数据如何转化为报告叙述。Fig. 1c 展示径流保持、土壤侵蚀等生态系统服务地图,说明报告进一步评估了城市绿地的生态功能。Fig. 1d 展示由生成式 AI 制作的未来情景图像,用视觉方式呈现自然基解决方案可能带来的城市变化。

这套自动化流程的第一步是数据整合。作者使用全球城市边界数据,从 11,534 个 5 万人以上的城市区域中选择了 72 个城市。每个城市都被输入土地覆盖、植被高度、土壤属性、人口、GBIF 公民科学物种记录、未来气候变化预测等数据。基于这些数据,研究团队计算鸟类、非鸟类脊椎动物和植物的物种丰富度,模拟生态连通性,并估算径流保持、土壤侵蚀、遮荫、紫外线防护、碳积累、绿地可达性等生态系统服务指标。这些指标随后被转化为地图、图表和报告文字,构成城市生态评估的基础材料。
AI 主要参与报告写作、地图解释、信息综合和方案推断。Table 1(详见原文) 列出了作者使用的典型提示词,也是理解全文方法的关键。系统提示词要求 GPT-4o 扮演城市生态报告专家,保持专业、半正式、清晰客观的写作风格;地图解释提示词要求 AI 根据生态连通性地图撰写报告段落;自然基解决方案提示词要求 AI 综合整份报告,提出三个最有潜力的气候适应方案;图像生成提示词则让 AI 为 DALL-E 3 撰写图像提示,生成未来城市生态情景图。AI 在这项研究中承担了报告生产链条中的多项工作,包括解释地图、整合数据、生成文字、提出方案和辅助视觉表达。
为了判断这些报告是否真的可用,作者设计了一个模拟同行评审流程。受访专家被要求阅读某个城市的自动生成报告,并从整体质量、各章节修改需求、决策价值、人工成本、可信度和风险等方面进行评价。研究团队最初没有直接说明报告由 AI 参与生成,而是让专家以为报告来自作者与地方专家合作。之后,作者再揭示 AI 的使用情况,并观察专家对报告质量和可信度的态度变化。
结果首先显示,AI 辅助报告具有一定基础价值。Fig. 2 展示了专家对报告总体质量的评价。多数专家认为报告写得清楚,方法大体合适,也提供了一些新的信息和有用信息。专家普遍没有将报告判断为方法根本错误或解释完全失当。基于公开数据和成熟空间模型生成城市生态报告初稿,在技术上已经具备一定可行性。

不过,专家对报告的总体判断仍然偏谨慎。44.6% 的受访者给出的总体意见是 Major revisions,也就是需要大修。这个结果说明,自动化报告可以形成一个可读、可讨论的初稿,正式发布和直接服务规划决策仍需要大量专业修订。对于城市生态评估这类专业文本来说,清楚和完整只是起点,真正关键的是地方准确性、生态解释深度和规划建议的可执行性。
不同章节的表现差异更加明显。Fig. 3 展示了专家认为各报告章节需要修改的程度。方法、数据可得性、参考文献、地图等部分被认为问题较少,很多专家认为这些内容无需修改或只需轻微编辑。原因在于这些部分主要依赖固定数据、既有模型和人工预设结构,AI 自由发挥的空间较小。

修改需求最大的部分集中在气候变化风险和适应选项。专家认为这些章节更容易出现泛化、乐观化和地方不适配的问题。比如,AI 可能把某些自然基解决方案套用到现实条件并不充分的城市,也可能高估某些城市面临的热岛风险。城市气候适应方案需要结合财政能力、维护成本、土地制度、社会结构、地方生态系统和历史文化背景,仅靠全球数据和模型预训练知识,很难完成可靠判断。
Fig. 4 进一步展示了各章节对决策的价值。专家普遍认为大多数章节对决策略有帮助,其中数据可得性、参考文献和交互式地图被认为非常有帮助的比例较高。这说明专家最认可的是可追溯的数据、透明的方法和可以直接查看的空间结果。文化生态系统服务部分的评价相对较弱,较多专家认为其略微无用或可能误导。文化生态系统服务涉及地方记忆、群体身份、原住民知识、社会可达性和日常使用方式,全球公共数据很难完整覆盖,大语言模型也容易生成模板化、表层化甚至文化不准确的内容。

这篇文章最有冲击力的结果来自 Fig. 5。专家估计,如果由人类科学家从头重做一份自动化报告,大约需要 21.4 小时;如果要把自动化报告修改到适合发布的水平,还需要约 139.8 小时。综合计算后,自动化大约只能节省 10.3% 的总劳动时间。换句话说,AI 可以帮忙生成初稿,报告真正进入可用状态仍然主要依赖人工专家。

这一结果也体现在成本估算中。作者记录到,搭建自动化管线需要一位具备编程能力的城市生态学家投入约 90 小时,折算成本约 2009 美元。GPT-4o 运行一个城市报告的直接成本只有约 0.30 美元。AI 生成初稿的成本很低,专家校核、地方化修订和最终责任把关的成本仍然很高。如果将这套流程扩展到全球 11,534 个城市,人工生成同等初稿可能需要数百万美元,而把 AI 自动生成报告修改到可发布水平,仍可能需要约 3600 万美元的人工投入。
专家对 AI 的识别和信任变化也很值得关注。Fig. 6 显示,多数专家在阅读报告时已经怀疑其中使用了生成式 AI,并且不少人对此相当有信心。揭示 AI 参与之后,多数专家对报告质量的评价没有发生剧烈变化,但总体上更倾向于略微降低质量评价,报告可信度也出现轻微下降。这说明,专家对报告的顾虑来自文本中已经暴露出的泛化表达、地方细节不足和推断深度有限。

Table 2 总结了专家对生成式 AI 参与城市生态报告的主要担忧。被提及最多的是错误信息或虚假信息,共 51 次;其次是训练数据偏见或狭窄世界观,共 40 次;缺乏透明度被提及 21 次。其他担忧还包括 AI 的优先事项与人的需求不一致、抄袭、原住民数据主权、知识产权、数据安全、就业安全、隐私和加剧不平等等。这些风险都指向同一个核心问题:AI 生成的内容看起来专业,其背后的数据来源、推理过程、价值取向和地方适配性必须接受审查。

文章最后给出的判断非常现实。生成式 AI 和自动化数据处理流程可以扩大城市生态评估的生产能力,尤其适合快速整理公开数据、生成报告框架、制作初步地图说明和辅助科学传播。对于缺乏基础生态资料的城市而言,这样的初稿具有一定启发价值,可以帮助规划者和研究者更快看到城市生态问题的基本轮廓。
城市生态评估一旦进入规划决策,就会影响土地利用、绿地建设、气候适应投资和公共资源分配。文本中的一个错误物种判断、一个不合适的自然基方案、一个忽略地方文化的表述,都可能影响决策质量。AI 可以提高初稿生产速度,地方专家对生态过程、社会条件和规划语境的判断仍然不可替代。
这篇文章给城市研究和规划实践的启发在于,AI 更适合作为辅助性基础设施。它可以帮助我们更快整合数据、更快形成报告雏形、更快进行跨城市比较,最终报告仍需要专家审阅、地方知识补充、利益相关者参与和透明披露。尤其是在文化生态系统服务、气候适应方案和未来规划建议这些部分,人类监督依然是报告可信度的核心来源。
自动化城市生态评估的未来,需要建立更清晰的人机协作流程。数据处理由自动化系统提高效率,初稿写作由大语言模型降低门槛,关键解释由专家校核,地方价值由社区和本地知识补充,最终输出公开说明 AI 使用范围和人工审查过程。在这样的流程中,AI 生成的城市生态报告才能从技术实验走向更稳健的规划应用。
夜雨聆风