乐于分享
好东西不私藏

真正的 GeoAI Agent,不是给地图接一个聊天框

真正的 GeoAI Agent,不是给地图接一个聊天框

从空间上下文、专业知识、AI 模型层、三维数据能力到自主学习机制

核心观点GeoAI Agent 的核心不是“回答问题”,而是“完成空间任务、学习空间模式、预测空间结果,并持续改进自身行为”。

这两年,很多 GIS 系统开始接入大模型。

最常见的形态是:左边一张地图,右边一个聊天框。用户输入“帮我分析这块地”,系统返回一段解释;用户输入“生成 NDVI”,系统调用一个工具;用户输入“写个报告”,系统把已有结果拼成文字。

这当然有价值,但它还不等于真正的 GeoAI Agent。

真正的 GeoAI Agent,不是“会聊天的 GIS”,也不是“会调用几个遥感工具的大模型”。它应该是一个围绕地理空间对象持续工作的智能系统:能理解空间上下文,能融合专业知识,能判断数据条件,能调度 GIS 与三维空间工具链,能训练和调用深度学习模型,能处理遥感影像、矢量、DEM、倾斜摄影模型、激光点云等多源空间数据,能把结果物化成图层、三维场景和报告,并能通过自主学习机制持续优化后续决策。

一、普通 ChatGIS 和 GeoAI Agent 的区别

普通 ChatGIS 更像一个带地图知识的问答助手。它可以解释 NDVI 是什么,可以告诉你坡度分析怎么做,也可以根据 prompt 生成一段报告。但它通常缺少几个关键能力:

不知道当前项目真实有哪些数据          不知道当前 AOI 是否明确          不知道图层质量是否满足分析条件          不知道三维模型、点云、影像和矢量之间的空间关系          不知道什么时候应该拒绝执行或追问用户          不能自动组织训练数据、训练模型和执行预测          不能把预测结果稳定回写到 GIS 或三维场景          生成的结果往往停留在文本层,没有真正进入空间工作流

真正的 GeoAI Agent 必须跨过这个边界。它不是一个“知识问答入口”,而是一个“空间任务智能体”。

二、一个完整的 GeoAI Agent 应该有哪些层

以这个项目为例,一个相对完整的 GeoAI Agent 应该拆成十一层:

图 1GeoAI Agent 十一层闭环架构

1. 交互层:地图、三维场景、AOI、图层、对话、人工审核          2. Agent API 层:消息入口、流式响应、任务事件、上下文返回          3. 多源空间数据与三维资产层:遥感影像、矢量、DEM、倾斜模型、激光点云、BIM/CAD          4. 空间上下文层:项目、AOI、图层、任务、报告、模型版本、历史状态          5. 专业知识层:遥感、摄影测量、点云、三维重建、地形水文、地质灾害、土壤、气象、农学、业务规则、数据质量与不确定性          6. 策略决策层:条件检查、阻塞判断、补救动作、人工确认边界          7. LLM 规划层:自然语言理解、工具计划、多步骤任务拆解          8. 任务编排层:任务队列、工作流串联、状态追踪、失败恢复          9. AI 模型层:样本、训练、评估、注册、推理、反馈再训练          10. GIS 与三维空间计算层:栅格、矢量、点云、倾斜模型、空间统计、后处理          11. 结果物化与自主学习层:图层、三维成果、报告、反馈、规则优化、模型再训练

这十一层不是架构包装,而是为了把“智能”拆成可控、可验证、可演进的工程模块。

三、交互层:地图和三维场景都是操作现场

GeoAI Agent 的第一层是交互层。用户不是只在聊天框里输入一句话。他可能会画 AOI、选择图层、查看 DEM、打开历史任务、比较 NDVI 结果、确认田块边界、查看报告,也可能在三维场景中查看倾斜摄影模型、激光点云、建筑立面、边坡、道路、管线、矿山或城市部件。

所以地图不是聊天机器人的装饰背景,三维场景也不是展示效果。它们都是 Agent 的工作现场。

后续如果加入倾斜摄影和点云,交互层还应该支持:

三维模型加载          点云分级显示          剖面量测          体积量算          高度量测          模型与影像叠加          点云分类结果查看          人工修正和审核

因为地理智能不是纯文本智能。空间任务必须落到空间对象上。

四、多源空间数据与三维资产层:GeoAI 不只处理二维图层

很多人谈 GeoAI,容易默认它处理的是遥感影像和矢量图层。但真实空间业务远不止这些。

一个完整的 GeoAI Agent 应该能够管理多源空间数据:

遥感影像          无人机影像          矢量数据          DEM / DSM / DTM          气象数据          土壤数据          倾斜摄影模型          激光点云          BIM / CAD          传感器时序数据          历史任务结果

其中,倾斜摄影和激光点云尤其重要。倾斜摄影三维建模通常对应无人机多视角影像、空三成果、实景三维模型、纹理网格、OSGB / 3D Tiles、真正射影像、DSM、建筑外立面和地物细节。

激光点云通常对应 LAS / LAZ / COPC / E57、机载 LiDAR、车载 LiDAR、地面三维扫描、无人机激光雷达、点云分类、地面点、非地面点、建筑物、植被、道路和电力线等对象。

这些不是普通附件,而是 GeoAI Agent 的核心空间资产。如果没有这一层,Agent 就很难知道当前项目里到底有哪些数据、哪些数据可用于训练、哪些数据可用于预测、哪些数据只能用于展示、哪些数据需要预处理。

五、空间上下文层:Agent 必须知道“当前有什么”

用户说“帮我做一下这个区域的三维风险分析”,这句话对普通大模型来说是不完整的。它不知道这个区域在哪里,也不知道有没有 DEM、倾斜模型、点云、建筑物轮廓、历史变化数据,更不知道当前项目里是否已经存在可复用的分析成果。

所以真正的 Agent 需要空间上下文层。这一层维护当前项目里的核心对象:

AOI          二维图层          三维模型          点云数据          DEM / DSM          任务          报告          统计结果          模型版本          对话线程          历史状态          可用工具

如果当前项目已有 AOI 和点云,它可以直接进入点云分类或量测流程。如果只有倾斜模型、没有点云,它应该判断哪些分析可以做、哪些分析不能做。如果存在多个三维数据源,它应该判断它们是否同一区域、同一坐标系统、同一时间批次。

这就是 GeoAI Agent 和普通 LLM 应用的第一个分水岭:它必须拥有项目级空间状态。

六、专业知识层:不能只会调工具,还要知道结果意味着什么

很多系统以为,只要大模型能调用 NDVI、坡度分析、天气查询、点云分类、三维建模这些工具,就已经是 GeoAI Agent。这不够。因为工具输出不等于专业判断。

专业知识层不能只写成“遥感、农学、地形、土壤、气象、三维测绘”几个标签。它更像一个面向空间任务的领域知识中枢,至少应该覆盖以下知识域:

遥感知识:传感器、光谱指数、云/阴影、物候期、空间分辨率和时间分辨率          摄影测量知识:空三、像控点、相机模型、正射校正、DSM/真正射、倾斜模型精度          点云知识:LiDAR 点密度、回波、分类、地面点提取、配准精度、COPC/LAS/LAZ 数据组织          三维重建知识:网格、纹理、3D Tiles、LOD、模型空洞、遮挡、几何和纹理质量          GIS 方法知识:CRS、投影、重采样、NoData、拓扑、尺度效应、空间叠加和误差传播          地形水文知识:坡度、坡向、汇流、洼地、侵蚀、排水、边坡稳定性          地质与灾害知识:滑坡、沉降、形变、洪涝、风险分区、监测阈值和预警规则          土壤与气象知识:土壤质地、有机质、pH、含水量、降雨、积温、霜冻、风速          农学知识:作物类型、生育期、种植制度、农机通行、播种/施肥/喷药窗口          城市与自然资源知识:建筑物、道路、矿山、水利、电力、林草、用地变化和合规边界          模型适用性知识:训练区域、样本分布、模型版本、置信度、泛化边界和失效条件          数据质量与不确定性知识:精度、时相一致性、配准误差、采样偏差、结论可信度表达

例如用户问“这个地块适不适合春玉米种植?”空间上下文层只能告诉系统有 AOI、有 DEM、有天气数据、有土壤数据、有遥感指数。但专业知识层要告诉系统:

春玉米适宜性不能只看 NDVI          需要考虑积温、水分、坡度、土壤质地、排水条件、霜冻风险          坡度过大时机械化作业风险升高          土壤含水量过高时不适合下地播种          连续降雨会影响播种窗口

再比如用户问“这段边坡有没有变形风险?”这就不能只看一张三维模型截图。专业知识层需要知道点云时间序列是否可比、点云配准精度是否足够、坡面是否存在异常位移、坡度坡向和地表水路径是否影响稳定性、植被遮挡是否影响点云质量,以及是否需要和降雨、地质、历史灾害数据联合判断。

专业知识层至少要承担三件事:约束哪些情况下不能直接下结论;解释工具输出在业务上意味着什么;推荐下一步应该补充什么数据或分析。

七、策略决策层:知道什么时候不能做

Agent 的可靠性,不只来自“能做什么”,也来自“知道什么时候不能做”。比如用户说“生成这个区域的地形分析报告”,系统需要判断有没有 AOI、有没有 DEM、DEM 分辨率是否足够、是否已有可复用 DEM,以及用户是否真的要求报告。

如果用户说“帮我用点云识别建筑物并计算高度”,系统还需要判断:

有没有点云?          点云是否带坐标?          点云密度是否足够?          是否已经完成地面点分类?          是否存在 DSM / DTM?          是否需要建筑物轮廓作为约束?          当前模型是否适用于该地区和该点云类型?

如果条件不足,真实 Agent 不应该假装能做。它应该返回明确的阻塞状态,例如缺少 AOI、缺少 DEM、缺少点云、点云尚未分类、倾斜模型缺少空间参考、存在多个 AOI 需要选择目标区域等。

这类策略判断,是 GeoAI Agent 工程化落地的核心。没有策略层,LLM 很容易过度自信:数据不够也回答,范围不清也执行,结果不可靠也生成报告。

八、LLM 规划层:大模型负责开放式意图,不负责绕过规则

LLM 在 GeoAI Agent 里当然重要,但它不应该成为唯一的大脑。它更适合处理开放式表达,比如“帮我看看这个园区有没有新增建筑,顺便评估一下三维数据质量”。

这句话可能包含多个隐含任务:识别 AOI,检查历史影像或历史模型,检查当前倾斜模型或点云,执行变化检测,提取疑似新增建筑,评估模型空洞、纹理质量和点云密度,生成变化图层和质量报告,必要时要求人工复核。

LLM 规划层的价值,是把自然语言意图转换成工具调用计划。但它必须受空间上下文、专业知识和策略规则约束。也就是说,大模型可以参与规划,但不能绕过数据条件、业务约束和人工确认流程。

九、任务编排层:从“会说”变成“会做”

很多 AI 应用停留在“生成答案”。但 GeoAI Agent 必须能创建任务、追踪任务、处理失败、串联后续步骤。

比如地形分析可能不是一步完成,而是一条链式流程:

确认 AOI          检查 DEM          获取 DEM          计算坡度          计算坡向          计算汇流          生成地形图层          生成分析报告          回写项目结果

点云建筑物提取也不是一步完成:

检查点云格式          点云切片          坐标系统检查          地面点分类          生成 DTM / DSM          建筑物候选提取          模型推理          矢量化建筑轮廓          计算高度和面积          人工审核          生成成果图层和报告

倾斜摄影变化检测也可能是一条工作流:检查两期模型或影像、空间配准、生成可比区域、提取建筑物或地物特征、执行变化检测、过滤误检、生成变化斑块、三维场景高亮和输出核查报告。

任务编排层负责把规划结果变成真实执行过程,并管理 queued、running、succeeded、failed、needs_review、blocked 等状态。

十、AI 模型层:GeoAI 的核心不是只会算,而是会训练和预测

这一层是 GeoAI Agent 和传统 GIS Agent 的关键区别。GIS 与三维空间计算层可以完成确定性空间处理,例如裁剪、重投影、坡度分析、点云切片、体积量算、分区统计。但 GeoAI 的核心能力是从空间数据中学习模式,并对未知区域做预测。

所以,深度学习模型训练与预测必须单独成层,不能只是 GIS 工具箱里的一个按钮。AI 模型层应该覆盖完整生命周期:

样本管理          训练数据构建          特征工程          模型训练          模型评估          模型注册          模型版本管理          批量推理          预测结果后处理          人工审核          反馈再训练

它面向的问题包括田块边界识别、作物类型识别、地物分类、长势预测、产量预测、病虫害识别、土壤水分反演、灾害风险预测、变化检测、点云语义分割、点云实例分割、建筑物提取、电力线识别、道路附属设施识别、倾斜模型缺陷检测和三维场景变化检测。

举个例子,用户说“根据这批影像和点云训练一个建筑物提取模型,并预测当前区域的建筑物轮廓和高度”。真正的 GeoAI Agent 不应该只调用一次识别工具,而应该完成从样本收集、数据一致性检查、特征构建、模型训练、指标评估、模型注册、批量推理、成果后处理、人工审核到修正回流的一整条模型工作流。

关键判断没有 AI 模型层,系统仍然可以是 GIS Automation Agent,但它还不能算完整的 GeoAI Agent。

十一、GIS 与三维空间计算层:真实空间计算必须可复现

AI 模型层负责学习和预测,GIS 与三维空间计算层负责确定性空间处理。这两层关系非常紧密,但职责不同。

栅格裁剪          矢量叠加          坐标转换          DEM / DSM / DTM 处理          坡度坡向          水文分析          遥感指数计算          分区统计          格式转换          空间拓扑修复          点云切片          点云重采样          点云配准          点云分类          点云剖面分析          体积量算          倾斜模型切片          三维瓦片生成          模型简化          纹理与几何质量检查

AI 模型层输出的预测结果,往往还需要这一层做后处理。例如田块边界模型输出概率图后,需要阈值分割、形态学处理、矢量化、边界平滑、小斑块过滤、拓扑修复和面积统计。

点云建筑物识别后,需要地面归一化、建筑物点聚类、轮廓提取、高度计算、屋顶平面拟合、异常点过滤和矢量成果生成。倾斜模型变化检测后,需要模型配准、变化区域定位、三维瓦片裁剪、变化斑块生成、体积差估算和场景高亮显示。

层级边界GIS 与三维空间计算层让 Agent 会算,AI 模型层让 Agent 会学、会预测。

十二、结果物化与自主学习层:结果要进入系统,并反过来改进系统

真正的 Agent 不应该只回复“已为你完成分析”。它应该把结果写回系统:

新增 DEM 图层          新增坡度图层          新增田块边界预测图层          新增点云分类图层          新增建筑物提取结果          新增倾斜模型变化斑块          新增模型版本          新增评估报告          新增任务记录          更新线程上下文          保存本次执行过程

这些结果要能被用户继续查看、叠加、分析、导出和复用。更重要的是,系统要具备自主学习机制。

它不仅记录“做了什么”,还要能够从任务结果、用户反馈、人工审核和模型评估中提取改进信号:

哪些任务链路成功率更高          哪些数据条件容易导致失败          哪些模型版本在特定区域表现更好          哪些影像条件不适合进入训练集          哪些点云密度不足以支撑建筑物提取          哪些倾斜模型质量问题容易造成误判          哪些人工修正可以回流为新样本          哪些策略规则需要更新

这些信号会继续作用于后续决策:优化工具调用顺序,调整阻塞和追问规则,推荐更合适的数据源,选择更可靠的模型版本,触发主动学习或再训练,改进报告解释模板,改进三维成果质检规则。

这就是从“工具调用系统”走向“自主学习型 GeoAI Agent”的关键。

、结语:GeoAI Agent 的本质是空间智能闭环

真正的 GeoAI Agent,不是把大模型放进 GIS 系统里。它应该是一个围绕空间对象运行的智能闭环。

它知道当前有什么数据,知道缺什么条件,知道什么时候不能做,知道应该调用哪些 GIS 和三维空间工具,知道如何训练和使用模型,知道如何解释预测结果,也知道如何通过自主学习机制持续优化自身行为。

最终定义GeoAI Agent = 多源空间数据 + 空间上下文 + 专业知识 + 策略判断 + LLM 规划 + 任务编排 + AI 模型训练预测 + GIS 与三维空间计算 + 结果物化 + 自主学习机制。

其中,AI 模型层是核心,不是附属功能。倾斜摄影和激光点云也不是展示数据,而是 GeoAI Agent 必须理解、处理、分析和学习的重要空间资产。

没有 AI 模型层,系统最多是 GIS Automation Agent。没有三维空间数据能力,系统很难覆盖真实城市、矿山、交通、水利、电力、应急和自然资源场景。没有自主学习机制,系统只是一次性自动化流程。

只有把训练、预测、评估、人工审核、反馈再训练、策略优化接入整个空间工作流,才更接近真正的 GeoAI Agent。

未来的 GIS 软件,不会只是“人点按钮、系统出图”。更可能是:

人提出目标          Agent 理解空间对象          系统判断数据条件          模型学习空间模式          工具完成二维和三维空间计算          专家知识约束结论          结果回到地图、三维场景和报告          反馈触发模型再训练与策略优化          系统自主改进下一次行动

这才是GeoAI Agent真正值得建设的方向。这是近乎半年以来的心血,几乎可以适配到任何相关行业的垂直纵深领域,也是我迄今为止最为满意的成果,没有之一,剩下的工具链和cli的完善都只是时间问题。