
由于微信推送机制改版,是不是经常看不到论文推送啦?
如果你也在做交通+机器学习相关研究,别再让优质论文分享从指尖溜走了。
👉给「交通遇上机器学习」点赞+分享+喜欢

导读
城市中的人到底从哪里来、到哪里去?这类区域间 OD 流信息是交通规划、城市治理、疫情传播建模、灾害响应和基础设施配置中的关键数据。但传统出行调查成本高、更新慢,手机轨迹和 GPS 数据又面临隐私与长期大范围获取困难的问题。本文提出一个新的思路:能不能只看城市的“卫星影像”,就预测城市内部的人类流动?
本文提出深度学习模型 Imagery2Flow,利用 10 米 Sentinel-2 和 30 米 Landsat-8 中分辨率卫星影像,预测美国前 10 大都市统计区内部 census tract 之间的人类 OD 流。模型通过自监督学习提取遥感影像中的空间上下文特征,再利用图注意力网络学习地理单元之间的空间交互关系,并通过双线性解码器或 LGBM 解码器预测 OD 流。实验表明,Imagery2Flow-LGBM 在多数评价指标上优于传统机理模型、机器学习模型和深度学习模型;同时,模型还能用于分析城市形态、人类流动距离衰减、空间异质性以及跨城市、跨时间迁移能力。


1
基本信息
标题:Predicting human mobility flows in cities using deep learning on satellite imagery
期刊:Nature Communications
作者:Yichen Xu, Song Gao, Qunying Huang, Aslıgül Göçmen, Qiang Zhu, Feng Zhang
单位:Zhejiang University;University of Wisconsin–Madison;Ministry of Natural Resources of the People’s Republic of China
发表时间:2025 年

2
研究动机
传统 OD 流数据获取成本高,更新不及时:城市 OD 流对于交通管理、城市规划、公共资源配置、疫情传播建模和灾害响应都很重要,但传统出行调查成本高、周期长,难以支持持续更新的人类流动分析。
个体轨迹数据虽然丰富,但存在隐私与可得性限制: GPS、手机信令和地理标记社交媒体等数据可以反映人类移动行为,但个体级移动轨迹数据受到隐私保护限制,尤其难以在大范围、长时间序列场景中直接获取。
现有深度学习方法依赖多源社会经济或移动数据,难以服务数据稀缺区域: 许多 OD 流预测方法依赖人口统计、POI、土地利用、移动电话位置或历史 OD 数据,虽然预测性能较好,但限制了其在数据贫乏地区的应用。
遥感影像为城市人类流动建模提供了新的外生信息源:卫星影像具有开放、连续、大范围覆盖和时间标记明确等优势,能够反映道路、建筑、土地覆盖、城市扩张和空间形态等地理环境信息。本文希望利用这些外生空间上下文信息,直接预测城市内部人类 OD 流,并进一步理解城市形态与人类移动之间的关系。

3
核心创新点
1、数据视角创新:用开放卫星影像预测城市人类 OD
现有 OD 流预测研究通常依赖人口统计、土地利用、POI、手机位置或历史 OD 流等数据,而这些数据在数据稀缺地区往往难以获取,个体移动轨迹还存在隐私问题。本文转向开放获取的 Sentinel-2 和 Landsat-8 卫星影像,利用遥感影像中反映的建筑密度、交通基础设施、土地覆盖、城市形态和空间布局等信息,预测城市内部细粒度人类流动。这使得模型在缺少调查数据或移动轨迹数据的区域中具有应用潜力。
2、模型结构创新:Imagery2Flow 三阶段框架
Imagery2Flow 由三个核心模块组成:第一,空间上下文嵌入模块利用自监督对比学习从卫星影像中提取地理单元视觉特征;第二,空间交互学习模块基于 census tracts 的地理邻接关系构建图结构,并通过 Graph Attention Network 学习空间交互;第三,OD 流预测模块通过双线性解码器预测区域间流动,并进一步提出 Imagery2Flow-LGBM,将 LGBM 作为解码器提升模型灵活性与预测性能。
3、任务设计创新:兼顾预测精度、空间泛化和时间泛化
本文不仅验证模型在美国前 10 大都市统计区内部 OD 流预测中的性能,还进一步考察跨城市空间迁移和跨年份时间迁移能力。实验显示,模型在具有相似地理环境和城市空间结构的城市之间具有一定迁移能力;基于 2020 年数据训练的 Imagery2Flow-LGBM 还可以用于 2010 年和 2002 年左右历史遥感影像的人类流动推断。
4、解释分析创新:从人类流动角度连接遥感影像与城市形态
论文不仅将卫星影像用于预测,还进一步分析预测 OD 流与城市形态之间的关系。结果表明,预测流能够复现真实通勤流的距离衰减规律,并与城市紧凑性和中心性指标存在较强相关性。这说明遥感影像不仅能服务于 OD 流预测,也可以作为理解城市形态与人类移动关系的工具。

4
论文摘要
理解复杂城市环境与人类流动模式之间的相互作用,是构建自适应交通系统、韧性社区和可持续城市发展的重要基础。然而,传统调查获得的区域间 OD 流信息更新成本较高。卫星影像能够提供及时、低成本、大范围的城市观测信息,为研究城市形态与人类流动之间的关系提供了新途径。
本文提出深度学习模型 Imagery2Flow,利用 10 米至 30 米中分辨率卫星影像预测城市区域内细粒度人类流动。模型首先通过自监督深度学习将卫星影像编码为高维嵌入,再利用图注意力网络聚合邻域信息并学习地理单元之间的空间交互关系,最终预测区域间 OD 流。基于美国前 10 大都市统计区的大量实验表明,Imagery2Flow 具有良好的预测性能和灵活的空间、时间泛化能力。通过分析空间异质性,论文进一步探讨了城市中心性和紧凑性等因素对人类流动分布的影响。研究还发现,城市扩张类型有助于解释跨城市模型泛化能力,而时间迁移结果说明,遥感观测到的建成环境能够捕捉城市人类活动与城市化过程中的流动规律。

5
研究方法
研究区域与数据构建
本文选取美国前 10 大 Metropolitan Statistical Areas 作为研究区域,包括 New York、Los Angeles、Chicago、Dallas、Houston、Washington D.C.、Philadelphia、Miami、Atlanta 和 Phoenix 等都市区。空间单元采用 census tracts,真实 OD 流来自美国 Census Bureau 的 2020 LODES 数据,表示居住地与就业地之间的通勤流。论文去除了 census tracts 之间少于 10 名通勤者的流,以保证稳定流动模式的刻画。遥感数据包括 Sentinel-2 10 米影像、Landsat-8 30 米影像,以及用于历史年份迁移实验的 Landsat-5 影像。

卫星影像空间上下文嵌入
对每个都市区,论文将完整遥感影像按照 census tract 边界切分为多个地理单元影像。模型对同一区域影像进行随机裁剪、尺寸调整和颜色扰动等数据增强,生成两个相似视图,并通过自监督对比学习得到区域的卫星影像嵌入。后续实验采用 ViT-L/16 作为视觉特征提取骨干网络。该嵌入用于表征每个地理单元中建筑、道路、土地覆盖等复杂视觉特征。
基于图注意力网络的空间交互学习
为了考虑地理位置、距离和邻接关系对 OD 流的影响,论文将 census tracts 表示为图节点,基于地理邻接关系构建图结构,并以 census tract 质心之间的行车距离作为边特征。随后,模型采用 Graph Attention Network 学习邻居节点对当前节点的重要性,通过消息传递和邻域聚合更新节点表征,从而捕捉区域之间的空间交互模式。

OD 流预测器与 Imagery2Flow-LGBM 变体
Imagery2Flow 使用双线性变换作为 OD 流预测器,根据起点和终点节点嵌入预测 OD 流强度。论文还提出 Imagery2Flow-LGBM 变体,即将起点嵌入、终点嵌入和两者之间的地理距离输入 LGBM 解码器,通过树集成模型捕捉更复杂的非线性关系并提升效率。
数据不均衡处理与训练策略
OD 流数据具有明显偏斜性:大量 OD 对流量较小,少量 OD 对流量较大。论文在训练中对流强度进行 log transformation,并采用 Batch-based Monte-Carlo Loss 处理流量分布不均衡问题。BMC Loss 通过 batch 内标签样本构造类似对比学习的目标,帮助模型区分正确与错误的预测-目标组合,从而缓解不均衡带来的影响。
对比模型与评价指标
论文将 Imagery2Flow 与传统机理模型、机器学习模型和深度学习模型进行比较,包括 Radiation Model、Gravity Model、XGBoost、LGBM、Deep Gravity、SIGCN 和 GMEL 等。评价指标包括 RMSE、MAE 和 CPC,其中 RMSE 和 MAE 越低越好,CPC 越接近 1 表示预测 OD 矩阵与真实 OD 矩阵越相似。

6
实验结果
整体预测性能对比
论文在美国前 10 大都市统计区上比较了传统机理模型、机器学习模型、深度学习模型与 Imagery2Flow 系列模型的预测性能。结果显示,Radiation Model 和 Gravity Model 整体表现较弱,XGBoost 和 LGBM 证明了遥感视觉特征对 OD 流预测的有效性;在此基础上,Imagery2Flow-LGBM 进一步利用图神经网络编码地理单元关系并聚合邻域信息,在多数评价指标上取得最优表现。使用 10 米 Sentinel-2 影像时,相比直接使用视觉特征的传统机器学习模型,RMSE 降低 4.5% 至 13.9%,MAE 降低 1.3% 至 10.8%,CPC 提升 1.3% 至 2.6%,说明空间交互学习能够有效增强遥感影像 OD 流预测能力。

纽约地区预测表现与分组分析
论文以 New York-Newark-Jersey City 都市区为例,展示真实通勤流、10 米影像预测流和 30 米影像预测流,并进一步按起点人口分位、OD 距离和流强度分组计算 CPC。结果显示,模型在不同人口分位组中表现稳定,说明遥感影像相比 POI 或社交媒体数据具有更均匀的空间覆盖能力;模型在短距离和长距离流动中均有较好表现,但高强度流量 OD 对预测误差更大,这与训练集中低强度流占多数、高强度流稀疏的数据不均衡有关。

城市形态与距离衰减规律分析
Fig. 4h 给出了系统自动生成的执法人员周排班结果。实验展示了算法如何在一周内为不同区域分配执法人员,并尽量满足公平工作量、劳动合同约束和重点区域覆盖需求。论文利用 Maximum Likelihood Estimation 拟合真实和预测通勤流的距离分布,发现二者均呈现指数型距离衰减规律,即随着起终点距离增加,通勤流概率下降。预测流与真实流分布高度接近,说明卫星影像预测得到的 OD 流能够复现城市人类流动的基本空间规律。原文进一步报告,距离衰减参数与城市紧凑性和中心性指标存在较强相关性,Pearson 相关系数约为 0.6 至 0.8,表明模型不仅能预测 OD 流,也能帮助从人类移动角度理解城市形态。结果表明,该模块能够把停车统计和需求预测转化为实际管理行动,使数字孪生不只是展示工具,而是能支持执法资源优化的决策系统。

空间异质性与误差来源分析
论文以纽约都市区为例,分析 OD 流预测误差在空间和地理属性上的异质性。结果显示,模型在郊区附近预测精度较高,而在城市中心附近相对更容易出现误差,这与高人口、高流量区域的“饱和效应”有关。图中 A 类区域主要对应植被覆盖,如绿带、湿地和公园;B 类区域对应复杂土地利用和城市功能,如学校、工业用地、机场、商业区和地标;C 类区域对应社会经济异质性,如收入、年龄和族裔结构差异。该实验说明,遥感影像 OD 流预测误差并非随机分布,而与土地覆盖、城市功能和社会经济差异密切相关。

跨城市空间迁移实验
论文将模型在一个都市区训练后直接迁移到另一个都市区预测 OD 流,并以 CPC 构建跨城市迁移矩阵。结果显示,同城训练和测试的表现通常优于跨城市迁移;相比基础 Imagery2Flow,Imagery2Flow-LGBM 显著提升了整体迁移性能。部分城市对如 Dallas-Houston 和 Washington D.C.-Philadelphia 表现较好,说明具有相似地理环境和城市空间结构的都市区之间更容易迁移;而当城市土地覆盖、土地利用、人口分布和空间结构差异较大时,迁移性能会下降。

土地覆盖类型对迁移解释的辅助分析
论文展示了美国前 10 大都市统计区的土地覆盖类型分布,用于解释跨城市迁移能力差异。结果表明,土地覆盖相似性能够部分解释模型迁移效果,例如 Washington D.C. 与 Philadelphia 的地理环境相似性有助于其较好的空间迁移表现。但论文也指出,空间迁移不能仅由土地覆盖解释,还与城市扩张类型、人口与就业空间结构、土地利用模式以及社会经济活动分布共同相关。

历史年份时间迁移实验
论文将基于 2020 年数据训练的 Imagery2Flow-LGBM 应用于 2010 年和 2002 年左右的历史遥感影像,检验模型的时间迁移能力。结果显示,在美国前 10 大都市统计区中,模型在历史年份上的 CPC 均高于 0.67,说明模型可以利用历史遥感影像推断过去时期的人类流动模式。这表明模型确实学习到了卫星影像中复杂地理环境与人类流动之间的关系,而不仅仅是在某一时间截面上拟合数据。


7
结语
本文提出的 Imagery2Flow 和 Imagery2Flow-LGBM 证明了一个重要观点:城市人类流动不仅存在于调查数据、手机轨迹或 GPS 记录中,也被城市建成环境本身所反映。卫星影像中的建筑密度、道路结构、土地覆盖、城市扩张和空间布局等信息,能够为 OD 流预测提供有效支撑。
从方法上看,本文将自监督遥感影像表征、图注意力网络和 OD 流预测相结合,为数据稀缺地区的人类流动估计提供了一种低成本、可扩展的路径。从交通与城市研究角度看,该方法不仅提升了 OD 流预测能力,还能服务于城市形态、人类移动规律、空间异质性和模型迁移机制的分析。
未来工作主要包括四个方向:第一,从方法层面引入 meta-learning,adaptive learning,knowledge distillation 等技术,提升模型鲁棒性和迁移能力;第二,融合遥感数据与社会感知数据,弥补卫星影像缺少细粒度社会经济信息的不足;第三,将短期变量和人类流动自身周期性纳入动态流动建模;第四,在不同国家和不同地理尺度上开展跨区域实验,以进一步验证模型的泛化能力并获得新的城市流动认知。



期待你的
点赞
分享
喜欢
END
欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!
· 往期推荐
夜雨聆风