全球建筑轮廓数据(GBA)批量下载与应用实践
GlobalBuildingAtlas(GBA)是慕尼黑工业大学发布的全球尺度建筑轮廓矢量数据集,具有覆盖广、精度高、属性丰富等特点。本文介绍其数据组织方式,基于 Google Earth Engine(GEE)平台实现中东多国区域的批量自动化下载,并展示在 QGIS 中的可视化应用效果,为城市形态研究、建筑变化检测等工作提供参考。

GlobalBuildingAtlas(GBA)
一、数据介绍
GlobalBuildingAtlas(GBA)由德国慕尼黑工业大学(TUM)遥感与地理信息研究所发布,依托 So2Sat 项目构建,是目前覆盖范围最广的开源全球建筑轮廓数据集之一。数据以多源遥感影像为底层基础,融合深度学习语义分割与后处理精化技术,提取建筑物的平面轮廓、高度估算及数据来源标注等信息,适用于城市尺度至全球尺度的建筑分布与形态研究。
在数据组织方式上,GBA 以 5°×5° 经纬度格网为基本单元进行切分存储,每个 Tile 以其左上角和右下角经纬度联合命名,例如 e065_n35_e070_n30 对应东经 65°~70°、北纬 30°~35° 的区域。数据以 GeoJSON 格式存储,托管于 Google Earth Engine 公开数据目录(projects/sat-io/open-datasets/GLOBAL_BUILDING_ATLAS/),可通过 GEE JavaScript API 直接访问,无需额外注册权限,也无需 HuggingFace 等第三方平台的 Token 认证。
每个建筑要素均携带若干属性字段:source 记录轮廓数据的原始来源(OSM、Microsoft、Google 等),height 为深度学习模型估算的建筑高度(单位:米),var 表征高度估算的不确定性,region 标注所属地区编码。这些字段为后续的分层质检、精度评估以及三维建模提供了基础依据。
二、批量下载
针对中东、中亚等跨越多国、覆盖面积较大的区域,若逐国手动查找并下载对应 Tile,不仅效率低,还容易遗漏相邻区域的边界 Tile。为此,本文设计了一套基于 GEE 的自动化批量下载方案:首先根据各国研究范围的经纬度边界,按 5°×5° 格网规则自动计算覆盖的 Tile ID;由于相邻国家之间往往共享边界地带的同一 Tile,需对所有国家的 Tile 列表取并集并去重,确保每个 Tile 仅归属一个国家文件夹、只下载一次;最后在 GEE 代码编辑器中一次性提交全部导出任务,每个 Tile 单独导出为一个 GeoJSON 文件,按国家分文件夹存储至 Google Drive。

以覆盖伊朗、沙特阿拉伯、巴基斯坦、阿富汗等 18 个中东及中亚国家的下载任务为例,各国范围合并后共涉及原始 Tile 约 100 余个,经去重处理后得到 62 个唯一 Tile,分属 12 个国家文件夹。巴林、卡塔尔、科威特、塔吉克斯坦、约旦、伊拉克等面积较小的国家,其 Tile 与周边大国完全重叠,数据已并入相应大国的文件夹中,不产生额外的重复下载。

GEE批量下载
GEE 导出脚本的核心逻辑如下:通过预定义的国家—Tile 映射表,对每个 Tile 调用 Export.table.toDrive(),将文件名设为 Tile ID,文件夹名设为对应国家名称。脚本运行后,右侧 Tasks 面板会列出全部导出任务,状态依次经历 UNSUBMITTED → RUNNING → COMPLETED 三个阶段,并实时显示进度百分比。任务在 Google 服务器端异步执行,关闭浏览器不影响进度。
var BASE = 'projects/sat-io/open-datasets/GLOBAL_BUILDING_ATLAS/';var COUNTRY_TILES = {'伊朗': ['e040_n30_e045_n25', 'e040_n35_e045_n30', 'e040_n40_e045_n35','e045_n30_e050_n25', 'e045_n35_e050_n30', 'e045_n40_e050_n35','e050_n30_e055_n25', 'e050_n35_e055_n30', 'e050_n40_e055_n35','e055_n30_e060_n25', 'e055_n35_e060_n30', 'e055_n40_e060_n35','e060_n30_e065_n25', 'e060_n35_e065_n30', 'e060_n40_e065_n35'],'沙特阿拉伯': ['e030_n20_e035_n15', 'e030_n25_e035_n20', 'e030_n30_e035_n25', 'e030_n35_e035_n30','e035_n20_e040_n15', 'e035_n25_e040_n20', 'e035_n30_e040_n25', 'e035_n35_e040_n30','e040_n20_e045_n15', 'e040_n25_e045_n20', 'e045_n20_e050_n15', 'e045_n25_e050_n20'],// 其余国家 Tile 列表同理...};Object.keys(COUNTRY_TILES).forEach(function(country) {COUNTRY_TILES[country].forEach(function(tileId) {Export.table.toDrive({collection: ee.FeatureCollection(BASE + tileId),description: country + '__' + tileId,folder: 'GEE_GBA_' + country,fileNamePrefix: tileId,fileFormat: 'GeoJSON',});});});
需要注意的是,中东地区人口密集的核心城市 Tile 数据量较大。以伊朗为例,单个 Tile 导出后的 GeoJSON 文件体积可达 600 MB 至 2 GB 以上,建议在 Google Drive 存储空间充足的前提下分批运行,并确保本地磁盘预留足够空间。

Google Drive盘
三、数据应用
将下载完成的 GeoJSON 数据加载至 QGIS,叠合高分辨率卫星影像进行多尺度可视化验证,效果直观。在宏观尺度下,建筑斑块沿河谷走向和城镇聚落密集分布,清晰反映了阿富汗—巴基斯坦边境地带的人居空间格局,与山地地形及农业用地分布高度吻合。缩放至约 1:1,600 的城区尺度后,街区结构与建筑组团轮廓完整呈现,大型院落、道路边界均能准确识别。进一步放大至 1:3,000 左右的单体尺度,建筑平面轮廓的几何精度较高,与影像目视解译结果基本吻合,矩形建筑的边角及内院空间均得到较好还原。

在属性层面,每栋建筑的 source 字段清晰标注了数据来源。以陕西某地为例,大量建筑标注为 source=osm,表明该区域 OpenStreetMap 社区贡献覆盖较好;而在部分农村或边境地带,数据源可能切换为 Microsoft 或模型预测结果,质量相对参差,使用前建议据此进行分层抽检。height 字段则提供了建筑高度的量化估计,可直接用于建筑体量分析或 LoD1 三维模型的快速构建,尽管在缺乏精确 DSM 支撑的区域,高度估算的不确定性(var 字段)相对较高,需结合实际情况审慎使用。



陕西局部

数据属性
从应用场景来看,GBA 数据可在以下几个方向发挥重要作用。在城市形态研究中,基于轮廓面积、高度和密度等指标,可对不同国家和城市的建筑形态进行定量比较;在建筑变化检测中,将 GBA 与多期高分影像叠合,可快速圈定新增或消失建筑的区域,支撑城市扩张动态监测;在境外地形图制图中,GBA 轮廓数据可作为居民地图层的底层参考,有效弥补传统 DLG 数据更新周期长、境外获取难度大的不足;在灾害评估领域,建筑分布与高度信息也是地震易损性分析的重要输入参数。
当然,GBA 数据在实际应用中也存在一定局限性。不同地区的精度差异较为显著,欧美城市区域因有 Microsoft Building Footprints 等高质量底层数据支撑,整体精度优于中东及中亚的部分农村区域。此外,各区域的数据采集时间存在跨度,时效性参差不齐,在用于变化检测等对时相敏感的任务时,需额外关注数据的更新年份。







夜雨聆风