乐于分享
好东西不私藏

[文献精读] 利用地质统计和集成人工智能工具对地下水水质与水量进行时空评估

[文献精读] 利用地质统计和集成人工智能工具对地下水水质与水量进行时空评估

点击上方蓝字关注我们

利用地质统计和集成人工智能工具对地下水水质与水量进行时空评估

Spatiotemporal assessment of groundwater quality and quantity using geostatistical and ensemble artificial intelligence tools

作者

Vahid Nourani, Amirreza Ghaffari, Nazanin Behfar, Ehsan Foroumandi, Ali Zeinali, Chang-Qing Ke, Adarsh Sankaran

发表单位

大不里士大学

近东大学

查尔斯达尔文大学

阿拉巴马大学

南京大学

TKM工程学院

期刊

Journal of Environmental Management(JCR Q1/中科院1区,IF=8.0)

DOI

https://doi.org/10.1016/j.jenvman.2024.120495

方法模块

这篇文章的方法分三步走。第一步是地质统计插值:用普通克里金对地下水深度、水质指数(GWQI)、降水和温度等地面观测数据进行空间插值填补数据空白并生成连续的空间分布图,同时用RMSSE评价半变异函数模型的预测性能。第二步是时空分析:结合GRACE卫星的陆地水储量异常(TWSA)数据分析地下水储量的长期变化趋势,再结合Landsat 8的NDVI和SRTM的DEM等遥感数据进行地下水深度和水质的时空格局分析。第三步是AI建模与集成:分别用前馈神经网络(FFNN)、自适应神经模糊推理系统(ANFIS)支持向量回归(SVR)三个模型,以地下水深度、温度、降水、NDVI和DEM为输入变量GWQI为目标变量,预测湿季(6月)和干季(10月)的地下水水质。最后训练一个额外的FFNN作为集成单元非线性组合三个单模型的输出,提升预测精度。评估指标包括R²、RMSE、MAE和NSE。

笔者的思考

这篇文章的思路是用物理参数替代化学参数来预测地下水水质,这个出发点很实用——化学分析成本高、周期长,而地下水深度、温度、降水、NDVI这些物理量要么有现成遥感产品,要么有气象站数据,获取成本低得多集成学习的策略也值得注意:不是简单的加权平均,而是用一个额外的FFNN来非线性融合三个模型的输出,干季精度提升了12%,说明在单模型表现较差的条件下集成的增益更明显。不过从方法创新性来看,FFNN、ANFIS、SVR这些都是比较经典的模型,克里金也是标准工具,亮点更多在于应用层面的整合——把GRACE卫星数据、地统计分析和AI建模串成一条完整的分析链,应用于伊朗半干旱区的地下水管理问题。如果你做地下水或水质相关的研究,这篇文章的数据整合思路和集成建模框架可以参考,但方法上的突破空间还比较大。

摘要

本研究利用地统计和AI工具探讨了地表水文变量与地下水水质/水量之间的时空关系。开发了AI模型,利用地面观测和遥感影像估算地下水水质,减少对实验室检测的依赖。采用不同的克里金技术对地面观测数据进行制图并填补数据缺口。该方法被应用于分析伊朗西北部的马拉盖含水层,揭示了由于工业排放和过度开采导致的地下水水质下降。时空分析表明地下水深度/水质与降水和温度之间存在关联。所有变量的均方根标准化误差(RMSSE)值在0.8508至1.1688之间,表明半变异函数模型在预测变量方面具有可接受的性能。三种AI模型——前馈神经网络(FFNN)、支持向量回归(SVR)和自适应神经模糊推理系统(ANFIS)——使用地下水深度、温度、降水、归一化差异植被指数(NDVI)和数字高程模型(DEM)等输入变量,以地下水水质指数(GWQI)为目标变量,预测湿季(6月)和干季(10月)的地下水水质。采用集成方法组合这些模型的输出以提升性能。结果显示出强大的预测能力,湿季和干季的决定系数分别为0.88和0.84。集成模型将湿季和干季的性能分别提升了约6%和12%,有望推动未来地下水水质建模的发展。

引言

中东地区(伊朗所在地)以干旱区为主。地下水资源是干旱或半干旱地区至关重要的供水来源,满足消耗性和非消耗性的重大用水需求。然而,对地下水的依赖可能导致水质和水量方面的挑战。近年来遥感方法的进步对此类地区的水文研究具有重要价值。MODIS、Landsat和GRACE等卫星已被广泛用于收集水文数据。GRACE卫星提供的陆地水储量异常(TWSA)信息尤其革新了水资源研究,为全球范围内评估地下水储量变化提供了前所未有的机遇。

地下水污染源于全球多种因素。在欧洲,农业实践将农药引入地下水。在美国,特别是来自化肥的硝酸盐农业径流导致了广泛污染。伊朗乌尔米亚湖盆地面临严重的地下水水质挑战,包括盐分积聚和农业污染。这些案例凸显了地下水水质问题的全球规模,强调了有效的污染减少策略和监管行动的必要性。

水质退化是21世纪最紧迫的问题之一。城市化、工业发展、农村基础设施不足和集约化农业实践已成为全球地下水水质退化的重要驱动因素。水质指数(WQI)方法用于评估水质,但面临模型模糊性、遮蔽效应、不确定性等局限。传统的水质评估方法通常需要大量的实验室化学分析,成本高昂且耗时。因此,利用易于获取的物理参数和遥感数据来预测地下水水质具有重要的实际意义。

近年来,人工智能方法在水资源领域得到广泛应用。前馈神经网络(FFNN)、自适应神经模糊推理系统(ANFIS)和支持向量回归(SVR)等模型已被用于水质预测。集成学习通过结合多个模型的优势可以提供更准确的预测。然而,将地统计方法、遥感数据和AI建模整合用于地下水水质评估的研究仍相对有限。

本研究的主要目标包括:(1)利用GRACE卫星TWSA数据分析研究区地下水储量的长期变化趋势;(2)应用克里金方法对地下水深度、水质和气象变量进行空间插值;(3)对地下水深度和水质进行时空分析;(4)开发FFNN、ANFIS和SVR三种AI模型及其集成模型,利用物理参数预测地下水水质。

材料与方法

研究区与数据

马拉盖盆地位于伊朗西北部,地理坐标37°24′-37°44′N、45°57′-46°45′E(如Figure 1所示)。马拉盖含水层属于乌尔米亚湖流域,面积188.41平方公里。该区域主要河流为苏菲柴河,发源于萨汉德山脉南坡。2013-2020年马拉盖站的数据显示年均降水量352.1 mm,年均温12.95°C。盆地总面积1096.1平方公里,其中平原(冲积区)223平方公里,山区873.1平方公里。该盆地位于半干旱区,主要为农业区,地表水和地下水均用于灌溉和生活用途。近年来该地区面临环境挑战,包括卡维赫碳酸钠工厂污水池破裂事件及随后向下游天然渠道排放盐碱废水。

本研究使用了多种数据源:地下水深度和水质数据来自东阿塞拜疆省区域水务公司的观测井和开采井(如Figure 3所示);遥感数据包括GRACE卫星的TWSA(200 km分辨率)、Landsat 8 OLI的NDVI(30 m分辨率)和SRTM的DEM(30 m分辨率);气象数据来自研究区内的气象站。

方法框架

Figure 4展示了本研究的方法流程。研究整合了遥感数据和地面观测数据,首先分析研究区的GRACE TWSA时间序列。然后计算地下水水质指数(GWQI),基于Na⁺、K⁺、Mg²⁺、Ca²⁺、Cl⁻、SO₄²⁻、HCO₃⁻、EC、TDS、TH和pH等11个水质参数,参照WHO等组织的饮用水标准,通过相对权重和质量评级量表计算综合水质指数。

地质统计分析

采用克里金方法对空间数据进行插值。克里金是一种地统计插值技术,通过对已知位置的测量值进行加权平均来估算未测量位置的值,权重由空间相关结构(半变异函数)确定。本研究评估了多种半变异函数模型(球形、指数、高斯等),选择最佳的变异函数-克里金组合(如Figure 3所示)。交叉验证用于评估预测的准确性,使用平均误差(ME)和均方根标准化误差(RMSSE)作为评价指标。

AI模型

前馈神经网络(FFNN)

包含输入层、一个或多个隐藏层和输出层,使用反向传播算法训练。自适应神经模糊推理系统(ANFIS):结合了模糊推理系统和神经网络的优势,具有五层架构。支持向量回归(SVR):基于统计学习理论,使用核函数将输入数据映射到高维特征空间进行回归。

集成单元(如Figure 5所示)

训练一个额外的FFNN作为集成单元,接收三个单模型的输出作为输入,非线性组合它们的预测结果,以克服单模型的固有局限,提高总体预测精度。

结果与讨论

GRACE数据分析

GRACE TWSA时间序列分析(如Figure 6所示)揭示了研究区水储量的长期变化趋势。2003至2022年间,马拉盖含水层的TWSA呈现下降趋势,表明地下水资源面临日益增大的压力。TWSA数据显示明显的季节性波动,与降水模式密切相关。

地质统计建模结果

所有变量的RMSSE值在0.8508至1.1688之间,表明半变异函数模型具有可接受的预测性能。ME值在0.0037至0.6724之间,提供了预测值与观测值之间偏差的定量度量。

地下水深度的时空分析

Figure 7展示了2013-2020年6月(湿季)和10月(干季)的地下水深度克里金插值图。初步分析揭示了2013至2020年间含水层可用地下水资源面临日益增大的压力。分析显示地下水深度存在显著的季节性变化:湿季对应地下水深度减小(补给过程),干季则因开采增加和补给减少导致地下水深度增大。

地下水水质的时空分析

Figure 9展示了2013-2020年6月和10月的GWQI克里金插值图。分析揭示了地下水水质沿地下水流向(从补给区向出口方向)呈现可辨识的下降趋势。这种空间趋势部分归因于地下水的停留时间,水质沿南部和西南方向逐渐下降。Figure 10展示了含水层内地下水流向。Figure 11显示含水层厚度及其与水质的关系。降水从西北向东南方向呈减少趋势(如Figure 13所示)。温度分析显示东部和东北部地区温度较高(如Figure 14所示)。NDVI图像反映了2013-2020年间植被覆盖的时空变化(如Figure 15所示)。

AI建模结果

三种AI模型及其集成模型的性能评估显示出强大的预测能力。湿季测试阶段,集成模型的R²达到0.88,干季达到0.84。集成技术显著增强了单模型的性能,湿季和干季分别提升约6%和12%。干季R²的提升更为显著,突显了集成技术在增强较弱建模效果方面的功效。单个建模方法可能因固有优缺点而出现过估或低估,而集成模型通过利用各方法的独特优势,趋于提供更准确的预测。

结论

地质统计和AI方法的整合已被证明在分析马拉盖含水层这一半干旱区地下水深度和水质的时空波动方面是有效的。利用克里金方法,地统计技术被巧妙地用于插值空间数据缺口,通过预测建模实现了对研究结果的全面理解。时空分析揭示了各环境变量之间的强相关性。初步发现表明2013至2020年间含水层可用地下水资源面临日益增大的压力。此外,分析揭示了评估期间地下水深度的显著季节性变化。湿季对应地下水深度减小(补给过程),干季因开采增加和补给减少导致地下水深度增大。此外,研究揭示了地下水水质沿补给区向出口方向(沿地下水流向)呈可辨识的下降趋势,部分归因于地下水停留时间,水质沿南部和西南方向下降。

在后续阶段,三种不同的AI方法及其集成模型被训练用于估算马拉盖含水层湿季和干季的地下水水质,使用物理变量替代化学变量。集成模型通过训练额外的FFNN来非线性组合单个FFNN、ANFIS和SVR模型的输出。该AI框架有望利用五个输入变量预测未来时期的水质。地下水水质建模结果展示了强大的预测能力,湿季和干季的R²分别为0.88和0.84。集成技术显著提升了单模型性能,湿季和干季分别改善约6%和12%。

最后,本研究引入了一种利用人工智能技术、使用物理参数而非化学参数的高效方法,以更低成本有效实施可持续地下水管理策略。研究的局限性包括地统计模型的线性假设可能无法完全捕捉底层现象的非线性特征,对历史数据的依赖可能不涵盖水质指标的完整波动范围,以及为特定区域校准的模型在其他地方可能表现不佳。未来研究应探索在其他含水层进行类似调查,纳入气候变化考量以增强建模精度,以及通过动态自适应选择单个AI模型输出来改进集成模型性能。