研究进展

【SDG中心“两计划一基金”项目系列成果(二十二)】 露天矿高分辨率精细解译制图方面取得进展

发布时间:2025-05-09

    近期,可持续发展大数据国际研究中心(SDG中心)开放研究计划——CBAS卓越科学家项目(CBAS2023ORP03)在露天矿精细分类研究方面取得重要进展,构建了基于多分支全局局部特征和高分辨率数据集的湖北露天矿精细解译制图,成果发表于遥感期刊International Journal of Applied Earth Observation and Geoinformation。该工作由中国地质大学(武汉)王力哲团队完成,博士生张欣羽为第一作者。

1. 论文摘要

    作为近年来地质环境评估的重要组成部分,矿区解译在可持续发展领域引起了广泛关注。露天矿(OP)作为一种可通过多光谱影像进行遥感捕获的对象,具有分布不规则、形状多样、纹理和颜色各异的特点,这使得解译具有挑战性并限制了OP矿区制图的准确性。此外,计算机视觉技术的发展使得高效快速的解译成为可能。然而,目前缺乏针对OP矿区的开放语义分割数据集。本文介绍了位于湖北西部成矿带的OP矿区数据集(DOWHM),用于OP矿元素解译。DOWHM包含中国湖北省24个活跃的OP矿区,总计1875幅分辨率为0.6米的卫星图像。其次,本研究设计了一种ConvFormer模型,用于OP矿区的精细分类和制图。ConvFormer模型采用了一个大卷积核的编码器,其解码器采用多分支方法,集成了卷积神经网络(CNN)和自注意力机制的模块。通过这种方式,ConvFormer有效捕捉全球和局部信息,解决了预测结果中元素误分类的问题,特别在道路分类中具有优势。在实验中,ConvFormer在DOWHM上的mIoU达到了68.18%。与其他流行的语义分割模型相比,ConvFormer的整体mIoU提高了2%,在OP矿区的精细分类中具有优势,并可应用于整个矿区的制图。

1 DOWHM内OP矿区的具体分布位置


2. 研究方法

    在本研究中,本研究对位于中国湖北省西部宜昌市和宜都市附近的24个活跃露天矿进行了实验。这一地区因其丰富的矿产资源而重要,归因于其独特的地质条件,跨越主要构造单元。图 1展示了本研究的研究区分布以及数据集的种类划分依据。露天矿作业包括多个关键阶段,包括穿孔、爆破、采矿、装载、运输和排土。为了捕捉矿区环境的复杂特征,本研究利用了来自DOWHM数据集的高分辨率卫星图像,该数据集提供0.6米分辨率的数据。本研究采用改进的ConvFormer模型对这些矿区内的元素进行分类和制图,模型的整体架构由图 2所示。ConvFormer架构包括一个大卷积核的编码器和一个多分支解码器,集成了卷积神经网络(CNN)和自注意力机制。这一设计使得模型能够有效捕捉局部和全局信息,解决元素误分类等挑战。为了验证本研究的解译方法,本研究确保选择多样化的OP矿区,专注于描绘单个矿区的图像,以减轻类间不平衡问题。分割任务的最终输出通过一系列卷积层、批量归一化和激活函数生成,最后通过分类层得出。本研究采用均值交并比(mIoU)作为评估指标,评估ConvFormer模型的性能,通过计算不同类别中预测值与真实值的交集和并集的均值来评估分割准确性。

2 ConvFormer的整体框架


03 研究结果

    ConvFormer模型与其他深度学习(DL)模型的综合评估,同时分析了DOWHM数据集的解码性能。本研究使用多种模型进行了比较实验,随后进行了消融研究,以评估ConvFormer中不同模块的贡献。在单个NVIDIA GTX 3090 GPU上采用PyTorch框架实施,数据集随机分割,80%用于训练,20%用于测试,每个模型训练120个epochs。在表 1中,消融研究表明,尽管ResNet18编码器提供了更高的速度,但ConvNeXt编码器的准确性提升了2%。值得注意的是,当使用ConvNeXt时,CNN与VHA模块的组合达到了最高的mIoU值68.18%。图 3展示了与ResNet18相比,ConvFormer减少了误分类,尤其在边缘分割的连续性和准确性上有了改善。

1 ConvFormer的消融实验

3 conformer中不同模块预测结果的比较

    此外,本研究将DOWHM与其他数据集进行了比较,如表 2所示。尽管卫星图像普遍存在低分辨率的问题,但本研究的高分辨率图像(0.6米)有效应对了与开放式矿场环境相关的细分类任务。未来的计划包括扩展数据集,以涵盖更多具有代表性的湖北省露天矿山的案例。

2 DOWHM和其他数据集的对比

    最后,如表 3所示,ConvFormer的mIoU达到了68.18%,在多个经典模型中名列前茅。尽管Segformer在特定类别上表现更佳,但ConvFormer在整体准确性和适度参数规模上表现出色,确认了其在开放式矿场细分类任务中的有效性。本研究计划进一步提高ConvFormer的效率,并将其应用于更大规模的映射工作。

图 4两个OP矿区的填图结果

3 ConvFormer和其他模型的精度对比

04 结论

    露天矿区的语义分割任务在评估地质环境方面具有重要意义,尽管现有研究主要集中在矿区的环境监测和灾害预测上,但对内部及邻近环境的探索却相对缺乏。由于矿区内的每个元素都是开放式矿山地质分析的重点,它们在后续管理阶段中发挥着至关重要的作用。关于开放式矿区的全面研究和详细解释的文献稀缺,同时也缺乏相应的语义分割数据集。本研究提出了DOWHM,为湖北省的研究区域和开放式矿区提供了重要信息。此外,开发了结合CNN和Transformer的ConvFormer模型。与近期模型的比较分析表明,当数据量充足时,ConvFormer在开放式矿区的分割性能优于其他模型,减少了不同特征类别的误分类。ConvNeXt模块在编码器中的应用有效缓解了常见的分割模型问题。此外,将VHA模块纳入ConvFormer的多分支解码器,进一步增强了开放式矿区内道路和矿区等类别的边缘分割效果。

【文章链接】

https://doi.org/10.1016/j.jag.2024.104111

【相关研究】

Zhang, Xinyu, Yunliang Chen, Wei Han, Xiaodao Chen, and Sheng Wang. "Fine mapping of Hubei open pit mines via a multi-branch global–local-feature-based ConvFormer and a high-resolution benchmark." International Journal of Applied Earth Observation and Geoinformation 133 (2024): 104111.

代码和数据集:https://github.com/zxy1211/DOWHM.


附件下载: