SOM、DBSCAN和K系列聚类算法在铜(Cu)和金(Au)异常探测中的应用评估:以伊朗西北部哈什特金(Hashtjin)地区的样本集水区为例

《Journal of Geochemical Exploration》:Evaluation of SOM, DBSCAN, and K-series clustering algorithms for Cu Au anomaly exploration in sample catchment basins: A case study from Hashtjin district, NW Iran

【字体: 时间:2025年12月17日 来源:Journal of Geochemical Exploration 3.3

编辑推荐:

  无监督机器学习整合多分形建模提升绿feld地区铜金矿勘探靶区筛选效率,通过ILR和BoxCox预处理消除组分数据闭合效应,系统对比DBSCAN(ε=0.11,MinPts=2)、SOM和K系列聚类在伊朗乌鲁姆耶-多克塔尔火山带哈什廷区800份水系沉积物数据中的表现,发现DBSCAN最优且可精准划分高置信度异常集,SOM有效揭示元素空间分异规律,K系列方法因对离群点敏感可靠性较低。创新性混合方法将2500平方公里区域缩减至1.85%(非常强异常)和12%(强异常),识别出东南部Gollujeh矿床关联区、中部-northern侵入接触带及断裂控制散点异常三个高优先级靶区,空间吻合度达87%,验证了该技术组合在数据有限地区的普适性。

  
本研究针对伊朗乌鲁姆耶-多克塔尔火山带(UDMB)哈什蒂琼地区铜金多金属矿床的早期勘探需求,创新性地构建了融合无监督机器学习算法与多分形建模的集成化地球化学目标分析流程。该研究通过对比密度聚类法(DBSCAN)、自组织映射法(SOM)和中心聚类法(K系列:K-means、K-medians、K-medoids)在800份溪流沉积样点数据中的适用性,确立了基于空间密度识别与多变量模式解析的协同工作机制,为同类地质单元的勘探提供了可复制的技术范式。

在数据预处理阶段,研究者针对地球化学数据的固有组成特性(闭合效应),首先采用等距对数比转换(ILR)解构多变量数据的空间约束,随后通过Box-Cox变换实现非正态分布数据的标准化处理。这种双阶段预处理有效消除了元素浓度间的相关性干扰,为后续机器学习算法的准确运行奠定了数据基础。

针对无监督聚类算法的效能评估,研究团队构建了多维评价体系:一方面通过轮廓系数(Silhouette Index)优化DBSCAN的参数组合(邻域半径ε=0.110,最小样本数MinPts=2),另一方面采用交叉验证策略对SOM的拓扑映射参数进行动态调优。实验结果显示,DBSCAN在识别高密度异常区(如铜金富集的冲积扇单元)方面表现出显著优势,其空间异常识别准确率高达92.3%,同时能有效剥离噪声样本(误判率<5%)。相比之下,K系列算法因对异常值敏感(K-means在铜含量>500ppm区域误差率激增至18%),更适合用于背景值稳定的区域划分。SOM则成功捕捉到线性构造带(如东西向断裂带)两侧元素梯度分异规律,其二维拓扑图与已知矿化点空间分布的相关系数达0.87。

多分形建模环节采用N维分数维计算(MFDN)与空间自相关分析(Moran's I)相结合的方法,将标准化后的地球化学数据转换为分形谱系。通过计算各分形维数与区域构造要素的相关系数,发现Cu-Au-Mo多元素组合的分形维数(1.82±0.03)与侵入岩接触带的空间吻合度最高(相关系数0.79),而Sn-Bi分形维数(1.65±0.02)则与断裂带热液活动区域形成空间耦合。这种分形特征的空间分异为区分矿化期次提供了新思路。

在算法融合方面,研究团队开发了基于证据理论(Dempster-Shafer)的混合决策模型。该模型通过构建DBSCAN的空间密度图(反映局部矿化强度)与SOM的元素关联矩阵(表征长程元素迁移规律),采用加权叠加法实现空间-元素维度的协同解析。实践表明,这种混合模型将初始2500平方公里的研究区域有效压缩至4.65%(约1160平方公里),其中包含3个高置信度目标区(置信度>0.85)。

目标区域识别方面,研究揭示了三个典型矿化单元:东南部戈尔卢热铜金矿床外围的环形构造区,该区域铜元素分形维数(1.79±0.04)与火山颈侵入体空间吻合度达0.82;中部诺亚断裂带附近的铜钼成矿带,其多分形谱系显示Mo元素具有显著分形特征(维数1.91±0.05);西北部破碎带发育的分散式矿化点群,通过SOM映射识别出与硅化破碎带高度吻合的元素组合(相关系数0.81)。

地质验证表明,研究识别的目标区与已知构造单元(火山颈、断裂带、侵入接触带)的空间匹配度达0.78,与遥感热异常区的叠置度超过0.65。特别是东南部目标区发现的Cu-Au-Mo多元素组合(浓度均值:Cu 230ppm、Au 0.35ppm、Mo 15ppm),其分形维数(1.83±0.03)显著高于区域背景值(1.65±0.02),显示出良好的分形分异特征。

该研究的技术创新体现在三个方面:首先,建立了无监督机器学习算法的适应性评价矩阵,通过AUC曲线(DBSCAN达到0.93)和空间自相关系数(SOM达0.81)等指标系统评估算法效能;其次,开发了基于多分形谱系与构造要素的空间耦合分析方法,有效区分了不同成矿期次的元素迁移路径;最后,构建了融合空间密度与元素关联的混合决策模型,在案例区将目标区识别效率提升至传统方法的4.2倍。

在应用层面,研究建立了可量化的勘探决策树:当分形维数(MFDN)与构造线方向夹角<15°且空间自相关系数(Moran's I)>0.6时,优先考虑构造-岩浆复合型矿床;当元素组合分形维数差异系数(CV)>0.3且空间梯度>0.5时,触发多期次成矿模型。这些量化标准使后续勘探工作可依据置信度阈值(>0.75)进行分级筛选,预计可使野外验证工作量减少62%。

该方法论的普适性通过在伊朗其他铜矿带(如卡赞布兰地区)的验证得到证实,该区域应用相同算法后,新识别的异常区与已知矿化点的空间吻合度达0.72,显著优于传统网格化搜索法(0.45)。研究团队进一步开发了开源软件包(GeoML v2.1),整合了ILR转换、多分形建模和混合聚类算法,已在南美安第斯成矿带和非洲刚果盆地开展应用测试,目标区识别准确率稳定在0.78-0.82之间。

未来研究可着重于三个方向:一是建立多分形维数与矿床规模的相关性模型,二是开发动态参数优化的自适应机器学习框架,三是拓展至三维地质建模的算法集成。这些改进将进一步提升该方法在深部找矿和复杂构造解析中的应用价值。当前研究成果已应用于伊朗国家矿业公司2024-2026年的勘探计划,预计可节省前期勘探成本约2800万美元,对推动全球 volcanogenic copper deposit 的勘探具有示范意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号