基因、贝壳与人工智能:基于计算机视觉揭示笠贝遗传种群间隐性形态分化的新方法

《Scientific Reports》:Genes, shells, and AI: using computer vision to detect cryptic morphological divergence between genetically distinct populations of limpets

【字体: 时间:2025年12月13日 来源:Scientific Reports 3.9

编辑推荐:

  本刊推荐:针对遗传分化种群间形态差异难以识别的问题,研究人员开展了利用计算机视觉(CV)和可解释人工智能(XAI)技术检测笠贝隐性形态分化的主题研究。结果表明,经过微调的卷积神经网络能够以高达0.96的F1分数准确分类个体至其遗传支系,并通过显着性图成功揭示了关键孔(Fissurella volcano)和脊尖(Lottia conus)等关键鉴别特征。该研究为揭示隐性生物多样性提供了可扩展、可重复的技术路径,对完善生态进化研究和保护实践具有重要意义。

  
在生态学和进化生物学研究中,准确识别物种内部分化是理解生物多样性形成与维持机制的核心。然而,自然界中普遍存在“隐性分化”现象——遗传上截然不同的类群在形态上却难以区分。这种形态停滞给生物多样性评估、物种保护及进化机制研究带来了巨大挑战。传统上,研究人员高度依赖分子标记来识别这些隐性类群,但这种方法无法揭示其潜在的形态差异,限制了对基因型-表型互作关系的深入理解。针对这一瓶颈问题,Jack D. Hollister等研究者在《Scientific Reports》上发表了一项创新性研究,探索如何利用前沿的人工智能技术,特别是计算机视觉(Computer Vision, CV)和可解释人工智能(Explainable Artificial Intelligence, XAI),来揭示笠贝(limpets)遗传种群间那些逃过人类眼睛的细微形态差异。
研究人员选取了来自下加利福尼亚和加利福尼亚海岸的四种笠贝作为模型:Fissurella volcano、Lottia conus、Lottia gigantea 和 Lottia strigatella。这些物种先前的研究已通过线粒体CO1标记或全基因组SNP(Single Nucleotide Polymorphism)分析确定了其存在明显的系统地理学间断,形成了南北两个遗传支系(clade),但缺乏公认的形态鉴别特征。研究团队构建了一个包含大量标本(例如L. strigatella达789个)的高清图像数据集,这些图像在标准化条件下拍摄并进行了焦点堆栈处理以确保质量。
为开展研究,作者主要应用了几项关键技术:1. 利用基于VGG16架构的卷积神经网络(Convolutional Neural Network, CNN)进行图像分类,并通过100次重采样迭代训练和评估模型稳健性;2. 设立混合组对照模型以验证模型学习到的是真实的支系特异性信号而非虚假关联;3. 应用SmoothGrad显着性图(saliency maps)技术可视化CNN进行分类决策时所关注的关键图像区域;4. 结合YOLOv8和Segment Anything模型(SAM)进行实例分割和掩码为基础的形状分析,量化了包括圆形度(Circularity)、偏心率(Eccentricity)、实度(Solidity)、范围(Extent)和短轴长度(Minor-axis length)在内的形态指标。标本来源包括野外采集和洛杉矶县自然历史博物馆(LACM)的馆藏。
模型F1-score分析
研究结果显示,基于支系的分类模型在均衡测试集(Even-test)上的表现显著优于混合组对照模型。其中,L. strigatella(背侧视角中位数F1-score达0.963)和F. volcano(腹侧视角中位数F1-score达0.925)的分类准确率最高,而L. gigantea的分类性能相对较低(背侧视角中位数F1-score为0.575)。混合组模型的性能则接近随机猜测水平(F1-score ≈ 0.5),证实了CNN确实捕捉到了支系特异性的形态特征。
F. volcano形态变异
显着性图一致地将F. volcano的鉴别关键区域指向其壳顶的钥匙孔(keyhole)。随后的形状分析证实,南北支系在钥匙孔的圆形度、偏心率、实度、范围和短轴长度上均存在极显著差异。北部支系的钥匙孔形状更不规则、更狭长、凹陷更深,而南部支系的钥匙孔则更接近椭圆形。Karcher-mean(卡赫均值)形状对比进一步强化了这一发现。当仅使用钥匙孔区域图像进行分类时,模型性能(F1-score)下降至约0.70,说明钥匙孔是主要但非唯一的鉴别特征。
L. conus形态变异
对于L. conus,显着性图聚焦于贝壳远端的脊尖(ridge tips)。全壳形状分析表明,北部支系的贝壳轮廓更不规则、实度更低、范围值更小,表明其轮廓具有更深的凹陷。
L. gigantea和L. strigatella形态变异
对于L. gigantea和L. strigatella,显着性图的关注点较为分散,多沿贝壳周缘分布。形状分析仍检测到了支系间的显著差异:L. gigantea的南北支系在偏心率和短轴长度上不同;L. strigatella的南北支系则在圆形度、范围和短轴长度上存在分化。L. strigatella模型极高的分类性能暗示可能存在除几何形状外(如颜色带或表面纹路)的鉴别线索。
研究表明,计算机视觉与可解释人工智能的结合,为探测和量化隐性形态多样性提供了强大、可扩展且可重复的研究范式。该工作流程的成功应用,证实了在遗传分化的笠贝支系间确实存在此前未被注意的、细微但一致的形态差异。显着性图有效地指引研究人员关注到具有生物学意义的鉴别特征(如钥匙孔和脊尖),从而实现了从“黑箱”预测到可解释形态特征发现的跨越。L. gigantea相对较低的分类性能可能与其种群分化历史较短有关,这提示形态分化程度可能与遗传分化的时间深度相关。尽管研究揭示了形态差异,但其适应性驱动因素(是遗传差异还是表型可塑性所致)尚不明确,有待未来研究。该研究方法可推广至任何具有二维平面形态特征的生物类群(如昆虫翅膀、植物标本、微体化石等),对于充分利用正在大规模数字化的自然历史馆藏资源、深化生物多样性认知和指导保护实践具有重要价值。总之,这项研究显著提升了我们发现和理解自然界中隐性多样性的能力,为生态进化研究提供了新的强大工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号