
-
生物通官微
陪你抓住生命科技
跳动的脉搏
肯尼亚人群法医遗传频率数据库的构建与线粒体基因组多样性分析
【字体: 大 中 小 】 时间:2025年07月31日 来源:Forensic Science International: Synergy CS4.9
编辑推荐:
为解决非洲人群在法医遗传频率数据库(FGFD)中代表性不足的问题,肯尼亚医学研究所团队建立了涵盖47个民族语言群体的法医生物样本库,收集893份样本并完成132例海岸地区线粒体全基因组测序。研究发现L3(50%)、L0(21.2%)等特征性单倍群分布,为完善YHRD、EMPOP和STRidER数据库提供符合伦理标准的非洲人群数据,对提升法医DNA证据的随机匹配概率(RMP)计算准确性具有重要意义。
在法医科学领域,DNA证据的统计权重高度依赖群体特异性遗传频率数据。然而当前三大国际法医遗传学会(ISFG)推荐的数据库——Y染色体单倍型参考数据库(YHRD)、EDNAP线粒体DNA群体数据库(EMPOP)和STRidER参考数据库中,非洲数据占比不足13%,且存在技术滞后(如EMPOP仍以线粒体高变区数据为主)和伦理合规性问题。这种数据鸿沟严重制约了非洲地区法医DNA证据的统计学效力,特别是在涉及随机匹配概率(RMP)计算时可能产生偏差。
针对这一现状,肯尼亚医学研究所(Kenya Medical Research Institute, KEMRI)的研究团队开展了开创性工作。通过建立首个符合国际伦理标准的肯尼亚法医生物样本库,该研究不仅系统收集了893份涵盖全国47个民族语言群体的样本(Bantu 60.8%、Nilotic 24.9%、Cushitic 14.3%),更利用新一代测序技术(NGS)完成了132例海岸地区线粒体全基因组数据,相关成果发表于《Forensic Science International: Synergy》。
研究采用多阶段技术路线:首先通过社区参与式方法获取广泛知情同意,使用COPANTM核酸卡保存口腔上皮细胞;随后采用Promega试剂盒和Maxwell?16系统进行DNA提取;针对海岸地区样本,设计16.5kb长片段PCR扩增后,利用Illumina MiSeq平台进行双端测序;最终通过CLC Genomics Workbench和AQME插件进行单倍群分析。
3.1 民族语言与地理分布
样本构成精确反映了肯尼亚人口结构,其中沿海班图人占比最高(32%),高原Nilotic占9.41%,索马里Cushitic占6.8%。这种均衡分布确保了数据集的群体代表性。
3.2 社会人口特征
参与者平均年龄41.9岁,87.7%接受过正规教育,73%有经济活动,性别比例均衡(男57%,女43%)。这些特征保障了知情同意的有效性,避免了经济诱导偏差。
3.3 海岸线粒体基因组多样性
发现57个独特单倍群,L3e3a频率最高(13.5%)。地理分布显示:Tana River郡L0优势(21.2%),Kwale郡L3占优(50%)。值得注意的是,毗邻坦桑尼亚的Taita Taveta郡检出罕见L0f单倍群(该型在坦桑尼亚以外罕见),而Bajuni人群全部聚类为L3d亚型,揭示出精细的民族遗传结构。
这项研究通过建立标准化生物样本库,为填补国际法医数据库的非洲空白提供了关键资源。其创新性体现在:首次系统记录肯尼亚海岸地区完整线粒体基因组多样性;发现L0f等具有地域特征的标记;开发出整合肯尼亚《2019年隐私和数据保护法》的生物样本管理系统。更重要的是,该资源支持未来Y-STR和常染色体STR数据生成,并可用于新技术的验证研究。正如作者强调,随着NGS技术在法医领域的普及,这类包含广泛伦理同意的生物样本库将成为平衡科学需求与伦理合规的重要枢纽,尤其对非洲这类长期数据边缘化区域具有示范意义。
生物通微信公众号
知名企业招聘