-
生物通官微
陪你抓住生命科技
跳动的脉搏
张亚平院士EJHG:利用GWAS解析Y染色体
【字体: 大 中 小 】 时间:2013年12月02日 来源:中科院
编辑推荐:
随着全基因组关联分析(genome-wide association analysis,GWAS)广泛应用于人类遗传学工作之中,相关的DNA芯片(微阵列)也不断得到发展。
随着全基因组关联分析(genome-wide association analysis,GWAS)广泛应用于人类遗传学工作之中,相关的DNA芯片(微阵列)也不断得到发展。许多Y染色体单核苷酸多态性位点(Y-SNPs)已被整合在DNA芯片中。然而,这些Y-SNPs数据在GWAS中都被弃之不顾,未进行任何评估分析。
针对这个问题,中国科学院昆明动物研究所彭旻晟、贺军栋、樊隆等研究人员在张亚平院士的带领下,开发出针对DNA芯片数据中Y-SNPs的分析策略。
运用该策略,研究人员对117份男性样本(来自114个缅甸人和3个尼日利亚人)DNA芯片数据中的2041个Y-SNPs进行了评估分析。基于数据过滤后提取出的369个Y-SNPs,研究人员构建了Y染色体单倍型类群树(Y chromosomal haplogroup tree),从而解析出缅甸人群的父系遗传结构。该结果得到基因分型实验和Y染色体重测序数据的支持,表明该策略切实可行。
对于分析中的数据格式转换、过滤以及注释,研究人员开发了免费软件YTool(http://mitotool.org/ytool/)。结合对HapMap中CEU人群数据的分析结果,研究人员发现DNA芯片对Y-SNPs的检测灵敏度和准确性依旧有待提高,例如芯片厂商可依据Y染色体重测序数据重新选择合适的Y-SNPs并设计相关探针。
相关论文于11月27日在线发表在国际刊物《欧洲人类遗传学》(European Journal of Human Genetics)。
原文摘要:
Retrieving Y chromosomal haplogroup trees using GWAS data
Phylogenetically informative Y chromosomal single-nucleotide polymorphisms (Y-SNPs) integrated in DNA chips have not been sufficiently explored in most genome-wide association studies (GWAS). Herein, we introduce a pipeline to retrieve Y-SNP data. We introduce the software YTool (http://mitotool.org/ytool/) to handle conversion, filtering, and annotation of the data. Genome-wide SNP data from populations in Myanmar are used to construct a haplogroup tree for 117 Y chromosomes based on 369 high-confidence Y-SNPs. Parallel genotyping and published resequencing data of Y chromosomes confirm the validity of our pipeline. We apply this strategy to the CEU HapMap data set and construct a haplogroup tree with 107 Y-SNPs from 39 individuals. The retrieved Y-SNPs can discern the parental genetic structure of populations. Given the massive quantity of data from GWAS, this method facilitates future investigations of Y chromosome diversity.