提高基因组作图准确性的新方法

【字体: 时间:2015年12月31日 来源:生物通

编辑推荐:

  最近,美国明尼苏达大学和BioNano Genomics的研究人员,采用动态的时间序列数据,来测量概率分布或者有多少遗传物质分开两个标签——根据链是否被拉伸或压缩,来改进一种纳米通道为基础的基因组作图。研究结果发表在本周《Biomicrofluidics》杂志。

  

生物通报道:如果你已经有了一种生物的基因组序列图,但想要在一个样本中寻找结构异常,你可以检查基因组条形码(barcode)——已知的靶向位点之间的一系列距离,通过切割这些位点上的DNA序列,并检测切口之间的距离。然而,如果通过新一代测序(涉及PCR)得到的原始图,包含任何放大的偏差,研究当中的系统性错误还有改进的余地。为了解决这个问题,美国明尼苏达大学和BioNano Genomics的研究人员,采用动态的时间序列数据,来测量概率分布或者有多少遗传物质分开两个标签——根据链是否被拉伸或压缩,来改进一种纳米通道为基础的基因组作图。延伸阅读:新一代测序在农业领域大放光彩[创新技巧]

这项研究的通讯作者、明尼苏达大学科学与工程学院的Kevin Dorfman教授称:“想象一下,在DNA骨架上的两个标签,通过一段弹簧连接在一起,这段弹簧模拟它们之间的DNA的构型熵。如果这是一种谐波弹簧…那么,我们希望看到关于弹簧长度其余部分的正反置换的均等机率。”

但是,除了这个正常的曲线,Dorfman和他的同事们观察到了比标签之间延伸更大的压缩,并发现,标签之间的大多数热波动是短暂的事件,这些信息可能有助于提高基因组作图的精度。

Dorfman说:“这种改善对于复杂的样品(如肿瘤)尤其重要,这种样品内的细胞是异质的,所以我们需要很高的精确度,找到罕见的事件。”

过去三年里,在国家卫生部和国家科学基金会资助机构的资助支持下,Dorfman和他的实验室一直与BioNano Genomics的同事合作。他和他的同事们在本周《Biomicrofluidics》杂志详细描述了这项研究工作。

用传统的脉冲场凝胶电泳方法——通过用限制性内切酶切割DNA序列来构建基因组图谱,研究人员所面临的一个问题是,基因组图谱的重新组装,因为常规方法根据各种片段的大小对它们进行分类。然而,在纳米通道方法中,荧光标记有序地停留在在每条链上。这让研究人员能够根据它们的荧光条形码确定整条链的内容,而无需重新组装它们——不用依赖先前获得的作图。

结合、洗涤、洗脱三步轻松搞定DNA分离纯化,了解详情与报价>> >>

研究人员首先标记DNA,这包括从大肠杆菌细胞中提取基因组DNA,在不同的靶位点上除去一个单一的核苷酸和骨干,并在它们的部位插入荧光核苷酸。每一条DNA链,通常约为300000个碱基对,然后注入45纳米宽的通道。因为DNA的弯曲长度,迫使分子拉伸,它仍然以一种棒状的、可量化的方式移动,大约50纳米。

然后,他们使用数码相机拍摄了标签的位置。而对纳米通道中的DNA进行的典型单分子研究,报告了几十个分子的统计,研究人员的方法涉及到成千上万各分子,每个分子都覆盖一系列标签——从而产生了数以百万计的标签之间的距离测量,这对于确定概率分布是必不可少的。

Dorfman及其同事们今后的工作包括,将这些分布输入到基因组作图算法中。这可以用来将点值图的一段特定序列,分配到基因组的一个特定区域,也有助于理解基因组图上拉伸DNA的结头、褶皱和环结的影响。

(生物通:王英)

生物通推荐原文摘要:
Measurements of DNA barcode label separations in nanochannels from time-series data
Abstract: We analyzedtime-series data for fluctuations of intramolecular segments of barcoded E. coligenomicDNA molecules confined in nanochannels with sizes near the persistence length of DNA. These dynamic data allowed us to measure the probability distribution governing the distance between labels on the DNA backbone, which is a key input into the alignment methods used for genome mapping in nanochannels. Importantly, this dynamic method does not require alignment of the barcode to the reference genome, thereby removing a source of potential systematic error in a previous study of this type. The results thus obtained support previous evidence for a left-skewed probability density for the distance between labels, albeit at a lower magnitude of skewness. We further show that the majority of large fluctuations between labels are short-lived events, which sheds further light upon the success of the linearized DNAgenome mapping technique. This time-resolved data analysis will improve existing genome map alignment algorithms, and the overall idea of using dynamic data could potentially improve the accuracy of genome mapping, especially for complex heterogeneous samples such as cancer cells.

 

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号