从微阵列数据发现癌症相关基因的新分析法

【字体: 时间:2014年05月05日 来源:生物通

编辑推荐:

  日前,美国德克萨斯大学和达特茅斯学院的研究人员开发出一种识别癌症基因的新型基因表达分析方法。相关研究结果以“How to get the most from microarray data: advice from reverse genomics”为题发表在2014年3月21日的《BMC Genomics》杂志。研究结果向当前的微阵列数据分析范式发出了挑战,表明这种新方法能够提高对癌症相关基因的识别能力。

  

生物通报道:日前,美国德克萨斯大学和达特茅斯学院的研究人员开发出一种识别癌症基因的新型基因表达分析方法。相关研究结果以“How to get the most from microarray data: advice from reverse genomics”为题发表在2014年3月21日的《BMC Genomics》杂志。研究结果向当前的微阵列数据分析范式发出了挑战,表明这种新方法能够提高对癌症相关基因的识别能力。

典型的微阵列基因表达分析,是通过比较相邻正常组织和肿瘤组织的基因表达。在这些分析中,表达具有强大统计差异的基因被鉴定出来。然而,许多基因在肿瘤中是异常表达的,作为肿瘤发生的一个副产品。这些“过客”基因在正常组织和肿瘤组织之间的表达是有差异的,但是它们并不是肿瘤发生的“驱动者”。因此,传统的癌症基因识别方法不是非常有效,需要更好的分析方法,来发现更多真正的癌症相关“驱动”基因。

本文第一作者、社区及家庭医学副教授Ivan P. Gorlov博士和社区及家庭医学教授、基因组医学中心主任Christopher Amos博士,描述了微阵列数据分析的一种新型方法。研究小组证明,以基因表达在个体肿瘤间的差异为基础的基因分类,要优于传统的分析方法。结果在4种主要癌症类型中是一致的:乳腺癌、结肠癌、肺癌和前列腺癌。

研究小组使用文本挖掘来识别已知与乳腺癌、结肠癌、肺癌和前列腺癌相关的基因。然后,他们通过确定这些已知癌症相关基因在不同分析方法鉴定的几大候选基因之中的发生频率,评估了富集因子。富集因子描述了与纯粹通过偶然机会发现的频率相比癌症相关基因的识别频率。在所有四种癌症类型中,基于基因表达在个体肿瘤间差异的候选基因选择新方法,要优于其他方法,包括比较相邻正常组织和肿瘤组织的平均基因表达的标准方法。Gorlov博士和他的同事们还利用这种方法来确定新的肿瘤相关基因。

作者援引肿瘤异质性作为他们这种方法成功的最可能的原因。该方法基于可被不同癌症基因驱动的不同肿瘤的知识。该方法通过识别在肿瘤间表达有高度差异的基因,优先确定与癌症特别相关的基因。当比较邻近肿瘤组织和正常组织的平均基因表达时,这一相同特征——肿瘤的异质性,可能会降低识别关键基因表达变化的能力,因为相同类型的肿瘤可能具有差异性表达的不同基因。

该研究结果,向比较相邻正常组织和肿瘤组织平均基因表达的模型,发出了挑战,是识别癌症相关基因的最好方法。事实上,该小组确定了相邻“正常“组织样品中的高度变异,它们通常被用作基于平均基因表达的对比分析的参照样本。研究表明,基于个体间表达差异的方法,可能有助于我们从现有和未来的全基因组表达研究中获得最大的收益。(生物通:王英)

延伸阅读:Nature子刊:新型计算方法大大加速基因表达估算

生物通推荐原文摘要:
How to get the most from microarray data: advice from reverse genomics
Abstract
Background:Whole-genome profiling of gene expression is a powerful tool for identifying cancer-associated genes. Genes differentially expressed between normal and tumorous tissues are usually considered to be cancer associated. We recently demonstrated that the analysis of interindividual variation in gene expression can be useful for identifying cancer associated genes. The goal of this study was to identify the best microarray data–derived predictor of known cancer associated genes.

Results:We found that the traditional approach of identifying cancer genes—identifying differentially expressed genes—is not very efficient. The analysis of interindividual variation of gene expression in tumor samples identifies cancer-associated genes more effectively. The results were consistent across 4 major types of cancer: breast, colorectal, lung, and prostate. We used recently reported cancer-associated genes (2011–2012) for validation and found that novel cancer-associated genes can be best identified by elevated variance of the gene expression in tumor samples.

Conclusions:The observation that the high interindividual variation of gene expression in tumor tissues is the best predictor of cancer-associated genes is likely a result of tumor heterogeneity on gene level. Computer simulation demonstrates that in the case of heterogeneity, an assessment of variance in tumors provides a better identification of cancer genes than does the comparison of the expression in normal and tumor tissues. Our results thus challenge the current paradigm that comparing the mean expression between normal and tumorous tissues is the best approach to identifying cancer-associated genes; we found that the high interindividual variation in expression is a better approach, and that using variation would improve our chances of identifying cancer-associated genes.

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号