外显子组测序,是利用序列捕获技术,将全基因组外显子区域的DNA捕捉并富集后,进行高通量测序的基因组分析方法。在同样的测序通量下,外显子组测序针对目标区段的测序深度以及覆盖度都高于全基因组重测序,因此该技术对于发生在外显子区的常见和罕见的染色体变异具有很高的检测灵敏度。其简便、经济、高效等特点,使其成为近年的热门技术。
一、 捕获平台
Agilent SureSelect捕获系统
Agilent SureSelect Human All Exon V6人全外显子捕获系统,依托液相捕获系统,采用120-mer的RNA作为“诱饵”探针,能够高效地捕获带有SNV,InDel等突变的基因组序列。目前,该技术广泛应用于癌症等复杂疾病相关的遗传变异研究中,并获得了国际癌症协会(ICGC)的鉴定认可。
SureSelect 人全外显子 V6 高度优化的捕获探针设计结合严格的捕获工作流程,获得的高的在靶效率能够确保读出序列对靶标的特异性映射,从而实现深度覆盖。此外显子组靶向包括难捕获区域的相关数据库的更新内容,可实现蛋白质编码区域的全面分析。
技术优势
1. 最全面的内容,适用于任何应用的外显子组解决方案
- 包含相关数据库的最新核心内容,可靶向包括难捕获区域在内的更多外显子
- 轻松添加用于转化研究的 UTR、用于癌症研究的 COSMIC,或用于特定应用的定制内容
2. 高覆盖率、高深度测序,可准确的检测出疾病相关的常见及稀有变异
二、 技术参数
样本类型:DNA样品
样品浓度:≥50ng/µl
样品总量:≥2ug
1、 Germline变异相关建议测序深度80X以上(单基因/复杂疾病研究)
2、 Somatic变异相关建议测序深度150X以上(肿瘤癌症研究)
测序实验及基础分析:35个工作日
三、 技术路线
四、 数据分析结果展示
a) 突变频率分布图
图中展示了其中一个样本在24条染色体上每兆(Mbp)区域类突变频率分布,可以直观看出该样本在染色体上那些区域突变集中。绿色和红色的是表示所有突变的频率,其中红色的表示在这1M区域内,target区域(试剂捕获区域以及上下游25bp)小于500bp,蓝色表示的是exonic上的突变频率。
b) 突变功能分布图
图中展示了其中一个样本突变功能分布情况。上方的饼图表示在基因不同区域上(intron, exon, etc.)的变异所占的百分比;下方的饼图表示在exon位置上不同变异类型所占的百分比。
c) 样本拷贝数变异区间图
其中右上角标注样本名,图中灰色的线条横坐标是染色体位置坐标,纵坐标是平覆盖度的z-score归一化值,每折点是一个小的捕获区间。灰色线条是参考对照的样本的归一化值变化情况,红色或绿色代表该样本的归一化值变化情况,其中红色表示DEL,绿色表示DUL。
d) 体细胞突变率及突变频谱图
图形上方展示每对样本体细胞突变数目,下图展示每对样本体细胞突变不同突变类型所占的比例。
e) 样本体细胞突变heatmap图
f) 体细胞突变富集分析图
左边纵坐标表示Go term,横坐标是富集因子(Rich Factor = Gene number/Total Gene Number of the term)。每个圆圈的大小与在这个Go Term上的基因成正比,颜色与根据q-value的log值从红到绿渐变,越红,q-value值越低,富集越显著。
g) 家系连锁分析LOD连锁图及单倍型图
左图为LOD连锁图,通常,LOD值≥3被认为是两个基因连锁得确定证据(因为LOD值是以10为底的对数计算的,LOD值为3表明1000:1的机会,即所观察到的连锁不是偶然发生的);LOD值≥2时,可能连锁;-2<LOD值<2时,需要更多地家系资料,尚不能判别是否连锁;LOD值<-2时,为不连锁;右图为致病位点单倍型图,可以根据此图判断致病位点是否在家系患病成员中处于共分离状态。
h) 曼哈顿图(Manhattan Plot)
X-轴为基因组坐标,Y-轴为每个单核苷酸多态性的关联P-值的负对数。