客服热线:400-621-0302 邮箱:service@genechem.com.cn
售前咨询顾问:18616237127 ; 18616759206


吉凯基因单细胞测序分析报告(含个性化分析内容)



1、整体相关性分析

         生物学重复是任何生物学实验所必须的,高通量测序技术也不例外(Hansen et al.)。生物学重复主要有两个用途:一个是证明所涉及的生物学实验操作是可以重复的且变异不大,另一个是为了确保后续的差异基因分析得到更可靠的结果。样品间基因表达水平相关性是检验实验可靠性和样本选择是否合理的重要指标。

2、基于已知marker分型和差异分析

         在对整个细胞群体进行分型时,通常会具备一些特定细胞类型的已知marker,基于这些先验知识,使用monocle软件按照marker基因在各细胞的表达量对细胞进行注释和分群。 根据分群结果可以比较同一类细胞亚群不同样本(如疾病vs正常)之间的基因表达差异, 差异分析结果示例如下。

(1)id:基因编号
(2)gene_short_name:基因名称
(3)pval: 差异分析p值
(4)qval:差异分析经多重检验校正后的p值
上海吉凯基因化学技术有限公司

3、marker基因展示

         基于10xGenomics单细胞标准分析流程cell ranger,可输出各cell groups(cluster)中各个marker基因及其的表达水平,针对这些marker基因以多种形式进行展示。

3.1 single marker基因Violin图形展示

         基于筛选得到的全部marker基因,挑选关键single marker基因看其在不同细胞类型(cluster)中的表达情况,可通过基因表达量及细胞分类结果绘制出关键single marker基因在各个cluster中表达情况的小提琴图,如下所示:

上海吉凯基因化学技术有限公司

3.2 single marker基因tSNE图形展示

         t-分布邻域嵌入算法(t-SNE)维数约减算法能有效地将这些形状投射到两个或三个维度,从而使得相似的细胞聚集在一起。根据已筛选得到全部的marker基因绘制t-SNE分型结果图,再针对其中关键single marker基因进行特异标注,可获得single marker基因在各cluster中的存在情况。如下图所示。

上海吉凯基因化学技术有限公司

3.3 marker基因聚类热图展示

         将每个cluster鉴定到的marker基因进行热图展示,同一个cluster内的marker基因表达量一般会高于其他组,将log10(UMI+1)值进行归一化转换并进行聚类,热图中红色表示高表达,蓝色表示低表达。聚类热图如下图所示:

上海吉凯基因化学技术有限公司

4、多样本t-SNE分型分析

         针对所有样本细胞的基因表达量绘制细胞亚型分类图,可获得所有细胞的分型情况,之后再对每个样本中的细胞进行亚型分类,通过比较二者可获得不同样本中的细胞在整体的细胞亚型中所占的比例及分布。如下图所示:

上海吉凯基因化学技术有限公司

5、拟时分析

         2014年,美国华盛顿大学生物学家Cole Trapnell就开发了拟时分析工具Monocle。该工具能够利用机器学习的方法来对scRNA-seq实验性的数据进行推断。基于某些关键基因或者maker genes的表达模式进行机器学习,进而模拟时间发育过程的动态变化。这里我们首先挑选出在细胞间基因表达变异程度较大的基因,依据它们的表达谱进行空间降维,再构建最小生成树(minimum spanning tree, MST),之后通过该MST找到最长路径代表转录特征相似细胞的分化轨迹。该分析可以推测疾病发生过程中细胞亚型的演变轨迹或细胞凋亡路径,或者推断干细胞在发育过程的分化轨迹或某类细胞的分化来源。细胞时间轨迹构建结果如下图所示:


图中不同的分支可能代表不同的演变或者分化轨迹,不同颜色代表不同的cell cluster。

上海吉凯基因化学技术有限公司

          进一步针对分支节点进行关键基因查找,根据基因的显著性挑选top3,追踪其随着时间的动态变化,如下所示:


图中横坐标是模拟时间,纵坐标为基因的表达量,不同颜色的点代表不同cell cluster

上海吉凯基因化学技术有限公司

6、富集分析

          通过对筛选到的marker基因进行富集分析,可以找到不同细胞cluster的marker基因与哪些生物学功能或通路显著性相关,进而对不同细胞cluster进行功能标识。吉凯基因采用GSEA软件对marker基因集进行GO功能富集分析,KEGG通路富集分析,Reactome通路富集分析。

6.1 GO功能富集分析

          GO(Gene Ontology)是描述基因功能的综合性数据库,可分为分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)三个部分。GO富集以padj小于0.05为显著富集,富集结果如下表所示:

(1)Category:GO数据库
(2)ID:GO编号
(3)Description:GO编号对应的功能描述
(4)GeneRatio:注释到GO编号上的差异基因数与差异基因总数的比值
(5)BgRatio:注释到GO编号上的背景基因数与背景基因总数的比值
(6)pvalue:显著性检验p值
(7)padj:校正后的p值
(7)geneID:注释到GO编号上的基因
(8)Count:注释到GO编号上的基因数

        从GO富集分析结果中,选取最显著的30个Term绘制柱状图进行展示,若不足30个,则绘制所有Term信息,结果如下图所示:

        从KEGG富集结果中,选取最显著的20个通路绘制散点图进行展示,若不足20个,则绘制所有通路信息,结果如下图所示:

        从KEGG富集结果中,选取显著通路图并标记显著差异的上下调基因,结果如下图所示:

6.3 Reactome富集分析

        Reactome是一个人为规定的人类核心生物途径和反应的数据库,数据信息由相关领域生物专家提供,并经过同行评阅以确保连贯性和准确性。通过与其它数据库合作和人工注释方式,Reactome也已经收录了包括小鼠、拟南芥、果蝇等多种模式物种的反应组学数据。该库为人们提供了一个全新的从整体水平上对生物学途径进行研究的工具,同时,它也是一个改良的搜索及数据挖掘工具,可以简化与生物学途径相关的数据搜索与研究。Reactome富集以padj小于0.05为显著富集,富集结果如下表所示:

(1)Category:Reactome数据库
(2)ID:Reactome编号
(3)Description:Reactome编号对应的功能描述
(4)GeneRatio:注释到Reactome编号上的差异基因数与差异基因总数的比值
(5)BgRatio:注释到Reactome编号上的背景基因数与背景基因总数的比值
(6)pvalue:显著性检验p值
(7)padj:校正后的p值
(8)geneID:注释到Reactome编号上的基因
(9)Count:注释到Reactome编号上的基因数

        从Reactome富集分析结果中,选取最显著的20个Term绘制柱状图进行展示,若不足20个,则绘制所有Term信息,结果如下图所示:

        从Reactome富集分析结果中,选取最显著的20个Term绘制散点图进行展示,若不足20个,则绘制所有Term信息,结果如下图所示:

上海吉凯基因化学技术有限公司

更多详情请可点击>>

姓名* 联系电话*
邮箱* 工作单位*
职务* 地址
工作岗位* 医生 科研人员 其他
您所需的资料*

蛋白组学 定量蛋白质组学 单细胞测序 外泌体整体解决方案

备注




更多信息请登录吉凯基因官网,或致电来函吉凯基因。
400-621-0302 service@genechem.com.cn www.genechem.com.cn

扫一扫,有惊喜

本网页由 生物通 设计制作