山东大学泰山学者李国君教授:全新的多样本转录组组装算法TransMeta

【字体: 时间:2022年08月09日 来源:山东大学

编辑推荐:

  2022年7月20日,山东大学数学与交叉科学研究中心李国君教授团队在生物信息学顶级期刊Genome Research发表转录组重构重要研究成果“TransMeta simultaneously assembles multisample RNA-seq reads”。

  

2022年7月20日,山东大学数学与交叉科学研究中心李国君教授团队在生物信息学顶级期刊Genome Research发表转录组重构重要研究成果“TransMeta simultaneously assembles multisample RNA-seq reads”。山东大学为论文第一完成单位,数学与交叉科学研究中心于婷博士与数学学院赵晓宇博士为论文共同第一作者,李国君教授为文章独立通讯作者。

image001.png

RNA-seq测序技术为揭示和研究真核生物转录组的复杂结构提供了前所未有的机遇,基于RNA-seq数据精确重构转录本是转录组学开展后续分析的前提,为基因差异表达分析等下游研究起到铺垫作用,尤其是对包括癌症在内的复杂疾病的研究具有重大意义。然而如何从海量测序片段准确高效地重构出全长转录组,是目前面临的一个重大挑战。几乎所有转录组学研究都涉及多个样本的RNA测序,如何针对多样本的RNA测序数据创建一个一致的转录本集合也十分关键。目前,几乎所有的转录组组装算法都是针对单样本测序数据设计,专门针对多样本测序数据进行组装的工具却非常匮乏,而且其组装效果并不理想。

为此,李国君教授团队开发了一个全新的多样本转录组组装算法--TransMeta,实现了多个样本RAN-seq数据的同步精确组装,既可以为多样本测序生成一个一致的转录组,又可以同步地为每个独立样本生成一个特定的转录本集合。TransMeta算法引进了一个全新的图模型--向量加权剪接图模型(Vector Weighted Splicing Graph Model),区别于传统剪接图的标量加权,TransMeta算法首次提出了使用向量来对剪接图赋权的思想,其中向量的大小对应于要组装的样本个数,这合理地将转录组组装问题从一维的情况推广到了高维的情况,即从单样本组装推广到了多样本组装。基于向量加权剪接图模型,TransMeta算法着重考虑向量权之间的余弦相似度与双端测序信息,通过引进一个约束最优化问题实现了对剪接图的有效梳理,并结合一种基于动态规划的路径搜索策略来精确地重构转录本。

image003.png

通过在多组包含不同样本个数的数据集(包括模拟数据与真实数据)上的测试,并与目前组装效果最好的组装算法,包括PsiCLASS,StringTie2,Scallop与TACO,进行比较, TransMeta算法在重构转录本的准确率与召回率上都有了明显的提高。在5组真实数据多样本组装层面的比较中,通过调整参数使得各个方法组装准确率相当时,TransMeta的召回率比表现次好的方法PsiCLASS高出了21%-57%。在单样本组装层面的比较中,TransMeta算法同样达到了最优,在包含73个样本的肝脏细胞测序数据上TransMeta的召回率比其他算法高出了19.6%-75.2%。

本项研究工作是转录组重构领域的一个重要突破,尤其是以向量来加权剪接图,并基于向量权设计组装算法,对相关领域的后续研究具有重要的推动作用。该项研究得到了国家自然科学基金重点项目的资助。

原文链接: https://www.genome.org/cgi/doi/10.1101/gr.276434.121

作者简介:

李国君

个人简介

  1996年获中科院数学与系统科学研究院博士学位,同年进山东大学数学学院博士后流动站,1998年出站留校并直接认可(1995年鲁东大学晋升的)正教授。2000年被任命博士生导师,2005年获批山东省“泰山学者”特聘教授称号,2019年被聘为山东大学特聘教授。期间,2004-2005年受聘中科院系统科学所研究员,2006年受聘美国佐治亚大学资深研究教授。2014年全职回国,继续在山东大学从事教学与科研工作。

研究方向:图论、组合最优化、生物信息学

研究成果:涉及图论、组合最优化和生物信息学。

    1、证明了Chvátal猜想为代表的4个图论猜想,在图与组合数学的两个最顶级杂志:J.Combinatorial Theory B, Combinatorica均以主要作者发表过学术论文。

    2、解决了两个长期争议的可近似性问题,在组合最优化和理论计算机科学界的三个最顶级杂志:SIAM J.Computing, ACM Trans.Algorithms, Algorithmica均以主要作者发表过学术论文。

    3、突破了数个生物数据挖掘的算法瓶颈,以第一或通讯作者在生物医学的基础研究领域发表影响因子>11的顶级期刊论文11篇。



相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号