-
生物通官微
陪你抓住生命科技
跳动的脉搏
973首席科学家2011新文章解析piRNA
【字体: 大 中 小 】 时间:2011年03月28日 来源:生物通
编辑推荐:
中国科学院动物研究所康乐研究员早年毕业于中国科学院动物研究所,目前为农业虫害鼠害综合治理研究国家重点实验室主任,国家“973”项目首席科学家,国家基金委创新团队学术带头人。近期其研究小组发表文章,获得了piRNA的高精度预测算法研究新突破。这一研究成果公布在生物信息学权威期刊《Bioinformatics》(IF=4.926)上。
生物通报道:中国科学院动物研究所康乐研究员早年毕业于中国科学院动物研究所,目前为农业虫害鼠害综合治理研究国家重点实验室主任,国家“973”项目首席科学家,国家基金委创新团队学术带头人。近期其研究小组发表文章,获得了piRNA的高精度预测算法研究新突破。这一研究成果公布在生物信息学权威期刊《Bioinformatics》(IF=4.926)上。
第二代测序技术又称作深度测序技术,应用到RNA上统称作RNA-seq或RNA测序,它已成为基因表达和转录组分析的重要手段。第二代转录组测序数据中含有大量不编码蛋白质的ncRNA序列,因为它们像宇宙中的暗物质一样难以识别和有重要功能,也被称为“基因组暗物质”。由于数据量巨大,保守性差,又有噪音干扰,这些“暗物质”的识别成为表观遗传学和调控网络研究的瓶颈。piRNA是数量最大的一类ncRNA,主要是通过与转座子的序列互补来控制转座子的表达,进而调控生殖和发育。由于不同物种的piRNA之间同源性很差,至今国际上还没有有效的识别方法。
康乐研究组的张屹等最近发表的题为A k-mer scheme to predict piRNA and characterize locust piRNA 的最新研究论文,解决了高精度预测生物体中数量最大的一类非编码RNA---piRNA的难题。
这篇文章中提出了一种基于k-mer串频率的Fisher判别式来预测piRNA的算法, 精度达90%以上,超过了哈佛大学B. Doron的61%的精度。利用该方法,他们成功地鉴定出飞蝗8万多条piRNA,预测飞蝗可能存在约13万条piRNA。进一步分析发现,这些piRNA在飞蝗群居型和散居型间存在巨大差异,这可能为解释飞蝗两型生殖力差异提供了重要的线索。
这个不依赖基因组数据来鉴定非模式生物piRNA的新方法具有重要的理论意义和广泛的应用价值。目前,在线软件piRNApredictor (http://59.79.168.90/piRNA/index.php) 已被国外科研机构用于猪的piRNA研究中。
piRNA预测算法的突破为其它ncRNA的预测提供了重要的启示:不保守的ncRNA是可以预测的。由于该算法理论的普遍性,该方法不仅可以预测其它物种的piRNA,还可以通过变更训练集来预测其它种类的ncRNA。而且,在线软件给出的piRNA高精度预测结果,对表观遗传学、调控网络与piRNA功能的进一步研究有重要理论意义和应用价值。
(生物通:万纹)
作者简介:
康乐
中国科学院动物研究所 进化生态学研究组组长
康乐研究员,博士,农业虫害鼠害综合治理研究国家重点实验室主任。国际直翅类学者学会会员、国际应用蝗虫学协会区域协调人,Insect Science主编 ,Journal of Insect Physiology编委。国家“973”项目首席科学家,国家基金委创新团队学术带头人。
研究组介绍:
进化生态学研究组以进化生物学为线索,以适应性为核心,以蝗虫和斑潜蝇为模式系统,主要开展昆虫抗寒性、化学生态与行为以及生态基因组的研究。研究工作在Science, PNAS, Evolution, Oecologia, Planta, Chemical Senses, Insect Molecular Biology和Cryobiology等国际重要杂志上发表。