
-
生物通官微
陪你抓住生命科技
跳动的脉搏
tsRNADisease数据库:人类疾病相关tRNA衍生小RNA的权威资源库与机制研究新平台
【字体: 大 中 小 】 时间:2025年08月13日 来源:Journal of Genetics and Genomics 7.1
编辑推荐:
针对tRNA衍生小RNA(tsRNA/tRF/tiRNA)与疾病关联数据分散、缺乏整合的问题,研究团队构建了首个全面收录实验验证与预测数据的tsRNADisease数据库。该库涵盖5571条实验验证的tsRNA-疾病关联(涉及4759种tsRNA和166种疾病)及5013条预测关联,提供序列、靶基因、功能机制等深度注释。作为《Journal of Genetics and Genomics》发表的重要资源,该数据库为揭示tsRNA在肿瘤、免疫疾病等病理过程中的调控网络提供了关键工具。
在非编码RNA研究领域,tRNA衍生小RNA(tsRNA)近年来崭露头角,这类包括tRNA片段(tRF)和tRNA半分子(tiRNA)的调控分子,被发现参与基因转录、蛋白翻译等关键过程,与癌症、神经退行性疾病等密切相关。然而,尽管相关研究呈爆发式增长,实验验证的tsRNA-疾病关联数据却分散在不同文献中,缺乏系统整合。更棘手的是,现有数据库如tRF2Cancer等主要依赖计算预测,实验证据不足,且疾病覆盖有限。这种数据碎片化现状严重阻碍了tsRNA的转化医学研究。
为解决这一瓶颈问题,皖南医学院第一附属医院(弋矶山医院)非编码RNA基础与临床转化安徽省重点实验室的研究团队,构建了首个专注于tsRNA-疾病关联的手工注释数据库tsRNADisease。该成果发表于《Journal of Genetics and Genomics》,通过系统整合346项研究的实验证据,收录5571条经严格人工审核的tsRNA-疾病关联数据,覆盖4759种tsRNA和166种疾病,同时纳入5013条经L1-norm-Graph和WBNPMD算法交叉验证的预测关联。数据库创新性地建立了四级置信度评价体系,对基于功能实验(如细胞增殖/凋亡验证)的高质量证据进行重点标注。
研究采用多维度技术路线:通过PubMed等数据库的系统文献检索,结合人工双重校验提取实验数据;使用tRFtarget预测靶基因并通过RNAhybrid和IntaRNA算法交叉验证;采用MySQL构建关系型数据库,集成D3.js等工具实现数据可视化。特别值得注意的是,团队对tsRNA命名进行标准化处理,链接至tRFdb和MINTbase等权威资源,疾病术语则参照MeSH和疾病本体进行规范分类。
研究结果部分显示:
数据库内容:肿瘤关联占比最高(31%),其次为免疫系统疾病(16%)。i-tRF(30.7%)、tRF-5(30.5%)和tRF-3(24.2%)是主要tsRNA类型,17.5%的条目具有高置信度实验证据。
技术特色:开发了支持模糊检索的智能查询系统,用户可通过tsRNA类型、宿主tRNA或实验方法多维度浏览数据,并利用BLAST工具进行序列比对。
比较优势:与OncotRF等现有资源相比,tsRNADisease中98%的tsRNA和89%的疾病类型为独家收录,显著拓展了研究视野。
在讨论环节,作者强调该数据库的特殊价值:一方面,通过集中收录经Northern blot、qRT-PCR等低通量技术验证的可靠数据,弥补了TCGA等高通量数据集可能存在的技术偏差;另一方面,为新兴的PANDORA-seq等改良测序技术产生的数据提供了标准化注释框架。随着CPA-seq等能突破RNA修饰检测限制的新技术应用,该资源将持续更新,助力揭示tsRNA在疾病中的分子时钟机制。
这项研究创建的tsRNADisease不仅是目前最全面的tsRNA-疾病关联知识库,更搭建了连接基础研究与临床转化的桥梁。其特色在于:首创实验证据分级系统,实现从"相关性"到"因果性"的证据层级区分;突破肿瘤领域局限,涵盖心血管、代谢等疾病类型;提供靶基因预测和功能注释,为机制研究提供线索。该资源将加速tsRNA作为诊断标志物和治疗靶点的开发进程,推动非编码RNA研究向精准医学迈进。
生物通微信公众号
知名企业招聘