-
生物通官微
陪你抓住生命科技
跳动的脉搏
《Science Advances》代谢组结合人工智能帮助我们预测衰老和健康
【字体: 大 中 小 】 时间:2025年01月06日 来源:Science Advances
编辑推荐:
研究人员利用机器学习开发了代谢组学衰老时钟,揭示了代谢物谱、健康结果和寿命之间的联系。
代谢物数据和人工智能结合起来,重新定义了我们如何衡量衰老和预测健康跨度,研究人员将其命名为Metabolomic age(MileAge)。
在最近发表在《Science Advances》杂志上的一项研究中,伦敦国王学院的研究人员使用机器学习模型对来自英国的血浆代谢物数据进行了训练,探索了代谢衰老时钟。该研究旨在评估代谢组学衰老时钟在预测健康结果和寿命方面的潜力,通过对其准确性、稳健性以及与实际年龄以外的生物衰老指标的相关性进行基准测试。
生物衰老不同于实足年龄,反映了影响健康和疾病易感性的分子和细胞损伤。单独的实足年龄不能捕捉个体之间与衰老相关的生理状态的变异性。然而,组学技术的最新进展,特别是代谢组学,通过分子谱分析提供了对生物衰老的见解。
代谢物或来自代谢途径的小分子可以提供生理健康评估,并与衰老相关的结果(如慢性病和死亡率)有关。早期的研究将代谢组学数据与衰老联系起来,但受到样本量和标记物的限制。
最近利用机器学习从组学数据中获得“衰老时钟”的努力已经证明了对健康结果的重要预测能力。然而,在优化这些模型的准确性和可解释性方面仍然存在挑战,特别是使用代谢组学。
本研究利用核磁共振(NMR)光谱分析来自英国生物银行的血浆代谢物数据,涉及225,212名年龄在37至73岁之间的参与者。排除标准包括妊娠、数据不一致和极端代谢物值。该数据集包括168种代谢物,代表脂质谱、氨基酸和糖酵解产物。
研究人员对数据集应用了17种机器学习算法,包括线性回归、基于树的模型和集成技术,以开发代谢组学衰老时钟。他们还使用了严格的嵌套交叉验证方法来确保稳健的模型评估。
一些主要的预处理步骤包括处理异常代谢物值和纠正模型固有的年龄预测偏差。预测模型旨在利用代谢物谱来估计实足年龄,预测年龄和实际年龄之间的差异被定义为“里程增量(MileAge delta)”。统计修正被广泛应用于消除系统偏差和提高预测准确性,特别是对于年轻人和老年人。
使用平均绝对误差(MAE)、均方根误差(RMSE)和相关系数等指标评估模型的预测准确性。例如,立体主义回归模型的MAE为5.31年,优于多元自适应回归样条(MAE = 6.36年)等其他模型。进一步的分析调整了预测,以消除系统性偏差,并改善其与实际年龄的一致性。
研究结果表明,从血浆代谢物谱中开发的代谢组学衰老时钟可以有效区分生物衰老和时间衰老。在研究中测试的各种模型中,立体主义基于规则的回归模型提供了与健康指标和死亡率最强的预测关联,并且在准确性和稳健性方面优于其他算法。
此外, MileAge δ值为正,表明衰老加速,与身体虚弱、端粒缩短、发病率高和死亡风险增加有关。具体来说,MileAge每增加1年,全因死亡风险就会增加4%,在极端情况下,风险比(HR)超过1.5。
此外,研究表明,加速衰老的人更有可能报告自己的健康状况较差,并患有慢性疾病。与衰弱和端粒磨损的关联尤其明显,其中一些差异相当于衰弱指数得分18年的差距。有趣的是,在大多数车型中,女性的MileAge略高于男性。
该研究还证实了代谢物-年龄关系的非线性性质,并强调了统计校正在提高预测准确性方面的效用。此外,比较现有的衰老标志物表明,代谢组学衰老时钟捕获了独特的健康相关信号,并且通常优于更简单的预测因子。然而,研究结果强调,减缓衰老(负MileAge)并不能始终转化为更好的健康结果,这强调了生物衰老指标的复杂性。
该研究证明了代谢组学衰老时钟在预测生物衰老和相关健康结果方面的效用。通过对多种机器学习算法进行基准测试,研究结果还显示,立体主义基于规则的模型在将代谢物衍生的年龄与健康指标和死亡率联系起来方面表现优异。
结果表明,代谢组学衰老时钟具有前瞻性健康管理和风险分层的潜力,并强调需要在不同人群和更广泛的临床应用中进一步验证纵向数据。这项研究为算法开发设定了新的基准,说明了代谢组学概况如何为衰老和健康提供可操作的见解。