基于多目标优化的蛋白质折叠多重极小值问题解决方案及其在生物活性结构预测中的应用

【字体: 时间:2025年08月28日 来源:Computational and Structural Biotechnology Reports

编辑推荐:

  针对蛋白质折叠过程中存在的多重极小值问题(MMP),Roterman和Konieczny提出采用多目标优化技术,结合内部力场(EINT)和外部力场(EEXT)的Pareto前沿分析方法,建立了FOD-M模型。该研究突破了传统仅依赖氨基酸序列预测结构的局限,揭示了环境因素通过K参数调控蛋白质构象选择的新机制,为理解蛋白质正确折叠与错误折叠提供了理论框架,对阿尔茨海默病等蛋白质构象疾病研究具有重要启示。

  

蛋白质如何从线性氨基酸链折叠成具有特定生物功能的三维结构,这是现代生物学最迷人的未解之谜之一。尽管AlphaFold等人工智能方法在结构预测方面取得突破,但蛋白质折叠的物理化学机制仍然模糊不清。传统观点认为氨基酸序列决定结构,然而现实中同一序列可能形成不同构象,特别是在淀粉样变性等病理过程中,这种"序列决定结构"的教条被打破。更复杂的是,蛋白质折叠面临多重极小值问题(MMP)——理论上存在无数能量局部极小值对应的可能结构,但生物体总能选择出具有功能活性的构象。这个选择机制是什么?波兰雅盖隆大学的Roterman和Konieczny在《Computational and Structural Biotechnology Reports》发表的研究给出了创新性解答。

研究团队采用多目标优化理论框架,将蛋白质折叠建模为内部力场(EINT)和外部力场(EEXT)的协同优化过程。关键技术包括:1)构建模糊油滴模型(FOD)及其修正版FOD-M,用3D高斯函数量化环境对疏水核形成的导向作用;2)引入K参数表征环境条件强度,通过Kullback-Leibler散度评估实际与理想疏水分布的差异;3)应用Pareto前沿分析平衡EINT(原子间非键相互作用)和EEXT(环境作用)的优化矛盾;4)针对淀粉样蛋白的特殊性,引入σz参数降低模拟二维平面结构的形成。

2.1 多重极小值问题的数学本质

通过信息量化分析揭示,单个肽键构象选择需要约17比特信息量,而氨基酸本身仅贡献4.32比特,这种巨大差异说明单纯依靠序列信息无法解决MMP。计算显示100个氨基酸的蛋白质存在约5×1047种可能构象,远超生物实际折叠时间允许的搜索范围。

2.2 多目标优化模型构建

建立双目标函数F=F(f1,f2),其中f1=EINT包含静电作用、范德华力和二面角扭转能;f2=EEXT通过修正的3D高斯函数(M函数)表达环境导向作用。关键创新在于引入K参数调节理想疏水分布:K=0对应水环境下的标准疏水核,K增大表示环境极性改变,K=1.5时疏水分布均一化,K=5.0则产生极性核心的反向分布。

2.3 帕累托前沿应用

通过Pareto前沿分析,在EINT和EEXT的优化矛盾中找到平衡解。当K固定时(如膜蛋白K≈0.9),搜索限定在特定构象子空间;K作为变量时则可寻找全局优化结构,但可能丧失生物活性。

3.1 环境约束的折叠路径

漏斗模型改造显示,环境条件通过K值限定能量景观的可行区域。与无约束的全局优化相比,生物活性结构往往处于受限子空间中的局部最小值,这种"次优解"恰恰保障了功能特异性。

3.2 淀粉样转变模拟

通过逐步降低σz参数,成功模拟出淀粉样蛋白的二维平面结构形成过程。实验证实空气/水界面促进β片层间氢键网络构建,这解释了为何振荡培养能诱导淀粉样纤维形成。

该研究突破性地将环境因素量化为可计算的K参数,建立FOD-M模型F=F{EINT(rij)+EEXT[M(σxyz,K),rij]}。理论意义在于:1)完善了"序列-环境-结构"的新范式;2)为分子伴侣作用机制提供量化解释;3)开辟淀粉样病变防治新思路。应用价值体现在:1)提升膜蛋白等特殊环境蛋白的结构预测精度;2)指导蛋白质工程中的环境条件设计;3)为构象疾病药物开发提供新靶点。研究同时指出,AlphaFold等纯序列导向的AI方法在淀粉样蛋白预测中的局限性,强调未来算法需整合环境参数。这项工作将蛋白质折叠研究从结构预测层面推进到机制解析的新高度。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号