编辑推荐:
为解决蛋白质折叠问题及获取多构象,研究人员开发 FiveFold 方法,有效预测蛋白质多构象结构。
在生命科学的微观世界里,蛋白质就像一个个神奇的 “小工匠”,它们的结构与功能紧密相连,关乎着生命活动的方方面面。然而,想要精准地了解这些 “小工匠” 的模样,即蛋白质的结构,却并非易事。目前,蛋白质结构预测领域面临着诸多挑战。虽然像
AlphaFold 这样借助人工智能的方法在预测蛋白质结构时取得了前所未有的高精度,但它也存在明显的局限性。AlphaFold 只能预测出蛋白质的单一构象状态,无法展现蛋白质内在的无序性,不能为我们提供多种构象来全面认识蛋白质。而获取蛋白质的构象集合对于解决蛋白质折叠问题以及研究内在无序蛋白(IDP)至关重要,这就好比我们要了解一个复杂机器的工作原理,只看它的一种状态远远不够,需要知道它在不同情况下的各种形态。因此,为了突破这些困境,来自中国科学院深圳先进技术研究院等多个机构的研究人员开展了一项极具意义的研究。他们开发了一种名为 FiveFold 的方法,相关研究成果发表在《Scientific Reports》上。
研究人员在开展此项研究时,主要运用了以下几种关键技术方法:
构建蛋白质折叠形状代码(PFSC)体系:用 27 个字母组成的 PFSC 来描述五个氨基酸残基的折叠形状,从而简化复杂的蛋白质折叠对象。
建立数据库:包括 5AAPFSC 数据库,收集所有可能的五个氨基酸片段的折叠模式;PDB-PFSC 数据库则存储由已知 3D 结构转换来的 PFSC 字符串。
生成蛋白质折叠变异矩阵(PFVM):沿着蛋白质序列提取五个氨基酸残基的折叠形状,形成 PFVM,以此展示蛋白质的局部折叠变化。
构建蛋白质结构集合:通过高通量筛选 PDB-PFSC 数据库,根据 PFSC 字符串搜索相似的 3D 结构,进而构建蛋白质的多构象 3D 结构集合。
下面来看具体的研究结果:
P53HUMAN 的结构预测 :P53HUMAN 是一种重要的调控蛋白,能预防癌症形成,由 393 个氨基酸残基组成,有四个结构域。在对其进行结构预测时,研究人员先聚焦于 DNA 结合域。通过 PFSC 比对发现,它能比传统的结构叠加更好地揭示不同结构的折叠相似性和差异。利用 FiveFold 方法构建出的 P53 DNA 结合域的多构象 3D 结构,不仅具有较高的灵活性,还能准确地与已知结构匹配。对于整个 P53HUMAN 蛋白,虽然其完整的 3D 结构难以通过实验测量或计算预测获得,但 FiveFold 方法仍能预测出多个构象,且预测结构与已知结构相比,在构象相似性上表现更优。
LEF1HUMAN 的结构预测 :LEF1HUMAN 是一种内在无序蛋白,由 399 个氨基酸残基组成,含有两个无序区域,在 PDB 数据库中没有其 3D 结构数据。研究人员借助 FiveFold 方法,通过其 PFVM 成功预测出多个构象结构。这些构象与 AlphaFold 预测的单一结构相比,含有更多的 α - 螺旋片段,且大多数二级结构片段能局部对齐。这表明 FiveFold 能够为内在无序的 LEF1HUMAN 蛋白预测出更多不同的构象结构。
Q8GT36_SPIOL 的结构预测 :Q8GT36_SPIOL 是菠菜光合类囊体膜上的一种蛋白质,是研究内在无序蛋白的典型样本。研究人员根据其序列获得 PFVM,进而形成一系列可能的 PFSC 构象,并预测出 3D 结构。通过与 NMR 结构的比较,发现 PFSC 比对能很好地揭示两者的局部折叠相似性和差异,说明 FiveFold 方法为内在无序蛋白预测多构象结构提供了有效工具。
研究结论和讨论部分进一步凸显了 FiveFold 方法的重要意义。从准确性和灵活性的角度来看,该方法在预测蛋白质结构时,既能够构建出蛋白质的多构象结构,体现其灵活性,又能在与已知结构对比时保持较高的准确性。与深度学习方法如 AlphaFold 相比,FiveFold 采用了更具生物物理意义的算法,它基于单序列进行预测,能更好地揭示序列差异对蛋白质结构的影响,还能为内在无序区域提供多种折叠模式。此外,FiveFold 作为单序列方法,能够区分单个氨基酸替换导致的结构差异,对于研究蛋白质突变、不同物种间相同蛋白质的差异具有重要价值。在未来,研究人员计划进一步完善相关研究,如生成 PFVM 数据库方便科研人员使用,探索折叠构象变化与蛋白质功能或疾病之间的关系,借助改进的人工智能技术更好地从众多可能性中提取最优构象等。这项研究为蛋白质结构预测领域开辟了新的道路,有望推动生命科学和健康医学领域的进一步发展。
闂傚倷鑳堕幊鎾绘倶濮樿泛绠插ù锝堟閻牓鏌ㄩ悤鍌涘
婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婇柍瑙勫劤娴滈箖鏌i悢鐓庝喊婵℃彃婀遍埀顒冾潐閹稿摜鈧稈鏅濋埀顒勬涧閵堟悂寮崒鐐村€锋い鎺嶇劍閻﹀酣姊虹拠鎻掝劉缂佸甯″畷婵嬪箳濡も偓缁€澶愭煟閺冨倸甯舵潻婵囩節閻㈤潧孝婵炶尙濞€瀹曟垿骞橀幇浣瑰兊閻庤娲栧ú銊╂偩閾忓湱纾介柛灞剧懅椤︼附淇婇锝囩煉鐎规洘娲熼、鏃堝川椤栵絾绁梻浣瑰缁诲倿鎮ч幘婢勭喓鈧綆鍠楅悡娆愮箾閼奸鍤欐鐐达耿閺屾洟宕堕妸銉ユ懙閻庢鍣崜鐔肩嵁瀹ュ鏁婇柣锝呮湰濞堟悂姊绘担钘変汗闁烩剝妫冨畷褰掓惞椤愶絾鐝烽梺绉嗗嫷娈曟い銉ョ墦閺屾盯骞橀懠顒夋М婵炲濯崹鍫曞蓟閺囥垹骞㈡俊銈咃工閸撻亶鏌i姀鈺佺仭濠㈢懓妫楀嵄闁圭増婢橀~鍛存煟濞嗗苯浜惧┑鐐茬湴閸婃洟婀侀梺鎸庣箓濡瑧绮堢€n喗鐓冪憸婊堝礈濮橆厾鈹嶉柧蹇氼潐瀹曟煡鏌涢幇銊︽珖妞も晝鍏橀弻銊モ攽閸℃瑥鈪靛┑鈽嗗灠椤戝寮诲☉銏犵闁瑰鍎愬Λ锟犳⒑鐠囧弶鍞夊┑顔哄€楃划姘舵焼瀹ュ懐顦ㄥ銈嗘尵婵兘顢欓幒妤佲拺閻犲洠鈧櫕鐏侀梺鍛婃煥妤犳悂鍩㈤幘璇茬闁挎棁妫勫▓銉ヮ渻閵堝棛澧紒顔肩焸閸╂盯寮介鐔哄幈濠电偛妫欓崝鏇㈡倶閳哄偆娈介柣鎰级閸犳﹢鏌熼姘毙х€殿噮鍣e畷鎺懳旀担瑙勭彃
10x Genomics闂傚倷绀侀幖顐﹀磹閻熼偊鐔嗘慨妞诲亾妤犵偞鐗犻垾鏂裤€掓刊鐖剈m HD 闂佽瀛╅鏍窗閹烘纾婚柟鍓х帛閻撴洘鎱ㄥΟ鐓庡付闁诲繒濮烽埀顒冾潐濞叉粓宕伴幘鑸殿潟闁圭儤顨呴獮銏℃叏濮楀棗澧┑顔煎暣濮婃椽宕ㄦ繝鍌滅懆濠碘槅鍋呯划宥夊Φ閺冨牆绠瑰ù锝囨嚀娴犮垽姊洪幖鐐插姉闁哄懏绮撻幃楣冩焼瀹ュ棛鍘遍棅顐㈡搐椤戝懏鎱ㄩ埀顒€鈹戦悙瀛樼稇婵☆偅绮撴俊鐢稿箛閺夊灝宓嗛梺缁樶缚閺佹悂鎮℃担铏圭=濞达絽鎲″﹢鐗堜繆閻愯埖顥夐摶鐐烘煕瑜庨〃鍛矆閸℃稒鐓曢柍鈺佸暈缂傛岸鏌嶈閸忔稓鍒掑▎鎾虫瀬鐎广儱顦伴弲鎼佹煥閻曞倹瀚�
濠电姷鏁搁崑娑樜涙惔銊ュ瀭闁兼祴鏅滃畷鏌ユ倵閿濆骸浜為柍缁樻閹鏁愭惔鈥崇缂備椒鑳跺▍澧俰st闂傚倷绶氬ḿ褍螞濡ゅ懏鏅濋柨婵嗘川缁犳柨顭块懜闈涘婵☆偅蓱閵囧嫰骞樼捄杞扮捕缂傚倸绉崇欢姘跺蓟濞戙垹鍐€闁靛ě鍐f嫛婵犵數鍋涢悧濠囧储椤ョSPR缂傚倸鍊烽悞锔剧矙閹烘鍎庢い鏍仜閻掑灚銇勯幒鍡椾壕濡炪倧缂氶崡鎶藉箖瑜斿畷顐﹀Ψ閵堝棗濯伴梻渚€鈧偛鑻晶鏉戔攽閳ユ剚鍤熼柍褜鍓ㄧ紞鍡涘礈濮樿泛姹查柍鍝勬噺閸婂灚绻涢幋鐐垫噧濠殿喖鍟撮弻娑㈠籍閹炬潙顏�
闂傚倷绀侀幉锟犮€冮崱妞曞搫饪伴崨顓炵亰闂婎偄娲︾粙鎺楀吹閸曨垱鐓熼柟閭﹀墻閸ょ喖鏌曢崼鐔稿唉妤犵偞鐗犲鍫曞箣閻樻鍞堕梻浣告啞閻熴儱螞濠靛棭娼栧┑鐘宠壘鎯熼梺闈涱檧缁茬厧霉閻戣姤鐓熼柣妯夸含閸斿秶鎲搁弶鍨殻闁诡喓鍎甸弫鎾绘晸閿燂拷 - 濠电姷鏁搁崕鎴犲緤閽樺鏆︽い鎺戝閻鏌涢埄鍐$細妞も晜鐓¢弻娑㈠焺閸愭儳姣€闂佸湱鍎ら幐楣冦€呴悜钘夌閺夊牆澧界粔鐢告煕鎼淬垹鐏ラ柍钘夘樀楠炴﹢顢涘顐㈩棜婵犵數鍋為崹鍫曞箹閳哄倻顩叉繝濠傚暟閺嗭箓鏌i弮鍥仩缁炬儳銈搁弻娑㈠焺閸愵厼顥濋梺鍛婃⒐鐢繝骞冨Δ鍛嵍妞ゆ挾鍋樺Σ鎰版⒑缂佹ḿ鈯曢柣鐔濆洤绠悗锝庡枛缁犳煡鏌熸导瀛樻锭闁诡喕绶氬娲川婵犲倻顑傛繝鈷€鍕垫疁鐎殿喗濞婇幃銏ゆ偂鎼达綆鍞规俊鐐€栭弻銊╂倶濠靛牏鐜绘繛鎴欏灪閻撴瑩鎮归妸銉Ц闁稿﹤顭烽幃鐑藉閵堝棛鍘卞┑鐐叉閿氶柣蹇嬪劜閵囧嫰顢曢姀鈺佸壎閻庤娲滄繛鈧€殿喕绮欓、鏍敃閿濆懏璇為悗娈垮枟閹倿寮幘缁樻櫢闁跨噦鎷�
婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婃い鎺嗗亾鏉╂繃绻濋悽闈浶㈤悗姘煎櫍閹本鎯旈妸锔惧幘閻庤娲栧ú銈嗙濠婂牊鐓曢柣鎰摠鐏忥箓鏌熼挊澶娾偓濠氬焵椤掑﹦绉甸柛鎾村哺椤㈡棃濡舵径瀣化闂佽澹嬮弲娑欎繆閾忓湱纾奸柕濞у喚鏆梺鐟板槻閹冲酣銈导鏉戠闁靛ě鈧崑鎾寸節濮橆厾鍘搁柣搴秵閸嬪嫭鎱ㄩ崼銉︾厸鐎光偓閳ь剟宕版惔銊ョ厺闁哄啫鐗嗛崡鎶芥煟濡寧鐝慨锝呭閺岋絾鎯旈姀鈶╁闂佸憡姊圭敮鈥崇暦濠靛鍋勯柣鎾冲閵夆晜鐓ラ柣鏇炲€圭€氾拷