编辑推荐:
为解决 AFM 数据难以与其他结构生物学方法兼容的问题,美国威尔康奈尔医学院的研究人员开展 AFM 数据格式转换研究。他们将 AFM 数据转成 3D 密度文件,助力结构分析。这一成果意义重大,强烈推荐科研读者阅读。
美国威尔康奈尔医学院(Weill Cornell Medicine)的 Yining Jiang、Zhaokun Wang 和 Simon Scheuring 等研究人员在《Nature Communications》期刊上发表了题为 “A structural biology compatible file format for atomic force microscopy” 的论文。该研究成果对于结构生物学领域意义重大,为原子力显微镜(Atomic Force Microscopy,AFM)数据的处理、分析和整合提供了新的思路和方法,有望推动 AFM 技术在结构生物学研究中的广泛应用,助力科学家们更深入地探究蛋白质结构和动力学。
研究背景
冷冻电镜(Cryogenic Electron Microscopy,cryo-EM)、X 射线晶体学(X-ray crystallography)和核磁共振(Nuclear Magnetic Resonance,NMR)是结构生物学中常用的技术手段,它们能够通过对数千个分子进行平均,高分辨率地解析生物分子(如蛋白质、DNA、RNA 及其混合复合物)的三维结构。这些三维结构以密度图的形式存储在电子显微镜数据库(EMDB)中,或以原子坐标模型的形式存储在蛋白质数据库(PDB)文件里,为人们理解生物分子结构、探究生物分子功能的化学机制奠定了坚实基础。
与之形成对比的是,AFM 作为一种表面技术,通常难以独立提供完整的三维结构信息,需要借助整合和交叉方法来实现。不过,AFM 也有其独特的优势。它可以在接近生理和动态的条件下,提供单个分子的结构信息。在研究生物分子或细胞时,AFM 能够在生理缓冲液中、常温常压下进行操作。对于膜蛋白(如通道、转运体和受体)的研究,这些分子可以在可控组成的脂质膜中进行重构 ,这种研究条件比 X 射线衍射(需要蛋白质形成三维晶体)和冷冻电镜(需在液氮温度 77K 下对约 50nm 薄液层中的蛋白质成像)所需的条件更接近天然状态。此外,AFM 的高速版本 —— 高速原子力显微镜(High-Speed Atomic Force Microscopy,HS-AFM),成像速度可达每秒 1 - 100 帧,能够提供蛋白质构象变化、构象转变途径和罕见构象状态等宝贵的动态信息。而且,HS-AFM 使用的短悬臂具有低流体动力学阻力和大角度变化的特点,反馈操作更快,相比传统 AFM 更为灵敏,对样品的侵入性也更小。
然而,AFM 和 HS-AFM 也存在一些明显的缺点。一方面,它们的数据局限于表面轮廓,只能提供伪三维(pseudo-3D)信息。与 X 射线衍射和冷冻电镜成像数据不同,AFM 仅为每个与样品表面相互作用的 x,y 位置关联一个高度值(h-value),而不是为描述结构的所有体素(voxel)关联密度值。另一方面,AFM 和 HS-AFM 分析分子时,分子必须吸附在表面。尽管对于二维膜中插入的膜蛋白(其天然状态下仅将两个亲水面向液体环境暴露)以及使用原子级平整云母作为样品表面的情况,这一限制的影响相对较小,但仍然是其应用的一个制约因素。此外,AFM 和 HS-AFM 的形貌数据会受到针尖形状的卷积影响,使蛋白质形貌被放大和扭曲。不过,定位原子力显微镜(Localization Atomic Force Microscopy,LAFM)的出现克服了这一限制,它能够从单个粒子观测中提取形貌峰位置,并将其合并成具有准原子分辨率的形貌概率图,有望成为与其他结构生物学技术对接的标准 AFM 数据处理方法。
此前,AFM 数据通常仅以图片形式发表,缺乏通用的数据或文件格式输出(如 EMDB 或 PDB 文件),无法与其他技术进行数据交换、分析、交叉验证或作为输入使用。为了使 AFM 成为动态结构生物学的补充工具,研究人员需要提取高分辨率的数据,并使其能在大多数常见的结构生物学软件中轻松读取和访问,这便是开展这项研究的重要原因。
研究方法
3D-LAFM 检测的构建与评估 :研究人员利用 LAFM 技术,通过局部图像扩展提取 LAFM 检测信号,然后将这些信号对齐并分配到三维体积空间中。以膜周边蛋白膜联蛋白 V(Annexin V,A5)为例,从原始 AFM 粒子堆栈中提取对齐的 LAFM 检测信号,并将其转换为三维 LAFM 检测堆栈。为了评估对齐的 LAFM 检测信号在三维空间中的分布情况,研究人员将其分配到两个独立的半堆栈中,对表征 A5 分子表面的体素进行掩膜处理,计算两个半堆栈的傅里叶壳层相关(Fourier Shell Correlation,FSC),用 “半比特波长”( )来评估数据质量。
3D-LAFM 检测到密度图的转换 :在基于定位的超分辨率技术(包括 LAFM)中,为了将检测信号转换为空间密度分布,研究人员对 3D-LAFM 检测堆栈中的每个对齐 LAFM 检测信号应用 3D 高斯密度函数,使用通过 FSC 分析确定的 值(等同于 ),从而将 3D-LAFM 检测堆栈转换为 3D-LAFM 密度图,并将其编译成与 MRC2014 文件格式类似的‘.afm’文件,该文件可在结构生物学软件(如 Chimera)中直接打开。
3D-LAFM 密度作为柔性拟合的力场 :分子动力学柔性拟合(Molecular Dynamics Flexible Fitting,MDFF)常被用于将原子结构拟合到密度图中。研究人员利用 3D-LAFM 密度图作为 MDFF 的力场,引导其他方法解析的原子结构向与 AFM 实验中观察到的形貌特征相匹配的构象转变。以 A5 为例,在 MDFF 模拟中,研究人员应用对称性约束和域约束,以提高模拟的收敛性并避免过拟合,通过监测内部能量(E)、均方根距离(root-mean-squared distance,rmsd)和结构与密度图的归一化相关性等指标,评估模拟结果。
转运体的 3D-LAFM MDFF 构象变化 :以谷氨酸转运体( )为例,研究人员利用 HS-AFM 在接近生理条件下对单个 分子的构象变化进行高时空分辨率追踪。基于此,构建 向内开放( )和向内关闭( )状态的 3D-LAFM 密度图,并生成相应的力场( 和 )来引导 3D-LAFM MDFF 模拟。研究人员定义了三个集体变量(Collective Variables,CVs)来表征转运体结构的变化,采用 “顺式拟合”(cis-fitting)和 “反式拟合”(trans-fitting)策略进行 MDFF 模拟,并对模拟结果进行分析。
3D-LAFM MDFF 和实验结构的结构分析 :研究人员使用 “盲拟合”(blind-fitting)策略,对 的 3D-LAFM MDFF 结果进行全面分析。通过主成分分析(Principal Component Analysis,PCA)对 CVs 进行分析,以及构建自动编码器(Autoencoder,AE)神经网络对所有原子坐标进行无监督分析,比较 3D-LAFM MDFF 模型与实验结构之间的相似性,评估 3D-LAFM MDFF 方法的有效性。
研究结果
3D-LAFM 检测的构建与评估 :通过局部图像扩展和对齐分配,成功构建了 3D-LAFM 检测堆栈。以 A5 数据集为例,研究发现数据质量会随着体素化的细化(即体素尺寸 减小)而提高, 在 时达到饱和 。
3D-LAFM 检测到密度图的转换 :将 3D-LAFM 检测堆栈转换为 3D-LAFM 密度图,并编译成‘.afm’文件。通过对 A5 的研究发现,3D-LAFM 密度图能够解析出蛋白质表面不同高度的高分辨率特征,且与 A5 的 X 射线晶体结构相比,在整体形状和表面精细结构特征上具有相似性,同时通过 FSC 分析得出 A5 三聚体 3D-LAFM 密度图的表面 为 。
3D-LAFM 密度作为柔性拟合的力场 :以 A5 为研究对象,使用 3D-LAFM 密度图作为 MDFF 力场进行模拟。结果显示,A5 结构的刚体在模拟开始后的前 0.5ns 内迅速移动到 3D-LAFM 密度图中,并在约 10ns 后达到平衡构象。与初始晶体结构相比,最终的 MDFF 模型保留了整体的三级结构,但膜联蛋白重复序列 I 和 III 发生了明显的刚体移动,且 MDFF 模型捕捉到了 3D-LAFM 密度图中的关键结构特征,反映出在接近生理条件下 A5 更可能的构象。
转运体的 3D-LAFM MDFF 构象变化 :在对 的研究中,“顺式拟合” 和 “反式拟合” MDFF 模拟均成功得到了与预期相符的结构模型,表明 3D-LAFM 密度图生成的力场能够引导结构向有意义的构象转变,且 “反式拟合” 策略在起始结构与 3D-LAFM 密度图构象不同的情况下,仍能得到与 “顺式拟合” 相似的结果。
3D-LAFM MDFF 和实验结构的结构分析 :通过 “盲拟合” 策略和 PCA、AE 分析发现,3D-LAFM MDFF 结果在 pc1-pc2 空间和 AE 网络的二维潜在空间中呈现出与预期相符的聚类分布。 结构靠近 , 结构靠近 ,而 结构形成了一个独特的聚类,反映出其与其他状态不同的构象特征。这表明 3D-LAFM 密度图可作为 MDFF 的力场,引导任何结构进入一致的构象聚类,且该方法能够从任何起始构象生成未知状态的模型。
研究结论与讨论
AFM 长期以来难以与其他结构生物学方法真正互补和对接,主要原因在于其产生的数据无法像其他方法那样在常用的结构生物学平台上进行可视化、分析、解释和比较。本研究基于 LAFM 技术,开发了一种将 AFM 单粒子数据转换为 3D 密度文件(即 3D-LAFM 密度图)的流程,并将其编码为结构类似 MRC2014 文件格式的‘.afm’文件。这种‘.afm’文件可被常用的结构生物学软件(如 Chimera)读取,便于直接可视化和解释 3D-LAFM 密度图,同时能与其他结构数据进行比较。
研究人员利用 3D-LAFM 密度图生成外部力场,用于 MDFF 模拟,引导冷冻电镜和晶体结构向 HS-AFM 观察到的构象状态转变。尽管 AFM 数据无法构建完整的三维密度,不能独立确定结构,但 3D-LAFM 密度图具有重要的结构信息。通过使用 3D-LAFM 密度图驱动 MDFF,研究人员获得了反映 AFM 实验中观察到的结构特征的模型,这些模型补充了其他方法在较非生理条件下解析的结构。
通过 “顺式” 和 “反式” 构象的 3D-LAFM MDFF,研究人员定量评估了该方法的稳健性。在
的 3D-LAFM MDFF 模拟中,“顺式拟合” 和 “反式拟合” 策略均取得了成功,这表明可以使用 “盲拟合” 策略进行 3D-LAFM MDFF,以无偏地搜索与 3D-LAFM 密度图匹配的结构模型,从而有可能发现未知的构象。
此外,研究人员还可以通过 PCA 等单粒子分类策略,从 AFM 和 HS-AFM 实验中获得多个结构模型,用于研究蛋白质在工作状态下的构象动力学,有望产生单个蛋白质工作的原子级电影。这些数据集可以以结构生物学兼容的格式(3D-LAFM 密度以‘.afm’格式,3D-LAFM MDFF 模型以 PDB 格式)存入合适的存储库,便于进行跨方法比较和结构分析。研究人员还发起建立了 AFM 数据库(AFM Data Bank,AFMDB),用于存储‘.afm’文件,促进 AFM 数据与其他结构生物学数据的整合。
综上所述,该研究成果有望将 AFM 整合到结构生物学的常用方法中,推动人们在接近生理条件下对蛋白质结构和动力学的单分子水平研究,为结构生物学领域的发展开辟新的道路,助力科学家们更深入地理解生命过程中的分子机制。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》