快速发布企业信息
当前位置:首页行业资讯政策法规专家解读

Nature|大规模发现、分析并设计蛋白质能量景观

2026-05-28 11:35:25来源:智药邦浏览量:7



2026年5月13日,西北大学、多伦多大学、哈佛大学医学院及华盛顿大学等机构的研究人员,在《Nature》发表文章,题为“Large-scale discovery, analysis and design of protein energy landscapes”。

11.png

本文关注蛋白质并非静止地停留在一个“天然折叠结构”中,而是在低能天然态与多种高能构象之间持续波动的问题。这些罕见但重要的高能态会影响蛋白质功能、相互作用、聚集和免疫原性;然而,与可由AlphaFold等工具较准确预测的天然结构相比,构象涨落及其能量长期缺乏可大规模测量的数据。作者提出多重氢-氘交换质谱(mHDX-MS)方法,在完整蛋白水平同时测量数百个小蛋白结构域的交换速率分布和近似开口自由能(ΔGopen)分布,从而以高通量方式刻画蛋白质能量景观。

背景

所有折叠蛋白都会在不同构象状态之间运动,通常包括一个低能天然折叠态、一个较高能的展开态,以及多种具有不同天然样结构程度的激发态。尽管这些高能态的占比很低,却能广泛影响生物学与蛋白质工程过程,包括蛋白功能、相互作用、聚集和免疫原性。由于高能态稀少且短暂,传统结构生物学难以直接观察,因此它们常被称为“不可见”的状态。

理解高能态的另一个难点在于它们高度依赖序列:每个蛋白都具有自己的构象能量景观,描述不同构象状态的能量和群体比例。结构相似的蛋白之间,能量景观也可能差异很大;单点突变甚至可在不改变天然结构的情况下显著扰动能量景观。因此,若要发展下一代能够预测并工程化能量景观的AI模型,需要能够跨序列空间测量构象涨落的新实验方法。

本文提出多重氢-氘交换质谱(mHDX-MS)策略,以同时研究数百个蛋白结构域的能量景观。与只测整体稳定性的实验不同,HDX能测量残基水平从关闭构象到高能开放构象的转换能量,使研究者看到近天然态、替代折叠态、部分展开态和整体展开态等其他方法难以捕捉的状态。

mHDX-MS方法

在理想两态蛋白中,所有受保护的骨架酰胺氢通常只在整体展开时交换,因此其开口自由能分布较为一致;若蛋白能访问中等能量的部分开放态,则部分残基会以较低能量交换,ΔGopen分布会变得不均一。作者将每个结构域的ΔGopen分布按从高到低排序,称为“开口能量谱”。

实验流程包括四个环节:首先用DNA寡核苷酸池合成并克隆上百到上千个小蛋白结构域;随后在同一大肠杆菌培养体系中混合表达并纯化;接着在D2O缓冲液中进行25秒至24小时的氢-氘交换;最后用LC-IMS-MS记录不同时间点的同位素质量分布。作者对pH 6和pH 9各采集32个时间点,从而扩大可测交换速率范围。

计算上,作者通过张量分解解析重叠同位素分布,并使用贝叶斯推断估计每个可交换残基的kHX。再结合估计的化学交换速率kchem,将kHX转换为近似ΔGopen。整体折叠稳定性ΔGunfold由最稳定的若干残基估计,通常取最稳定五个残基的平均值,以降低噪声。

12.png

图1 mHDX-MS用于描绘蛋白质能量景观

结果


mHDX-MS测量准确


作者用HDX NMR和cDNA展示蛋白酶解验证mHDX-MS。HDX NMR是单个蛋白kHX和ΔGopen的金标准方法,而cDNA展示蛋白酶解可并行测量大量结构域的整体稳定性。13个结构域的mHDX-MS与HDX NMR结果高度一致:kHX分布的均方根误差约1.9倍,ΔGopen分布误差约0.53 kcal mol−1。对4,464个结构域比较mHDX-MS与cDNA展示蛋白酶解得到的ΔGunfold,二者强相关;排除可结合DNA的cold-shock结构域后相关性进一步提高。mHDX-MS测得的稳定性通常更高,可能与D2O的稳定作用有关。


跨家族描绘能量景观


从15715条初始序列中,研究者成功分析了5778个结构域。这些结构域来自四类从头设计序列、六类Pfam天然结构域(LysM、PASTA、WW、SH3、pyrin、cold-shock)以及PDB中的其他小结构域。不同蛋白家族、表达水平、质谱信号强度和HDX数据质量导致筛选通过率不同。天然结构域中有较大比例稳定性较低,而设计结构域事先多经过稳定性筛选,因此稳定域比例更高。


量化开口协同性


作者用ΔGavg表示所有可交换残基开口能量的平均值,并将不可测的快速交换残基设定为0 kcal mol−1。ΔGavg可作为部分开放态能量的代理指标。为了排除整体稳定性、氢键供体比例和净电荷的影响,作者建立五参数经验模型预测ΔGavg,并将观察值与预测值之间的标准化残差定义为归一化开口协同性。

协同性高的蛋白更接近“两态、全有或全无”的开口模式,许多残基只有在高能整体展开或接近整体展开时交换;协同性低的蛋白则具有大量低能部分开放态。研究发现,ΔGavg随ΔGunfold次线性增加,说明整体越稳定的蛋白也常存在低于整体展开能量的部分开放态。

不同家族在稳定性和协同性上具有系统差异,但同一家族内部的序列差异常常比家族平均差异更大。PASTA和ββαββ家族平均协同性较高;热源LysM结构域整体稳定性高于中温来源,但协同性没有显著差异。

13.png

图2 小结构域在稳定性和开口协同性上存在差异


稳定性的空间分布


作者用位点分辨HDX NMR分析五个低协同性蛋白和三个高协同性对照。结果显示,在五个低协同性结构域中,有四个的不稳定残基集中在特定结构区域。例如HHH_rd4_0518的α3螺旋开口能量低于3 kcal mol−1,而α1与α2约6 kcal mol−1;但NMR结构证明α3在天然态中仍正确折叠。EEHEE_rd4_0871的C端β-发夹明显低于其余结构,LysM_0873的不稳定残基集中在α2和β2。高协同性结构域则在不同二级结构之间显示更均匀的稳定性。低协同性并非总是空间聚类,例如 LysM_1380的低稳定性更分散。这些结果表明,整体稳定的小蛋白仍可具有局部不稳定结构元件;这些局部低能开口可能对应特定激发态,而不是天然结构没有形成。

14.png

图3 低协同性结构域的不稳定残基聚集


协同性的结构决定因素


研究者对结构域进行建模,计算数千个序列和结构特征,并分析这些特征与整体稳定性、家族归一化协同性之间的Pearson相关。特征包括氨基酸组成、Rosetta能量项、AlphaFold置信度、二级结构预测、无序预测等。在ααα与ββαββ家族中,许多特征的相关性显著高于随机置换。Rosetta总能量、埋藏非极性表面积和ADOPT无序预测更强关联整体稳定性;而脯氨酸数、结构紧凑度、pLDDT、螺旋C端电荷等更能反映协同性差异。作者强调,这些相关性不能简单等同于因果关系,因为特征之间高度相关,且数据集中只包含能够折叠的蛋白;但这些分析仍揭示了开口协同性可能受到多个因素共同调控。

15.png

图4 与协同性相关的蛋白特征


预测稳定性和协同性


由于单一特征只能弱到中等程度解释稳定性和协同性,作者训练机器学习模型预测ΔGunfold与家族归一化协同性。模型使用工程化结构/序列特征、特征扩展与筛选策略,以及蛋白语言模型嵌入;采用Lasso和Ridge回归,并在序列聚类后的五折交叉验证中评估。稳定性预测表现较好,R²约0.40-0.53;但协同性预测较困难,最佳R²约0.16-0.24。蛋白语言模型嵌入最适合稳定性预测,而基于显式结构模型的可解释人工特征在协同性预测中表现更好。


设计突变提高协同性


作者选择低协同性蛋白HHH_rd4_0518和EEHEE_rd4_0871,利用家族特异模型寻找能增加开口协同性且保持或提高稳定性的双突变。模型预测这种突变很少,仅约占所有可能突变的4-6%,因此实验验证具有挑战性。研究者各选70个模型推荐双突变和70个随机双突变进行实验。结果显示,设计突变通常能提高开口协同性,虽然有时会牺牲整体稳定性;但仍有多个设计突变同时改善稳定性和协同性。HHH_rd4_0518中,位于不稳定C端螺旋的R35、G45、R39等位点反复出现有效突变;EEHEE_rd4_0871中,K21、K31、H41等位点也能调节局部稳定性。HDX NMR进一步证实HHH_rd4_0518_R35D_G45L突变体提高了整个蛋白的稳定性,尤其最大幅度提高最不稳定的α3螺旋。结果说明,通过数据驱动模型可以探索序列空间,找到能工程化蛋白能量景观的突变。

16.png

图5 数据驱动设计改善开口协同性

讨论

本文的核心贡献是使蛋白质构象涨落的能量细节能够在前所未有的规模上被实验测量。研究揭示了3590个设计和天然结构域中隐藏的能量景观差异,说明同一家族、相同折叠或相似整体稳定性的序列仍可有截然不同的局部开口行为。

作者总结了几个关键发现:第一,序列差异造成的家族内能量景观差异常超过不同折叠家族之间的平均差异;第二,低协同性蛋白往往有整段二级结构远低于整体折叠稳定性;第三,整体稳定性与局部稳定性可以部分解耦,即最稳定的蛋白不一定在全结构范围内都最稳定;第四,即使获得大规模数据,构象涨落仍比天然结构或整体稳定性更难预测。

局限性方面,mHDX-MS推断依赖对背交换、pH合并和EX2动力学的近似;自动化数据处理也可能带来误差。该方法在完整蛋白水平测量,不能直接定位每个结构域中的高/低稳定片段,需要结合HDX NMR等位点分辨方法。作者认为,未来随着数据规模扩大、残基分辨技术和机器学习模型改进,蛋白质能量景观将逐渐变得可预测和可设计。

参考链接:

https://doi.org/10.1038/s41586-026-10465-z



声明:本文系药方舟转载内容,版权归原作者所有,转载目的在于传递更多信息,并不代表本平台观点。如涉及作品内容、版权和其它问题,请与本网站留言联系,我们将在第一时间删除内容

更多 官方公告