快速发布企业信息
当前位置:首页行业资讯政策法规专家解读

Nature正刊重磅|IF=109!第一个100%成功的药物结合蛋白设计算法横空出世!超级王炸来了:超越现有方法10000倍

2026-06-30 17:49:32来源:药方舟浏览量:5


小分子结合蛋白的从头设计长期是蛋白质设计领域最难啃的问题之一。与蛋白-蛋白或蛋白-肽相互作用相比,小分子配体不仅化学类型更复杂,还要求蛋白序列、三维骨架和配体构象三者同时匹配;传统计算方法往往先把配体放进预设骨架,再进行序列设计,容易卡在局部构象或依赖大规模实验筛选。对于药物递送、解毒剂、传感器和催化酶等应用而言,如果能直接设计出高亲和力、强特异性的药物结合蛋白,就等于为小分子药物增加了一套可编程的“识别外壳”。
Dana-Farber Cancer Institute 与 Harvard Medical School 的 Nicholas F. Polizzi团队开发了 neural iterative selection-expansion(NISE)闭环算法,将负责“给定蛋白-配体共结构设计序列”的 LASErMPNN 与负责“给定序列和配体预测共结构”的结构预测模型连接起来,反复进行扩增、筛选和再设计。该方法在 exatecan 和 apixaban 两种化学性质不同的小分子药物上分别取得 100% 和 83% 的实验命中率,最优结合蛋白达到纳摩尔至皮摩尔亲和力;其中 exatecan 结合蛋白 EPIC 后续经 LASErMPNN 神经校对后亲和力提高100 倍,并能在生理条件下保护易水解的内酯环至少 50 h。相关研究以“Zero-shot design of drug-binding proteins via neural iterative selection−expansion”为题,发表在 Nature 正刊
1.png

Fig.1 NISE把小分子结合设计变成闭环自一致优化

研究团队将小分子结合蛋白设计重构为一个三元自一致性问题:设计出的序列不仅要能折叠回目标蛋白骨架,还要让配体在预测共结构中回到预期结合位点。NISE 的核心流程是先对给定骨架和配体坐标采样大量序列,再用 RFAA 或 Boltz-2 预测每条序列对应的蛋白-配体共结构,筛选出骨架 r.m.s.d. 和配体 r.m.s.d. 较低、配体 pLDDT 较高的候选作为下一轮输入。这样,算法并不是用能量函数强行微调一个固定口袋,而是在序列、骨架和配体构象之间反复“互相解释”。在与能量函数版本的迭代选择-扩增流程比较时,神经网络闭环能够同时提高配体置信度并降低序列负对数似然,说明它确实在向训练数据所代表的高概率蛋白-配体共结构区域移动。
2.png

Fig. 2 LASErMPNN学习配体条件下的序列与侧链几何

为了让闭环中的序列设计真正“看见”小分子,作者训练了ligand-aware sequence engineering message-passing neural network(LASErMPNN)。该模型以蛋白骨架原子和配体原子构成异质图,配体节点来自预训练的配体编码器,序列解码时同步预测氨基酸身份和侧链二面角。与去除配体信息的 protein-only 模型相比,LASErMPNN 在测试集结合位点序列恢复上表现更好,平均恢复率从 0.54 提高到 0.61;与重新训练的 LigandMPNN 相比也略高(0.61 vs 0.57)。更严格的测试中,研究者将链霉亲和素折叠从训练集中完全剔除,LASErMPNN 仍能给野生型单体链霉亲和素高概率评分,并在 PiB-rucaparib 体系中把原始高亲和力 PiB 序列排到 1,001 个候选中的第 4 位,提示该网络不仅能恢复训练集中常见模式,也能识别真实小分子结合口袋所需的侧链化学环境。
3.png

Fig. 3 EPIC从零设计出能包埋exatecan的四螺旋束

exatecan 是喜树碱类抗癌药和抗体偶联药物常用 payload,活性依赖闭环内酯结构,但在生理 pH 和血浆中会快速水解,游离药物约 2 h 半衰期即转化为活性较低的羧酸开环形式。作者先用计算生成的单链四螺旋束作为骨架,将 exatecan 构象 dock 到中心空腔,再比较传统 COMBS-Rosetta 设计与 NISE 闭环优化。NISE 从去除原始序列后的骨架-配体坐标出发,经过 35 轮 LASErMPNN 设计和 RFAA 共结构预测,重塑了螺旋局部几何、螺旋-螺旋界面和配体埋藏深度。实验表达的 4 个 NISE 设计全部能结合 exatecan,Kd 范围为 0.12-17 微摩尔,其中最佳设计 EPIC 的 Kd 为 0.12 ± 0.03 微摩尔,比人血清白蛋白强约360 倍,也比最佳传统设计(Kd = 8 ± 0.7 微摩尔)强约 70 倍。更重要的是,EPIC 对 FL118、belotecan、camptothecin 的结合逐步减弱,对irinotecan、apixaban 和 dexamethasone 基本不结合,说明仅依靠正向设计就塑造出了较强的药物特异性。
4.png

Fig. 4 神经校对把EPIC亲和力推进到纳摩尔级

在获得 EPIC 后,作者进一步测试 LASErMPNN 是否能在没有实验结构输入的情况下进行“神经校对”。他们先用 Amber 对 EPIC 设计模型进行能量弛豫,使 exatecan 更深进入口袋并诱导邻近骨架轻微移动,然后把新的骨架和配体坐标输入 LASErMPNN,逐位评估当前氨基酸在全序列上下文中的概率。模型提出 Q51N 和 M97L 两个替换:单突变 EPIC(Q51N) 和 EPIC(M97L) 的 Kd 分别降至 8.0 ± 1.6 nM 和 7.4 ± 0.7 nM,双突变 EPIC(Q51N/M97L) 进一步达到 1.2 ± 0.2 nM,相比 EPIC 提升约 100 倍。晶体结构验证显示,EPIC 与 exatecan 复合物的整体骨架与设计模型高度一致,蛋白 Cα r.m.s.d. 约 0.8 Å;Q51N 后 Asn51 更短的侧链使配体进一步下沉,并与 exatecan 羟基和内酯羰基形成双齿氢键。这个结果把 NISE 从“能出命中”的设计算法推进到“能自我优化”的亲和力成熟工具。
5.png

Fig. 5 设计口袋让exatecan闭环活性态稳定数十小时

EPIC 的功能意义不只在于结合强,而在于它解决了 exatecan 的化学稳定性问题。光谱实验显示,在 PBS pH 7.4、室温条件下,游离 exatecan 会从闭环内酯态逐渐转化为开环羧酸态,约 6 h 接近完成;加入高浓度 HSA 虽然能结合药物,却不能阻止水解,最终仍以开环或蛋白结合开环形式为主。相反,EPIC 通过把内酯环埋入口袋、隔绝溶剂,显著延缓开环反应;EPIC(Q51N/M97L) 保护作用更强,在 PBS 中至少 50 h 内超过 99% 的 exatecan 仍保持闭环状态,且在 500 微摩尔 HSA 存在时也能维持保护效果。这说明设计蛋白不仅可以作为药物载体或清道夫,还可能通过定制口袋直接控制小分子的化学命运。
6.jpg

Fig. 6 同一闭环策略还能生成皮摩尔级apixaban结合蛋白

为了证明 NISE 不依赖特定骨架或特定药物,作者又把目标换成临床抗凝药 apixaban,并使用与既往研究相同的 NTF2 折叠骨架作为起点。此前 LigandMPNN-Rosetta 方案在 9,024 个测试设计中仅得到 4 个结合体,最佳 Kd 为 680 nM;COMBS 四螺旋束方案最佳 Kd 为 600 nM。这里研究团队先用刚性随机 docking 将 apixaban 放入 50 个 Boltz-2 预测的 NTF2 骨架,再用 LASErMPNN 和 Boltz-2 执行 14-28 轮 NISE 优化,最终选择 6 条多样化序列表达验证。结果 5/6 个设计达到 Kd < 50 nM,最佳apixaban-binding protein exemplar(APEX)与 apixaban 的 Kd 为 80 pM(95% CI 54-122 pM),与天然靶点 factor Xa 的 Ki(80-700 pM)相当,但蛋白大小仅约 13 kDa,约为 factor Xa 的三分之一。APEX 对 exatecan 无可检测结合,且预测口袋由主链和侧链氢键共同识别 apixaban,说明NISE 能在不同折叠上找到新的结合解,而不仅是复刻天然靶点或既有设计。



更多 官方公告