PSCP~

article/2025/9/21 2:51:13

PSCP 深度架构 AttnPacker——大幅优化的AI算法。

蛋白质结构和功能的形成,很大程度上取决于侧链原子间的相互作用,因此,精准的蛋白质侧链预测(PSCP)是解决蛋白质结构预测和蛋白质设计难题的关键一环。但此前蛋白质结构预测大多聚焦于主链结构,侧链结构预测始终是一个未被完全解决的难题。

近日,分子之心许锦波团队推出一种新的 PSCP 深度架构 AttnPacker,在速度、内存效率和整体精度方面取得大幅提升,是目前已知的最优侧链结构预测算法,也是全球首创的可同时进行蛋白质侧链预测和序列设计的 AI 算法。

论文发表在《美国科学院院刊》(PNAS)上,其预训练模型、源代码和推理脚本都已在 Github 上开源。

  • 论文链接:https://www.pnas.org/doi/10.1073/pnas.2216438120#supplementary-materials

  • 开源链接:https://github.com/MattMcPartlon/AttnPacker

蛋白质由数个氨基酸折叠而成,其结构分为主链和侧链。侧链的差异性对蛋白质的结构与功能有巨大影响,尤其是生物活性。基于对侧链结构的清晰认知,科学家们能够更精准地测定蛋白质三维结构,解析蛋白质 - 蛋白质之间的相互作用,并进行理性蛋白设计。应用到药物设计领域,科学家们便能更快、更准确地找到适合药物与受体的结合点位,甚至根据需要优化或设计结合点位;在酶优化领域,科学家们可以通过对序列的优化改造,让多个侧链参与催化反应,实现更高效、特异性更高的催化效果。

当前大多数蛋白质结构预测算法主要针对主链的结构解析,但蛋白质侧链结构预测还是一个未被完全突破的难题。无论是 AlphaFold2 等热门蛋白质结构预测算法,还是 DLPacker、RosettaPacker 等专注侧链结构预测的算法,准确度或速度都不尽如人意。这也为蛋白质设计带来了限制。

传统方法,如 RosettaPacker,主要使用能量优化方法,先对侧链原子的分布进行分组,再针对某个特定氨基酸来搜索侧链的分组,寻找能量最小的组合。这些方法主要区别于研究者对旋转异构体文库、能量函数和能量最小化程序的选择,准确性受限于对搜索启发式方法和离散抽样程序的使用。业界也有基于深度学习的侧链预测方法,如 DLPacker,它将 PSCP 表述为图像到图像的转换问题,并采用了 U-net 模型结构。但预测精度和速度依然不够理想。

方法

AttnPacker 是一种端到端的预测蛋白质侧链坐标的深度学习方法。它联合模拟了侧链相互作用,直接预测的侧链结构在物理上更可行,具有更少的原子碰撞和更理想的键长和角度。

具体而言,AttnPacker 引入了一种利用 PSCP 的几何和关系方面的深度图转换器架构。受 AlphaFold2 启发,分子之心提出了位置感知三角形更新,以使用基于图形的框架来计算三角形注意力和乘法更新,从而优化成对特征。通过这种方法,AttnPacker 的内存显著减少并拥有更高容量的模型。此外,分子之心探索了几种 SE (3) 等变注意力机制,并提出了一种用于从 3D 点学习的等变变换器架构。

AttnPacker 运行流程。以蛋白质主链坐标和序列作为输入,并基于坐标信息导出空间特征图和等变基。特征图由不变量 graph-transformer 模块处理,然后传递给一个等变的 TFN-Transformer 输出预测的侧链坐标、每个残基的置信度分数和可选的设计序列。预测坐标经过后处理,以去除所有空间冲突,并确保理想化的几何结构。

效果

在预测效果上,AttnPacker 对天然和非天然主链结构都显示出准确性和效率上的改进。同时保证了物理上的可行性,与理想键长和角度的偏差可以忽略不计,且产生了最小的原子空间位阻。

分子之心在 CASP13 和 CASP14 天然和非天然蛋白质主链数据集上对 AttnPacker 与目前最先进的方法 ——SCWRL4、FASPR、RosettaPacker 和 DLPacker 进行对比测试。结果显示,AttnPacker 在 CASP13 和 CASP14 天然主链上显著优于传统蛋白质侧链预测方法,平均重建 RMSD 比每个测试集上的次优方法低 18% 以上。AttnPacker 还超越了深度学习方法 DLPacker,平均 RMSD 降低了 11% 以上,同时也显著提高了侧链二面角精度。除了准确性,AttnPacker 的原子碰撞明显少于其他方法。

在 CASP13 和 CASP14 非天然主链上,AttnPacker 也明显优于其他方法,原子碰撞也明显少于其他方法。 

创新性地摈弃了离散的旋转异构体库以及计算上昂贵的构象搜索和采样步骤,直接结合主链 3D 几何结构来并行计算所有侧链坐标。AttnPacker 与基于深度学习的方法 DLPacker、基于传统计算方法的 RosettaPacker 相比,计算效率显著提高,减少了 100 倍以上的推理时间。 

AttnPacker 在蛋白质设计上的表现同样优秀。分子之心训练了一个 AttnPacker 变体用以协同设计,该变体可实现媲美当下最先进的方法的天然序列恢复率,同时还可生产高度精确的组装。Rosetta 模拟验证显示,AttnPacker 设计的结构通常会产生亚原生(更低的)Rosetta 能量。 

用 ESMFold scTM 和 plDDT 指标对比天然蛋白质序列和 AttnPacker 生成的序列,以评估 AttnPacker 的生成质量,结果表现出强相关性。  whaosoft aiot http://143ai.com 

除了效果和效率惊人之外,AttnPaker 还有一个非常实用的价值 —— 它非常易用。AttnPaker 只需要一个蛋白质的结构文件即可运行。相比之下,OPUS-Rota4 (28) 需要来自 DLPacker 的原子环境的体素表示、来自 trRosetta100 的逻辑、二级结构和来自 OPUS-CM 输出的约束文件。另外,由于 AttnPacker 直接预测侧链坐标,输出是完全可微分的,这有利于下游预测任务,例如优化或蛋白质 - 蛋白质相互作用。“预测效果好、效率高、易用,这些优势有利于 AttnPacker 在研究和工业领域的广泛使用。” 许锦波教授表示。

总结

1、AttnPacker 是一个用于直接预测序列和侧链坐标的 SE(3)等变模型,可以用于蛋白质侧链结构预测,也可用于蛋白质序列设计,是一项开创性的工作。

2、AttnPacker 的准确性优于其他方法,且效率大幅提升,并具备极高的易用性。

 


http://chatgpt.dhexx.cn/article/ymMpe7d9.shtml

相关文章

pscp上传下载文件

由于很多事情经常忘记,所以将其记录在博客上,写的比较简洁,若能帮到大家更好 1.win10搜索pscp >打开文件夹所在位置>空白处shit右键,打开powershell命令窗; 2.上传电脑文件到服务器如下: 3.下载服务…

pscp 传输文件

在执行的时候要打开 putty 并连接服务器,否则可能报错的。 上传文件 到 Linux 服务器 pscp.exe file root192.168.32.50:/root/ 将Linux服务器上的文件夹以及文件 下载到本地 pscp -r root182.254.247.191:/usr/lib/locale "c:\locale" 命令的使用方法 Pu…

pscp linux,windows下 pscp 安装及使用

pscp简要说明 pscp为window与Linux之间的文件传输工具,使用和Linux下scp命令相似。 pscp 安装 下载pscp 放到C:\WINDOWS\system32中,然后就可以在任何地方调用 image.png 远程传输到本地 pscp [options] [user]host:source target user:远程主机的用户名…

pscp无密传数据

pscp 是 PuTTY 带的工具,可用作 Windows 上的 scp 替代,就在 PuTTY 的安装目录,加入 PATH 就可以敲命令用。 无密上传/下载数据需要将公钥写入服务器,但是 PuTTY 用的公、私钥是 .ppk 的,不同于 ssh 的公、私钥&#…

PSCP 基本使用

PSCP 基本使用 问题: 如何免密码输入,传送数据 “sshpass is not recognized” on Windows" PSCP:是Putty的文件传输工具,用于两台电脑之间的文件传输 重点:可以在命令中添加密码, 不像SCP需要单独输…

使用 PSCP将文件从 Windows 计算机快速传输到 Linux计算机

导读开源的 PSCP 程序可以轻松地在 Windows 和 Linux 计算机之间传输文件和文件夹。 你是否正在寻找一种将文件从 Windows 计算机快速传输到 Linux计算机并再次传输回来的方法?开源的 PSCP 程序可以轻松传输文件和文件夹,当然它是开源的。 在 Windows 中…

PSCP工具的使用教程

PSCP:是Putty的文件传输工具,用于两台电脑之间的文件传输,一次只能传输一个文件,传输完毕后立刻终止会话。 配置好pscp工具的环境变量后,打开 Windows 命令行,输入 pscp 回车,可以看到该工具的…

mysql主从 动态ip_mysql主从配置(清晰的思路)

mysql主从配置。鄙人是在如下环境测试的: 主数据库所在的操作系统:win7 主数据库的版本:5.0 主数据库的ip地址:192.168.1.111 从数据库所在的操作系统:linux 从数据的版本:5.0 从数据库的ip地址&#xff1a…

Mysql主从配置步骤与各种错误

测试环境: 2台腾讯云服务器。CentOS 7.2 64位,1G,lnmp。 PHP:5.6;Mysql:5.5 两台干净的服务器 下面开始配置主服务器(master) 1.修改配置: log-bin mysql-bin 要打开,…

深入理解MySQL主从配置原理

目录 1. MySQL主从复制原理工作原理 2. 主从配置步骤1: 配置主节点2: 备份主节点数据3: 配置从节点4: 启动主从复制 3.常见问题4. 需要考虑的一些因素 MySQL主从复制是一种数据库复制技术,通过将一个MySQL服务器(主节点)上的数据同步到其他My…

MySQL主从配置教程

MySQL主从配置教程 1.首先要确保配置主从的两台服务器的数据一致,否则可能会导致主从配置成功但是数据不一致的现象。 2.修改两台机器的my.cnf,配置不同的server-id,修改后需要重启mysql服务。 3.在主库执行命令创建共享用户 # 注意以下所…

mysql主从配置vip地址_59.MYSQL主从配置

一、MySQL主从介绍 MySQL主从又叫做Replication、AB复制。简单讲就是A和B两台机器做主从后,在A上写数据,另外一台B也会跟着写数据,两者数据实时同步的 MySQL主从是基于binlog的,主上须开启binlog才能进行主从。 主从过程大致有3个…

windows中MySQL主从配置【第一篇】

前言: windows系统配置MySQL主从复制,系统中需要安装两个MySQL服务。我本地用的是集成环境,集成环境已经有一个MySQL服务,那么就需要自己在单独下载安装一个MySQL服务。本篇文章就是教如何下载、安装MySQL,最后…

docker容器下mysql主从配置

docker容器下mysql主从配置 知道的太多所以痛苦 文章目录 docker容器下mysql主从配置前言一、安装好docker容器二、docker配置mysql主从1.拉取mysql5.72.运行mysql镜像3.配置my.cnf文件4.重启mysql主从数据库5.从数据库开启同步 总结 前言 基于docker容器安装mysql并且配置主…

Linux mysql 主从 配置

在一篇文章《离线安装mysql数据库》,讲解了离线安装mysql数据库的过程,本文将讲解mysql数据库的主从配置方法。mysql数据库进行主从配置后,可以实现数据库的备份、同时应用也可以实现读写分离,提高应用的并发量。 1、主从原理 从《高性能my…

docker mysql 主从配置

准备:一台装有docker的虚拟机或者服务器 拉取mysql镜像: docker pull mysql:5.6 启动两个mysql容器 master docker run -p 1006:3306 --name mysql_master -v F:/mysql/mysql_master/conf:/etc/mysql -v F:/mysql/mysql_master/logs:/logs -v F:/mys…

mysql取消主从配置_mysql主从配置

搭建环境: master 192.168.127.131 slave 192.168.127.128 主从配置的前提:两个数据库的数据需要一模一样所以我们: 在主上面建立一个数据库 在这里我们用mysql备份一下 mysqldump db1 >123.sql (备份) 在主上面建立一个数据库db1需要登…

Mysql 主从配置

一、主服务称master,从服务器称slave 主服务器: master从服务器: slave 主从服务器必须要有相同的mysql配置,版本都需要一致,还需要建立一个一样的数据库。修改主服务my.cnf 配置文件 [rootlocalhost mysql]# vi /etc/my.cnf#主数据库端ID号…

mysql配置主从

一、部署mysql 1.1、先部署好两台mysql数据库,部署mysql可以查看我的文档 写文章-CSDN创作中心 二、开始配置mysql主从 2.1、主机配置 vim /etc/my.cnf 或者 vi /etc/my.cnf #增加一下配置 log-binmysql-bin server_id101 #选择增加的参数 binlog-do-db 数据库名…

mysql数据库主从配置

1、主从原理 主从原理大致有三个步骤: 在主库上把数据更改记录到二进制日志中(Binary Log)中,这些记录称为二进制日志事件。从库通过IO线程将主库上的日志复制到自己的中继日志(Relay Log)中。从库通过SQL线…