利用pymol批量对PDB文件三维结构比对并输出RMSD值

article/2025/7/18 11:21:37

经验上、文献上大量的蛋白质或者核酸比对工作是从一级序列开始的,这是基于一级序列决定二级结构,二级结构决定三级结构,而且一级序列有30%的相似性,那么两者的结构就具有较高的相似性这样的共识理论而来,这些理论也是基于现有的实验数据得来的,然而也存在很多例外的情况,如相似度高的蛋白序列,三级结构差异较大,或者相似度低的蛋白序列却具有较高的三级结构,又或者一些理论认为柔性蛋白可能具有更好的蛋白热稳定性,刚性太强反而在更剧烈的环境中更容易崩溃。这些反常识的理论反而更容易让人深思,如决定蛋白功能的到底是一级序列还是三级结构。

      因此本章内容从三级结构比对开始摸索目标蛋白可能在某个环境中与那些蛋白可能有相同或者类似功能。

一、pdb文件下载

1)获取pdb文件

     在pdb数据库https://www.rcsb.org/,搜索关键词或者序列,然后在左侧选择物种、精度、结构获取方法等可定制自己的需求。然后在右上侧selected处点击下载符号。

图片

2)之后全部复制下面文本框中的pdb名,保存备用。

图片

3)代码读取pdb并下载pdb文件:

import requests
from tqdm import tqdm
#读取pdb名称
f = open("/home/lxh/Documents/Lysin/E.coil_protein/Ecoil_protein","r")
for a in f.readlines():a = a.split(",")for b in tqdm(a):request = requests.get("https://files.rcsb.org/download/" + b + ".pdb")if request.status_code != 404:#判断有pdb文件才会下载,没有就跳过,防止报错wget.download("https://files.rcsb.org/download/" + b + ".pdb","F:/biosoftware/gromacs/pymol/mutation/" + b + ".pdb")

 二、处理pdb文件用于后续三维结构比对


import os
for c in os.walk("F:/biosoftware/gromacs/pymol/mutation"):c = c[2]#去水并多聚体变单聚体
for a in c:if a[-3:] == "pdb":f = open("F:/biosoftware/gromacs/pymol/mutation/" + a,"r")f1 = open("F:/biosoftware/gromacs/pymol/structure_align/" + a,"a+")for b in f.readlines():f1.write(b)if b.split()[0] == "TER":breakf.close()f1.close()

三、计算目标蛋白和其余蛋白的RMSD

   注意此代码用于python中,后续生成的文件可以在pymol中运行


import os
for c in os.walk("F:/biosoftware/gromacs/pymol/structure_align"):c = c[2]f = open("F:/biosoftware/gromacs/pymol/三级结构比对.txt","w")
f.write("from pymol import cmd" + "\n" + "load F:/biosoftware/gromacs/pymol/GS4_CBD.pdb" + "\n" + 'output = open("E:/李小红资料/裂解酶治疗血流感染课题/protein/a.txt","w")' + "\n")
for a in c:if a[-3:] == "pdb":f.write("load F:/biosoftware/gromacs/pymol/structure_align/" + a + "\n" + 'output.write("' + a + '" + "  " + str(cmd.align("GS4_CBD","' + a[0:-4] + '")[0]) + ''"   "'' + str(cmd.align("GS4_CBD","' + a[0:-4] + '")[6]))' + "\n" + "delete " + a[0:-4] + "\n")f.write("output.close()" + "\n")
f.close()

四、筛选三维结构相似度高的PDB文件

    将比对氨基酸较多(n),RMSD值较低(m)的值打印输出,然后为了保证结果可靠,可在pymol中肉眼观察下选中的几个pdb是否和目的蛋白三维结构具有较高的相似性。

#筛选相似度高的pdb
def similar(m,n):f = open("E:/资料/血流感染课题/protein/a.txt","r")for a in f.readlines():if (float(a.split()[1]) < m) & (float(a.split()[2]) > n):print(a)f.close()

 将选中的三维结构具有高相似度的pdb在rcsb pdb数据库以及NCBI上查找其蛋白名称以及功能作用。大概推测目标蛋白可能具有选中蛋白的生物学功能。

图片

 


http://chatgpt.dhexx.cn/article/Kyq3xcak.shtml

相关文章

AMBER:使用Cpptraj计算RMSD 以及使用中遇到的问题

记录笨比生活又一天 输入文件rms.in设置运行cpptraj遇到的问题1.cpptraj不输出结果2.空格的问题 Tofirst:[空格]1-249&!H firstTofirst[空格]:1-249&!H first 输入文件rms.in设置 parm XXXXX.prmtop #载入拓扑文件 trajin XXXX_prod.nc #载入轨迹文件 rms ToFirst …

分子动力学模拟Amber/Gromacs结合自由能计算 药效团模型构建RMSD、RMSF

文章来源:公众号“科研讨论圈” 以下是使用AMBER、GROMAVCS的教程,希望对开始学习分子动力学的同学有帮助。 分子动力学入门理/论 分子力学简介 分子…

RMSD:通过旋转计算两个分子间的最小rmsd

使用旋转计算两个分子的均方根偏差&#xff08;RMSD&#xff09; 使用Kabsch算法&#xff08;1976&#xff09;或Quaternion算法&#xff08;1991&#xff09;进行旋转&#xff0c;在两个笛卡尔坐标之间.xyz或者.pdb格式中计算均方根偏差&#xff08;RMSD&#xff09;&#xf…

PSP - TMScore(US-align)、RMSD、Sequence 源码

欢迎关注我的CSDN&#xff1a;https://spike.blog.csdn.net/ 本文地址&#xff1a;https://blog.csdn.net/caroline_wendy/article/details/129125467 参考文档&#xff1a;Nature Methods | 蛋白、RNA、DNA及其复合物结构的比对算法US-align 官网地址&#xff1a;https://zha…

基于Gromacs的蛋白分子动力学模拟(RMSD、RMSF及蛋白的回旋半径)

一、实验要求 实验对象&#xff1a;目标体系为modeller或其他方法建模的结果中评价最好的模型。 软件&#xff1a; Gromacs-5.1.2 二、实验步骤 加立场 gmx pdb2gmx –h 打开帮助菜单。 选力场的时候选择 Amber99sb…,溶剂类型选Tip3p。 2、加模拟盒子&#xff0c;溶剂层…

RMSD与PMSF 解释与区别

我不需要力量源泉 对我来说 这只是需要完成的一件事&#xff0c;我应该一直全力以赴的做下去 放弃不是我的天性&#xff0c;我甚至不在乎乐观还是悲观。 二者都是对位移的平方和再求平方根&#xff0c;最后求得均值。区别在于&#xff1a;RMSD为在同一帧情况下&#xff0c;对不…

pymol pymol-align两分子或蛋白距离误差计算RMSD;spyrmsd库计算RMSD

参考&#xff1a;https://zhuanlan.zhihu.com/p/347743101 https://www.codenong.com/cs106148400/ RMSD 单位是埃 RMSD,root-mean-square deviation&#xff0c;也就是均方根偏差。 原子位置的均方根偏差是叠加蛋白质的原子&#xff08;通常是骨架原子&#xff09;之间的平均…

RMSD和RMSF

RMSD&#xff0c;Root Mean Square Deviation&#xff0c;均方根偏差&#xff1b;RMSF&#xff0c;Root Mean Square Fluctuation&#xff0c;均方根波动。 在轨迹分析中&#xff0c;最经常用&#xff0c;最简单&#xff0c;也最有用的就是这两巨头&#xff0c;二者都是对位移的…

统计学常用指标

目录 标准差(SD)均方根误差(RMSE/RMSD)均方误差(MSE/MSD)平均绝对误差(MAE)决定系数/拟合优度(R^2)平均偏差(Bias) 标准差(SD) 标准差&#xff08;StandardDeviation&#xff09;&#xff0c;在概率统计中最常使用作为统计分布程度&#xff08;statisticaldispersion&#xff…

Excel如何查找批注

Excel查找的选项&#xff0c;查找范围选择批注就可以了

Excel 打印显示批注(亲自实践)

有时候需要将Excel中的批注,随同正文一起打印出来 方法如下: 1.右键有批注的单元格,选择"显示/隐藏批注" 2.选择"分页预览"模式显示工作表 3.右键任意单元格,选择"页面设置" 4.在"页面设置"窗口中,标签"工作表"的&quo…

excel中深入理解批注

excel中深入理解批注 系统要求一、单个批注二、所有批注三、形状修改四、插入图 系统要求 装有office2010以上版本功能&#xff1a;批注 一、单个批注 右击显示或隐藏批注 显示表示批注不退出&#xff08;鼠标移开时&#xff09; 二、所有批注 审阅显示或隐藏批注 三、…

Excel中批量添加批注图片

excel中想实现这种悬停时显示图片的效果 1、将图片与单元格命名一致&#xff0c;并将图片与excel文件放置在同一目录下 2、选中需要设置的单元格&#xff0c;点击【开发工具】 -查看代码&#xff08;如果没有开发工具往下看&#xff09; 3、在编辑框中输入以下代码并运行 Sub …

Excel技能之批注超链接,你竟然真的不会用

资源整合是新时代职场人的顶配。资源整合&#xff0c;可以快速查找想要的资源。一个目录&#xff0c;如果包含了所有相关的内容&#xff0c;那么&#xff0c;价值是宝贵的。点击目录打开对应的内容&#xff0c;离不开超链接。超链接&#xff0c;改变了互联网&#xff0c;也改变…

Excel表格中重要的数据如何隐藏不显示

Excel表格中重要的数据如何隐藏不显示 目录 Excel表格中重要数据值如何隐藏不显示 1、选中需要隐藏的单元格数值 2、鼠标右键 点击“设置单元格格式” 3、点击“自定义”在“类型”一栏中输入三个“;”号即可&#xff08;输入法切换在英文状态输入分号&#xff09;。 4、想…

关于poi/Npoi创建批注后,EXCEL不能显示,wps能显示的问题(2020-08-25)

一般百度到这个&#xff1a; https://blog.csdn.net/zyr2206328732/article/details/48341191 实测不是作者描述的原因。 我的需求上&#xff1a;在列名&#xff08;一个集合&#xff09;增加注释。 代码如下&#xff1a;Row headRow sheet.createRow(0);XSSFDrawing drawing…

esayExcel自定义注解导出表头批注

注解 package com.baidu.activitidemo.annotation;import com.baidu.activitidemo.handler.ExcelRemarkHandler;import java.lang.annotation.*;/*** 设置表头的批注, 需要配合{link ExcelRemarkHandler}使用** author li* date 2022/09/24*/ Target(ElementType.FIELD) Reten…

把Excel批注的“红三角”放在单元格左上角_Excel的批注功能,全部知道的不足10%,你会用的仅仅是冰山一角...

Excel【审阅】功能区中,显示了5个最基本的功能,如下图红色矩形框所示,这也是我们最常用的基础。其实,Excel中批注的相关操作远不止这些,一起来看看。 插入删除批注 【插入批注】 插入批注的方法常见的有这3种: ❶ 【审阅】→【新建批注】。 ❷ 单元格点击右键,插入批注。…

Excel批注教学:一键添加多个不同批注

今天要和大家分享的是Excel一键添加多个不同批注&#xff0c;看下面终端经销商反馈函件的统计表&#xff0c;想把最后一列的反馈情况&#xff0c;对应的添加为经销商的批注内容&#xff0c;如何操作呢 &#xff08;方方格子插件&#xff09; 1.选中需要添加批注的单元格 ​ 2.…

word保存html格式批注没有了,word批注不见了 怎么显示批注

为什么word批注里的字都没有了,怎么恢复? 文档处于修订状态,需要关闭它。 在退出修订模式前需要作以操作:1、接受或拒绝修改:审阅--更改--接受/拒绝,根据需要进行设置;2、显示最终状态:审阅--修订--显示最终状态(显示以供审阅),选择“最终状态”;退出修订模式:审阅--…