2021.3.17丨致病菌毒力因子(VFDB)数据库注释

article/2025/8/26 17:55:11
  • 摘要
    • 接到一个常规细菌的组装注释项目,不过客户提出想要获取关于组装结果与病毒之间的联系/按之前的操作,dfast没有病毒相关的数据库,无法满足客户需求。一番查阅,发现大家用这个VFDB数据库进行常规的病毒注释,下面将介绍一下使用该数据库进行注释的过程。由于比对工具diamond之前没有介绍过,此次也将一并介绍。
  • 介绍
    • DIAMOND简介
      • DIAMOND是用于蛋白质和翻译DNA的搜索序列比对工具,旨在用于大序列数据的高性能分析。
      • 主要功能包括:
        • BLAST以100x-10,000x的速度对蛋白质和翻译的DNA进行成对比对。
        • 移码比对,用于较长读段分析。
        • 资源需求低,可以在标准台式机或笔记本电脑上运行。
        • 各种输出格式,包括BLAST成对,表格和XML,还可以进行标准分类。
    • VFDB数据库简介
      • 毒力因子(Virulence factor,VFs)指由细菌,病毒,真菌等代谢产生的带有侵袭力和毒素等毒力性质的分子,主要用于微生物感染宿主时,通过抑制或逃避宿主的免疫反应等出入宿主组织细胞,并从宿主获得营养及自身增殖生长的目的。毒力因子可编码在可移动遗传元件(比如质粒、基因岛、噬菌体等)上并进行水平基因转移(传播),使无害细菌变成危险的病原菌,所以在鉴定毒力因子时一般会考虑基因岛、分泌蛋白等。
      • 病原菌毒力因子数据库 VFDB 由中国医学科学院研发,收集整理了24个属100多种重要医学病原菌已知毒力因子的组成、结构、功能、致病机理、毒力岛、序列和基因组信息等内容,被广泛应用于毒力因子基因鉴定。
  • 材料与方法
    • 环境配置
      • Version:Linux version 3.10.0-1160.15.2.el7.x86_64 (mockbuild@kbuilder.bsys.centos.org) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-44) (GCC) ) #1 SMP Wed Feb 3 15:06:38 UTC 2021
        cat /proc/version
      • CPU(s): 64
        lscpu
        • 型号名称: Intel(R) Xeon(R) Silver 4216 CPU @ 2.10GHz
      • Mem: 256G
        free -g
        • Swap: 15G
          交换内存,一般设置为0-10
    • DIAMOND安装使用
      • 安装方式
        • conda安装:conda install diamond
        • 下载安装包:GitHub - bbuchfink/diamond: Accelerated BLAST compatible local sequence aligner.
    • VFDB数据库使用
      • 官网地址:http://www.mgc.ac.cn/VFs/ 在官网下载数据库时,带有setA 的库为VFDB数据库核心库(set A),而setB为全库(setB), 其中setA仅包含经实验验证过的毒力基因,而setB则在setA的基础上增加了预测的毒力基因,选择好数据库后,直接用blast即可完成注释。
      • 下载setA库:http://www.mgc.ac.cn/VFs/Down/VFDB_setA_pro.fas.gz
    • 构建数据库
      • gunzip VFDB_setA_pro.fas.gz #解压缩
      • diamond makedb --in /home/yangxin/db/vfdb/VFDB_setA_pro.fas --db /home/yangxin/db/vfdb/VFDB_setA #构建数据库
      • diamond blastp -db VFDB_setA_pro.fas.dmnd --query protein.fa --out vf_anno.txt #进行数据库比对注释
  • 结果展示
    • 本地注释结果
      • 结果说明
    • 在线注释
      • 本地注释的结果没有很好体现了毒力因子的基因名称以及相关描述,后来又使用VFDB在线BLASTP进行注释,得到了另一个结果。注释链接:VFDB: Virulence Factors of Bacterial Pathogens (mgc.ac.cn)
      • 注释结果
        • 该表格为网络视图复制粘贴后进行了分列处理得到的结果,对于客户而言更加直观。于是将该表格作为注释交付结果。
  • 总结
    • 尽管在线工具方便,但毕竟需要手动处理。还是建议探索本地分析,能够更好构建分析流程。
  •  

http://chatgpt.dhexx.cn/article/CS9laxjH.shtml

相关文章

【TP5】获取数据库注释信息

author:咔咔 wechat:fangkangfk table为表名 $data Db::query(SHOW FULL COLUMNS FROM .$table);

SpringBoot中使用Mybatis逆向工程(实体类含数据库注释)

Mybatis逆向工程:根据创建好的数据库表,生成对应的实体类、DAO、映射文件 文章目录 开发环境1.新建SpringBoot应用2.添加逆向工程插件依赖3.执行逆向生成 开发环境 开发工具:IntelliJ IDEA 2021.3.3 (Ultimate Edition)SpringBoot版本&#…

达梦数据库中注释的使用

在管理规模较大的数据库时,我们往往需要面对大量的表与视图,与此同时在表与视图中可能会存在着许多的字段,让人难以迅速分辨,不利于对于数据库对象的管理。除了在命名时,对于有意义的表、视图及列,应尽量赋…

达梦数据库注释的使用方法

在管理规模较大的数据库时,我们往往需要面对大量的表与视图,与此同时在表与视图中可能会存在着许多的字段,让人难以迅速分辨,不利于对于数据库对象的管理。除了在命名时,对于有意义的表、视图及列,应尽量赋…

数据库注释符

数据库注释符 MySQL数据库支持3中注释: 从‘#’字符到结尾;从‘- -’序列到结尾(‘- -’要求第二个破折号后面至少跟一个空格);从/*到*/,可跨行; 例:

k8s安装kuboard面板

前面介绍了k8s的dashboard面板,这里介绍国人开发的kuboard面板,相较于dashboard面板,kuboard面板对很多运维调试功能做了很多增强。 官方文档:https://www.kuboard.cn/install/v3/install.html#kuboard-v3-x-%E7%89%88%E6%9C%AC%E…

[CKA]考试之K8s 版本升级

由于最新的CKA考试改版,不允许存储书签,本博客致力怎么一步步从官网把答案找到,如何修改把题做对,下面开始我们的 CKA之旅 题目为: Task 现有的Kubernetes 集群正在运行版本1.22.0。仅将master节点上的所有 Kuberne…

k8s kuboard-部署skwalking-es

1.导入变量 前提安装:helm export SKYWALKING_RELEASE_NAMEskywalking export SKYWALKING_RELEASE_NAMESPACEskywalking 2.添加仓库 export REPOskywalking helm repo add ${REPO} JFrog 3.安装部署 helm install "${SKYWALKING_RELEASE_NAME}" ${REPO}/…

Kuboard Spray+Kuboard搭建k8s集群

使用Kuboard Spray搭建k8s集群 服务器环境 使用3台centos7.6系统虚拟机,4核4g内存,使用最小化安装系统,并修改配置好网络 k8s版本1.23.12,docker版本20.10.18,集群角色规划如下 192.168.2.101 k8s01 master,etcd,wor…

k8s-RBAC

一、认证及sa 1.进入到证书目录 cd /etc/kubernetes/pki/2.创建kxq用户的私钥 (umask 077; openssl genrsa -out kxq.key 2048 )3.创建kxq用户的证书 openssl req -new -key kxq.key -out kxq.csr -subj "/CNkxq"4.利用ca.crt,ca.key进行签证 [rootm…

【Kubernetes系列】Kubernetes管理工具Kuboard的安装使用

目录 一、Kuboard 简介二、安装方式三、安装四、升级1.停止已有 kuboard 容器2.使用新版本的镜像启动 kuboard 五、访问 一、Kuboard 简介 Kuboard 是一款专为 Kubernetes 设计的免费管理界面,提供了丰富的功能,结合已有或新建的代码仓库、镜像仓库、CI…

linux下kegg注释软件,工具篇丨GO和KEGG富集不到通路?快试试这个超赞的功能分析工具吧...

原标题:工具篇丨GO和KEGG富集不到通路?快试试这个超赞的功能分析工具吧 i生信 专注生物分析最前沿 定期解读生信文章 提供生信分析思路和套路 方便大家短平快发SCI GO和KEGG富集分析是我们在筛选出差异表达基因之后,都会去做的套路性分析。然鹅……我相信,总有那么一些“倒…

Kubernetes: Overview, Kaniko Helm

文章目录 OverviewConceptHardware1. Node2. Cluster3. Persistent Volumes Software1. Container2. Pod3. Deployment4. Ingress Kanikousing dockerusing k8s Helm Overview **kubelet: **An agent that runs on each node in the cluster. It makes sure that containers ar…

Kubernetes-Kuboard

前言 本篇是Kubernetes第十五篇,大家一定要把环境搭建起来,看是解决不了问题的,必须实战。 Kubernetes系列文章: Kubernetes介绍Kubernetes环境搭建Kubernetes-kubectl介绍Kubernetes-Pod介绍(-)Kubernetes-Pod介绍(二)-生命周期Kubernete…

Kuboard

安装 Kuboard 之前,假设: 您已经准备好了一个 Linux 服务器用于安装 Kuboard-V3,并且该机器上的 docker 版本不低于 19.03用于安装 Kuboard v3.x 的机器已经安装了 docker,并且版本不低于 docker 19.03您已经有自己的 Kubernetes…

KEGG数据库以及 KAAS 网站注释

1. KEGG 现在自己用到的KEGG数据库主要是功能注释,下面谈一下我再用KEGG 时候的经验吧。 首先在kaas上传数据做基因的注释。 我们用的是prokka注释过后的faa文件:是蛋白序列。 当然基因序列也可以。 kaas 比对网站 https://www.genome.jp/tools/kaas/ 得…

0055-【生物数据库】-如何进行RNA差异基因KEGG注释分析-kobas在线分析

1. 有参物种使用gene ID的方法 1. 差异基因文件准备 只需要用到两列 ENTREZ_GENE_IDlogFC geneNames ENTREZ_GENE_ID normalAve tumorAve logFC pValue qValue CCL23 6368 95.05964624 5.566645819 -4.066608903 2.07E-31 5.99E-29 COLEC10 10584 …

富集分析:(一)概述

(全文约6600字) 1. 富集分析 1.1. 富集分析概念 富集分析 富集分析,本质上是对数据的分布检验,如果分布集中在某个区域,则认为富集。 常用的分布检验方法有卡方检验、Fisher精确检验以及KS检验等方法。 生物信息…

NAR|北大/中科院计算所团队发布基因功能富集分析平台KOBAS-i

近日,国际知名期刊《核酸研究》(Nucleic Acids Research,IF:16.971)在线发表了北京大学孔雷课题组与中国科学院计算技术研究所赵屹研究员课题组合作开发的基因功能富集平台KOBAS-i (网址http://kobas.cbi.pku.edu.cn/ 或http://bioinfo.org/kobas)&#…

linux下kegg注释软件,网页工具KOBAS进行KEGG富集分析

KOBAS的介绍 KOBAS是北大生物信息中心研发的一个网页工具,用来基因/蛋白功能注释(注释模块)和功能基因集富集(富集模块)。以下是KOBAS的英文介绍: KOBAS 3.0 is a web server for gene/protein functional annotation (Annotate module) and functional …