0055-【生物数据库】-如何进行RNA差异基因KEGG注释分析-kobas在线分析

article/2025/8/26 20:45:54

1. 有参物种使用gene ID的方法

1. 差异基因文件准备

只需要用到两列

  • ENTREZ_GENE_ID
  • logFC
geneNames   ENTREZ_GENE_ID  normalAve   tumorAve    logFC   pValue  qValue
CCL23   6368    95.05964624 5.566645819 -4.066608903    2.07E-31    5.99E-29
COLEC10 10584   1459.366228 83.66298626 -4.122671832    2.11E-31    6.00E-29
FAM189B 10712   383.9435808 1289.852064 1.747953745 2.17E-31    6.08E-29
CDC45   8318    12.20616678 258.9248256 4.38682126  3.59E-31    9.94E-29
RCAN1   1827    11046.97758 2309.590455 -2.257915165    3.90E-31    1.07E-28
N4BP2L1 90634   2644.65753  734.73331   -1.847750259    4.57E-31    1.23E-28
FCN3    8547    6777.184345 389.412555  -4.120767162    5.41E-31    1.44E-28
UHRF1   29128   15.89471347 327.8659692 4.353192433 5.73E-31    1.50E-28
HMMR    3161    25.23294528 407.9486624 4.008655285 8.18E-31    2.12E-28
NEK2    4751    18.88655007 390.7591103 4.36024922  9.48E-31    2.43E-28

选择基因的ID作为输入文件

6368
10584
10712
8318
1827
90634
8547
29128
3161
4751

2. 登陆kobas数据库

网站:http://kobas.cbi.pku.edu.cn/

进入 Gene-list-Enrichment
http://kobas.cbi.pku.edu.cn/anno_iden.php
这里写图片描述

输入数据类型:

  • Fasta Protein Sequence ——蛋白序列
  • Fasta Nucleotide Sequence——核酸序列
  • Tabular BLAST Output——blast输出的表格
  • Entrez Gene ID——基因ID
  • UniProtKB AC
  • Refseq Protein ID
  • Ensembl Gene ID

3. 选择

1. 输入类型选择:Gene ID

2. 物种选择:Homo sapiens (human)

3. 粘贴Gene ID列表

4. 数据库 Clear All取消Pathway、Disease、GO全部选项,只选择KEGG Patway

点击RUN
这里写图片描述

4. 在线分析完成,输出结果

这里写图片描述

5. 输出文件说明

统计学检验方法:超几何检验、FIsher精确检验
FDR校正方法:Benjamini and Hochberg,需要补充此方法

##Statistical test method: hypergeometric test / Fisher's exact test
##FDR correction method: Benjamini and Hochberg

输出表格:
这里写图片描述

  • Term KEGG的注释类
  • Database 数据库类型
  • ID Term对应的ID
  • input number 富集到这个Term的输入基因个数
  • Background number 数据库中富集到这个通路的总有基因数量
  • P-value P值
  • Corrected P-Value 校正后P值
  • Input 输入的Gene ID,如果多个,以|号分开
  • Hyperlink 网页链接

如链接:
http://www.genome.jp/kegg-bin/show_pathway?hsa04512/hsa:3161%09red

这里写图片描述

图片会将对应的Gene name标志为红色

6. 软件安装准备

由于bioconductor外网链接慢,使用conda的方法安装,同时安装依赖的包

conda install bioconductor-clusterprofiler

7. 画图

# 初始化环境
rm(list=ls())# 安装软件
#source("https://bioconductor.org/biocLite.R")
#biocLite()
#biocLite("clusterProfiler")
#biocLite("pathview")# 设置通路
setwd("/home/toucan/Project/001.kegg_map")# 加载库
library("clusterProfiler")
# 读入文件,不检测name
rt=read.table("input.txt",sep="\t",header=T,check.names=F)
rt# 构建gene id为行名称的,logFC 
geneFC=rt$logFC
geneFC
gene <- rt$ENTREZ_GENE_ID
gene
names(geneFC)=gene
geneFC#kegg
# 保存输出文件
# 设定物种,qvalue小于0.05才输出,readable是否输出转换为gene name
kk <- enrichKEGG(gene = gene, organism = "human", pvalueCutoff = 0.05,qvalueCutoff = 0.05)
class(kk)
kkas.data.frame(kk)write.table(as.data.frame(kk),file="KEGG.xls",sep="\t",quote=F,row.names = F)# 生成barplot
pdf(file="KEGG.barplot.pdf")barplot(kk, drop = TRUE, showCategory = 12)pdf(file="KEGG.cnetplot.pdf")
# 生成网络图,需要通路描述列、输入gene ID列组成
#cnetplot(kk,categorySize = "geneNum", foldChange = geneFC)library("pathview")keggxls=read.table("KEGG.xls",sep="\t",header=T)
# 联网,将map图片下载
for(i in keggxls$ID){pv.out <- pathview(gene.data = geneFC, pathway.id = i, species = "hsa", out.suffix = "pathview")}

7. 输出结果

输出富集的表格:

ID  Description GeneRatio   BgRatio pvalue  p.adjust    qvalue  geneID  Count
hsa04110    Cell cycle  19/199  124/7431    5.54E-10    1.37E-07    1.31E-07    8318/7272/890/1870/701/4085/4998/4171/4175/898/23594/1031/4172/4616/8317/4176/4174/9134/993 19
hsa03030    DNA replication 11/199  36/7431 1.29E-09    1.60E-07    1.53E-07    2237/4171/4175/10535/5984/4172/5558/5424/23649/4176/4174    11
hsa03440    Homologous recombination    8/199   41/7431 1.03E-05    0.000849457 0.000811238 146956/8438/5888/7517/5424/641/7516/25788   8
hsa05222    Small cell lung cancer  11/199  93/7431 3.44E-05    0.002135572 0.002039489 1870/898/3910/4616/1282/3655/1284/9134/5743/3915/1163   11

每个通路生成三个文件

  • hsa03030.pathview.png
  • hsa03030.png
  • hsa03030.xml

输出富集的图片
这里写图片描述

输出伏击通路下载的map:
有差异基因显示,红色为正相关,绿色为负
这里写图片描述

同时,输出网站原始下载的,无颜色标注
这里写图片描述

非模式生物

以序列作为输入文件

>seq1
CTAATTTTGATGTAACAATAAGCAAATCCATCTCATTGACATGTCAACTTACCTTAATCTTTAATAAGTG
ATAAAGTCATATGTATGCCAAAAATTGCCTTAGCATTGCGTTATGACCTACCGTTAGTAGATGTCTGATT>seq2
AGTCTCGAATACAACTTGTTGCTGCGCGGACGCGAATCGCTCAGTACGGACGTCTTGAGCTCGAATCCTC
GGCCATATCTGTGCTCTCGATCGCAGCGTTTGCTAATTCGAAGATCGTGCTAATCGAAGTACCGAGAAAT

注意,物种应选择KO,但会笔记慢

这里写图片描述

显示:
不应该超过200行的输入文件

If you choose KO, Please input no more than 200 lines at one time.

运行中:

http://kobas.cbi.pku.edu.cn/wait_kobas.php?taskid=180629456069220
Your task is still running, your task id is 180629456069220, you can get the results automatically when the task is finished.
Also you can use the task id to fetch results at the result retrive page in the future.

等待输出


http://chatgpt.dhexx.cn/article/grThMPeD.shtml

相关文章

富集分析:(一)概述

&#xff08;全文约6600字&#xff09; 1. 富集分析 1.1. 富集分析概念 富集分析 富集分析&#xff0c;本质上是对数据的分布检验&#xff0c;如果分布集中在某个区域&#xff0c;则认为富集。 常用的分布检验方法有卡方检验、Fisher精确检验以及KS检验等方法。 生物信息…

NAR|北大/中科院计算所团队发布基因功能富集分析平台KOBAS-i

近日&#xff0c;国际知名期刊《核酸研究》(Nucleic Acids Research&#xff0c;IF:16.971)在线发表了北京大学孔雷课题组与中国科学院计算技术研究所赵屹研究员课题组合作开发的基因功能富集平台KOBAS-i (网址http://kobas.cbi.pku.edu.cn/ 或http://bioinfo.org/kobas)&#…

linux下kegg注释软件,网页工具KOBAS进行KEGG富集分析

KOBAS的介绍 KOBAS是北大生物信息中心研发的一个网页工具&#xff0c;用来基因/蛋白功能注释(注释模块)和功能基因集富集(富集模块)。以下是KOBAS的英文介绍&#xff1a; KOBAS 3.0 is a web server for gene/protein functional annotation (Annotate module) and functional …

KOBAS 3.0学习

在线通路注释&#xff0c;一般使用DAVID、KASS、KOBAS等工具。 Kobas : KOBAS&#xff08;基于KEGG Orthology Based Annotation System&#xff09;是用于基因/蛋白质功能注释&#xff08;注释模块&#xff09;和功能集富集&#xff08;Enrichment module&#xff09;的Web服…

KOBAS数据库使用指南

KOBAS&#xff08;KEGG Orthology Based Annotation System&#xff09;&#xff0c;&#xff0c;是由北京大学魏文丽课题组开发的数据库&#xff0c;主要功能是用于基因/蛋白质功能注释和功能富集。随着数据量不断增加&#xff0c;KOBAS至今为止共经历了3次升级&#xff0c;除…

盒须图

盒须图会表示出数据的散布情况 1.找到中位数 2.找到小于中位数的数据中的中位数 3.找到大于中位数的数据中的中位数 得到下四分位数和上四分位数 视频链接&#xff1a;https://www.bilibili.com/video/av45395982?p9

Echarts -盒须图的使用说明

画盒须图需要dataTool.js !function(e,t){"object"typeof exports&&"object"typeof module?module.exportst(require("echarts")):"function"typeof define&&define.amd?define(["echarts"],t):"ob…

关于油气田完整周期的筛选与盒须图的制作

1.筛选具有完整周期的油气田&#xff1a; 具有完整周期的油气田包括三个标签&#xff1a; - discovery year-勘探时间- fid year-建产时间&#xff0c;&#xff08;FID是投资决策的意思&#xff09;- production start year-开发时间&#xff08;透视表数据来自于原数据&#x…

Matplotlib 盒须图 (Box-and-whisker plot)

– Start import numpy as np import matplotlib.pyplot as plt from random import sampledata np.random.normal(0, 1, 100)# 盒须图 plt.boxplot(data, vertFalse); plt.show()– 更多参见&#xff1a;Matplotlib 精萃 – 声 明&#xff1a;转载请注明出处 – Last Update…

113Echarts - 盒须图(Boxplot Light Velocity)

效果图 源代码 <!DOCTYPE html> <html><head><meta charset"utf-8"><title>ECharts</title><!-- 引入 echarts.js --><script src"js/echarts.min.js"></script><script src"dist/extensi…

举个栗子!Tableau 技巧(84):使用盒须图查看你的数据分布

关于盒须图 英文&#xff1a;Box-plot&#xff0c;又称为箱形图、盒式图或箱线图&#xff0c;是一种用作显示一组数据分散情况资料的统计图。在各种领域经常被使用&#xff0c;较多用于品质管理。 如果你想显示一组数据的分布情况&#xff1a;例如&#xff1a;一目了然地理解数…

echart自定义图分享之自定百分比的(箱线图/盒须图)

echarts自定义图之自定百分比的(箱线图/盒须图)&#xff1a; 分享一些自己在工作中遇到的非常规图 创作原因&#xff1a;因客户需要指定样式的箱线图图&#xff08;七分位&#xff0c;存在非固定分位&#xff1a;10%&#xff0c;90%&#xff0c;并且能查看每个分位的具体值&a…

echarts-箱线图(盒须图)

搞了一套和官网不同的option&#xff0c;也能渲染出效果来&#xff0c;虽然我不知道这个箱线图有啥意义啊哈哈哈~ 需求&#xff1a;填充背景色(中间的横线我是真的无能为力了&#xff0c;有搞出来的小伙伴欢迎留言) 剩下的一些自定义轴刻度显示、tooltip的自定义就很常规了。。…

echarts盒须图颜色填充

在使用echarts中的boxplot时&#xff0c;我们常常有将特定盒子换成不同颜色标记出来的需求&#xff0c;series中的color会默认从option.color中按顺序获取&#xff0c;默认颜色&#xff1a;[#5470c6, #91cc75, #fac858, #ee6666, #73c0de, #3ba272, #fc8452, #9a60b4, #ea7ccc]…

【Tableau 图表大全21】之箱型图(盒须图)

文章目录 箱型图样式构建箱形图GIF演示 箱型图样式 箱形图&#xff0c;也称为箱须图&#xff0c;用于显示沿轴的分布。它通常分别在列和行上有一个维度和一个度量。尽管 Tableau 中的"显示我"功能只需单击一下即可创建箱形图&#xff0c;但我将在这篇博客文章中演示如…

QT实现绘制箱须图(盒须图)

QT实现绘制箱须图 项目简介项目技术项目展示主要源码片段解析项目简介 显示了如何创建箱须图。 显示了如何从文件中读取非连续数据,对其进行排列并查找箱须图的中位数。 项目技术 qt5.12,QtCharts模块,c++ 项目展示 主要源码片段解析 为了显示两家公司的股份偏差,我们首…

盒须图 python_什么是盒须图?

盒须图 python What the heck is a box and whisker chart, and why would you need one? Well, Im not a statistician, but heres my overview. 盒子和晶须图到底是什么,为什么您需要一个? 好吧,我不是统计学家,但这是我的概述。 A box and whisker chart can give you…

echarts 盒须图配置

下载依赖包地址 cv工程师&#xff1a; <!DOCTYPE html> <html><head><meta charset"utf-8"><title>ECharts</title><!-- 引入 echarts.js --><script src"./js/echarts.min.js"></script><scri…

matplotlib实现多个子图的盒须图

效果展示&#xff1a; 代码&#xff1a; import numpy as np import pandas as pd import matplotlib.pyplot as plt from pylab import * plt.figure(figsize(7.8,6.8)) plt.rcParams[font.sans-serif] [Arial Unicode MS]data {W: [1,2,3,4,5,6,7,8,10],H: [1,2,3,10,5,6…

Qt数据可视化(QBoxPlotSeries盒须图)

目录 创建盒须图类 设置盒须图数据 计算中间值 源代码 widget.cpp 实现效果如下: QBoxPlotSeries类以方框和胡须图表的形式显示数据。 “长方体绘图”系列充当长方体和胡须项目的容器。多个系列中的项目根据其索引值分组。 QBarCategoryAxis类用于将类别添加到图表的轴。…