【bioinfo】hisat2/bowtie2比对结果summary文件解读

article/2025/11/5 9:48:31

hisat2/bowtie2比对后,比对结果基本信息统计的summary文件解读。

参考:

  • https://www.cnblogs.com/leezx/p/8540862.html
  • seqanswers 论坛上的一个问答

使用seqanswers上的一个结果文件示例:
在这里插入图片描述
以及对应的回答:
在这里插入图片描述
整理该汇总文件中的数值和比例对应的含义及计算公式:

countsratioinfo说明Label/计算公式比例计算公式
16182999reads;of these:总reads对数T-
16182999100.00%were paired; of these:成对readsTT/T
573123135.42%aligned concordantly 0 times不一致比对a0a0/T
452237627.95%aligned concordantly exactly 1 time一致比对恰好1次a1a1/T
592939236.64%aligned concordantly >1 times一致比对大于1次a1aa1a/T
--------
5731231pairsaligned concordantly 0 times; of these:不一致比对a0-
238143141.55%aligned discordantly 1 time其中的一次比对a01a01/a0
--------
3349800pairsaligned 0 times concordantly or discordantly; of these:没有比对上或比对不一致的对数Cd0-
6699600matesmates make up the pairs; of these:没有比对上或比对不一致的reads数Cd0s=Cd0*2-
381473656.94%aligned 0 times没比对上Cm0Cm0/Cd0s
188342928.11%aligned exactly 1 time比对上恰好1次Cm1Cm1/Cd0s
100143514.95%aligned >1 times比对上大于1次Cm1aCm1a/Cd0s
88.21%overall alignment rate比对率-R

其中:

  • C d 0 = T − ( a 1 + a 1 a + a 01 ) = a 0 − a 01 Cd0=T-(a1+a1a+a01) = a0-a01 Cd0=T(a1+a1a+a01)=a0a01
  • R = [ ( a 1 + a 1 a ) ∗ 2 + a 01 ∗ 2 + C m 1 + C m 1 a ] / ( T ∗ 2 ) = 1 − C m 0 / ( T ∗ 2 ) R=[(a1+a1a)*2+a01*2+Cm1+Cm1a]/(T*2)=1-Cm0/(T*2) R=[(a1+a1a)2+a012+Cm1+Cm1a]/(T2)=1Cm0/(T2)

附:

hisat2_summary文件格式看起来不方便,转换一下:

python trans_hisat2sum.py ${hisat2_summary} ${hisat2_summary_trs}

# trans_hisat2sum.py
import sysinfile = sys.argv[1]
outfile = sys.argv[2]lst = []
key_lst = []
with open(infile, 'r') as f:for line in f:if "----" in line:continuelitm = line.strip().split(" ")lst.append(litm[0])info = litm[1]if info.startswith('('):lst.append(info.strip('()'))key_lst.append(' '.join(litm[2:]))key_lst.append('ratio:' + ' '.join(litm[2:]))else:key_lst.append(' '.join(litm[1:]))with open(outfile, 'w') as pf:pf.write('\t'.join(key_lst) + '\n')pf.write('\t'.join(lst) + '\n')

输出是一行表头一行数据,样本多的话看起来更方便:
在这里插入图片描述


http://chatgpt.dhexx.cn/article/aMGG6OB8.shtml

相关文章

Hisat2 Bowtie2比对结果解读

Bowtie的中文意思是:领结,蝴蝶结 Bowtie2用户手册: http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml 在看比对结果前需要了解三个概念: 1.Aligned concordantly 合理比对 主要和比对参数:–fr/–rf/–ff 有…

hisat2构建转录组索引的问题

hisat2构建转录组索引的问题 目前最新版为为hisat2. 安装过程如下 wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.1.0-Linux_x86_64.zip unzip hisat2-2.1.0-Linux_x86_64.zip 下载解压缩即可。 在进行比对前,首先需要对参考基因组建立索引…

hisat2比对结果图文解析

hisat2比对结果图文解析 看到hisat2输出的这个比对结果统计信息,是不是有点懵? 下面用图的方式进行简单剖析: 以上参考自https://blog.csdn.net/weixin_34191845/article/details/86453897 参考文献 Hisat2 bowtie2比对结果解读&#xff08…

RNA-seq——三、使用Hisat2进行序列比对

步骤 1. 下载对应的index2. 序列比对3. samtools:将sam文件转为bam文件4. 将bam文件载入IGV 为什么要比对:https://www.jianshu.com/p/681e02e7f9af Jimmy老师主要演示了四种比对工具,分别为hisat2、subjunc、bowtie2、bwa。除了subjunc能够直…

hisat2的index差别

下载的时候发下hisat2 主页中有多个index文件,一时间不解,搜索后发现如下评价。 目录 1.下载三个index:2.重命名为:3.hisat2比对命令:4.比对率:结论 1.下载三个index: 2.重命名为: …

Hisat2下载

功能: 将测序结果比对到参考基因组上 网站: http://ccb.jhu.edu/software/hisat2/index.shtml 安装:mkdir ~/biosoft && cd ~/biosoft wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.1.0-Linux_x86_64.zip …

安装Hisat2

一、(MobaXterm_Personal)安装aspera 首先进行预编译解压安装: mkdir Biosofts unzip hisat2-2.2.1-Linux_x86_64.zip -d ~/Biosofts/ cd ~/Biosofts ll ###zip文件,unzip解压,-d制指定目录 安装完成: 设置…

RNA-seq流程学习笔记(7)-使用Hisat2进行序列比对

参考文章: RNAseq(4)–Hisat2进行序列比对及Samtools格式转化 RNA-seq(5):序列比对:Hisat2 hisat2比对软件将reads比对到参考基因组 hisat2比对 RNA-seq数据分析使用方法(陈建国 译) 转录组分析2——比对基因组 RNA-seq练习 第二部…

RNA-seq分析htseq-count的使用

HTSeq作为一款可以处理高通量数据的python包,由Simon Anders, Paul Theodor Pyl, Wolfgang Huber等人携手推出HTSeq — A Python framework to work with high-throughput sequencing data。自发布以来就备受广大分析人员青睐,其提供了许多功能给那些熟悉python的大佬们去自信…

转录组学习之序列比对(Hisat2)[学习笔记通俗易懂版]

转录组学习之序列比对(hisat2)[学习笔记通俗易懂版] data :2023.7.25 recorder :CYH-BI 特别注意:本文为我自己学习的学习记录,没有任何权威,只能仅供初学者提供思路与参考。 本文知乎地址:https://zhua…

Hisat2安装及比对

Hisat2和STAR是目前转录组分析过程中用来做比对的两款主要工具,记得有一篇好像是2017年的文章专门比较了几款转录组比对工具对结果的影响,结论中认为两款软件在实际使用过程中对结果影响及耗时区别不大,我认为选一款就可以,之前总…

Hisat2 比对到参考基因组

比对的流程:建立索引→比对到参考基因组→SAM转BAM文件→BAM建立索引 1.准备参考基因组、建立索引 ## 参考基因组准备:注意参考基因组版本信息 # 下载,Ensembl:http://asia.ensembl.org/index.html # http://ftp.ensembl.org/pub/release-…

数据项组成数据元素,数据元素组成数据

数据元素:是组成数据的、有一定意义的基本单位。 数据项:一个数据可以由若干个数据项组成。数据项是数据不可分割的最小单位。 数据元素:字段、域、属性 数据项:元素、结点、顶点、记录 数据项组成数据元素,数据元…

数据结构 基本概念(数据项--数据元素--数据对象-数据类型-抽象数据类型)

//数据结构基本概念 #include<iostream> using namespace std;/* 数据 – 程序的操作对象&#xff0c;用于描述客观事物 数据的特点&#xff1a; 可以输入到计算机 可以被计算机程序处理 数据是一个抽象的概念&#xff0c;将其进行分类后得到程序设计语言中的类型。如&am…

根据结构体数组中某一数据项对结构体数组排序

/* *copyright(c) 2018,HH *All rights reserved. *作 者&#xff1a;HH *完成日期&#xff1a;2018年8月17日 *版本号&#xff1a;v1.0 * *问题描述:输入结构体数组&#xff0c;并根据结构体中的某一数据项对整个结构体数组进行排序 *输入描述&#xff1a;&#xff1b; *程序输…

点击echarts柱状图动态改变数据项颜色样式

首先附上参考文章连接&#xff1a;https://blog.csdn.net/weixin_42870683/article/details/103528254添加链接描述 今天来实现点击echarts柱状图&#xff0c;动态改变柱状图数据项颜色样式的案例。只要认真做&#xff0c;很容易学会~ 首先引入ECharts.js文件 <!-- 引入 …

数据结构考研:数据、数据元素、数据项、数据对象、数据结构的区别/详细解释(计算机/软件工程/王道论坛)

一、问题背景 博主最近在准备2020年春招复习数据结构这门功课时&#xff0c;采用了王道论坛的《2020年数据结构考研复习指导》这本书&#xff0c;该书的第一章节便是数据结构的基本概念&#xff1a;数据、数据元素、数据项、数据对象、数据结构。但该书对这几个容易混淆的概念…

数据,数据元素 数据项,数据对象的详细理解

1.数据(Data)&#xff1a;数据就是用户输入到计算机被计算机程序处理的一些符号&#xff0c;比如图片还有声音等.... 2.数据元素(Data Element)&#xff1a;是数据的基本单位&#xff0c;数据元素用于完整的描述一个对象&#xff0c;比如一个学生表&#xff0c;学生表也是由 数…

element el-transfer穿梭框的使用,自定义穿梭框的数据项

本文概述基本穿梭框效果自定义数据项实现右侧列表元素变化时触发方法 本文概述 查看element官方文档可以了解到 el-transfer穿梭框的基本使用方法&#xff0c;本文主要介绍数据项的自定义渲染和右侧列表元素变化时触发方法的实现。 自定义数据项&#xff0c;除了基本的el-tra…

数据结构之数据、数据元素、数据项、数据对象之间的关系

首图 # 前言 博主介绍&#xff1a; -- 本人是小奇&#xff0c;一个喜欢读书、交友、技术分享的Java程序员&#xff0c;更喜欢整理分享一些Java面试题&#xff0c;如果大家有需要可以关注我的公众号『小奇Java面试』领取资料。 文章目录 首图 前言 文章目录 关键字定义 1、数…