RNA-seq——三、使用Hisat2进行序列比对

article/2025/11/5 10:20:06

步骤

  • 1. 下载对应的index
  • 2. 序列比对
  • 3. samtools:将sam文件转为bam文件
  • 4. 将bam文件载入IGV

为什么要比对:https://www.jianshu.com/p/681e02e7f9af

Jimmy老师主要演示了四种比对工具,分别为hisat2、subjunc、bowtie2、bwa。除了subjunc能够直接生成bam文件外,这些软件的用法都很相似。需要根据自己的需求来选择对应的软件。
这里以使用hisat2为例。

1. 下载对应的index

为什么要下载index:https://www.jianshu.com/p/681e02e7f9af

Hisat2官网下载:https://daehwankimlab.github.io/hisat2/download/
挂了梯子,使用edge浏览器,一小时左右下完。之后再导入服务器,再花一小时,淦!!!
在这里插入图片描述
解压文件

tar -zxvf hg19_genome.tar.gz
tar -zxvf mm10_genome.tar.gz

看一下里面都有什么
在这里插入图片描述

2. 序列比对

# 激活环境
conda activate rna# -p 设置线程
# -x 参考基因组索引文件的前缀
# -U 单端测序文件
# -S 指定输出文件
hisat2 -p 10 -x ./hg19/genome -U ../sra/SRR957677.fastq.gz -S ../aligned/SRR957677.sam

在这里插入图片描述

一次比对多个文件的例子:https://www.jianshu.com/p/479c7b576e6f

# 双端测序数据
# -t 显示比对时间
# -1 双端测序结果的第一个文件
# -2 双端测序结果的第二个文件# 人的比对
for ((i=56;i<=58;i++));do hisat2 -t -x /mnt/f/rna_seq/data/reference/index/hg19/genome -1 /mnt/f/rna_seq/data/SRR35899${i}.sra_1.fastq.gz -2 /mnt/f/rna_seq/data/SRR35899${i}.sra_2.fastq.gz -S SRR35899${i}.sam ;done
# 小鼠比对
$ for ((i=59;i<=62;i++));do hisat2 -t -x /mnt/f/rna_seq/data/reference/index/mm10/genome -1 /mnt/f/rna_seq/data/SRR35899${i}.sra_1.fastq.gz -2 /mnt/f/rna_seq/data/SRR35899${i}.sra_2.fastq.gz -S SRR35899${i}.sam; done

3. samtools:将sam文件转为bam文件

sort 默认按照染色体位置进行排序
-n 根据read名进行排序
-t 根据TAG进行排序
参考:https://www.jianshu.com/p/681e02e7f9af

详细参数解释见:使用SAMtools将SAM文件转换为BAM文件、排序、建立索引

# -O 设置最终输出的文件格式,可以是bam,sam或者cram,默认为bam
# -@ 设置线程,加快运行速度
# -o 设置最终排序后的输出文件名
samtools sort -O bam -@ 2 -o SRR957677.bam SRR957677.sam# 必须对bam文件进行默认情况下的排序后,才能进行index,否则会报错。
# 建立索引后将产生后缀为.bai的文件,用于快速的随机处理。
samtools index SRR957677.bam
samtools view SRR957677.bam | less -SN# 给出BAM文件的比对结果
samtools flagstat -@ 2 SRR957677.bam

在这里插入图片描述
在这里插入图片描述
这里比对结果异常,应该是使用的数据为单端测序数据造成的。

一次转换多个文件的例子:https://www.jianshu.com/p/479c7b576e6f

# 首先将比对后的sam文件转换成bam文件
# 利用的是samtools的view选项,参数-S 输入sam文件;参数-b 指定输出的文件为bam;最后重定向写入bam文件
$ cd mnt/f/rna_seq/aligned
$ for ((i=56;i<=62;i++));do samtools view -S SRR35899${i}.sam -b > SRR35899${i}.bam;done
# 将所有的bam文件按默认的染色体位置进行排序
$ for ((i=56;i<=62;i++));do samtools sort SRR35899${i}.bam -o SRR35899${i}_sorted.bam;done
# 将所有的排序文件建立索引,索引文件.bai后缀
$ for ((i=56;i<=62;i++));do samtools index SRR35899${i}_sorted.bam;done

Jimmy老师的方法

ls *.sam | while read id; do (samtools sort -O bam -@ 5 -o $(basename ${id} ".sam").bam ${id}); done
ls *.bam | xargs -i samtools index {}ls *.bam | while read id; do (samtools flagstat -@ 10 $id > $(basename ${id} ".bam").flagstat); done

4. 将bam文件载入IGV

将bam文件导入igv,在chr位置输入":10039",结果如图。看不懂…
在这里插入图片描述


http://chatgpt.dhexx.cn/article/OlF50f7J.shtml

相关文章

hisat2的index差别

下载的时候发下hisat2 主页中有多个index文件&#xff0c;一时间不解&#xff0c;搜索后发现如下评价。 目录 1.下载三个index&#xff1a;2.重命名为&#xff1a;3.hisat2比对命令&#xff1a;4.比对率&#xff1a;结论 1.下载三个index&#xff1a; 2.重命名为&#xff1a; …

Hisat2下载

功能&#xff1a; 将测序结果比对到参考基因组上 网站&#xff1a; http://ccb.jhu.edu/software/hisat2/index.shtml 安装&#xff1a;mkdir ~/biosoft && cd ~/biosoft wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.1.0-Linux_x86_64.zip …

安装Hisat2

一、&#xff08;MobaXterm_Personal&#xff09;安装aspera 首先进行预编译解压安装&#xff1a; mkdir Biosofts unzip hisat2-2.2.1-Linux_x86_64.zip -d ~/Biosofts/ cd ~/Biosofts ll ###zip文件&#xff0c;unzip解压&#xff0c;-d制指定目录 安装完成&#xff1a; 设置…

RNA-seq流程学习笔记(7)-使用Hisat2进行序列比对

参考文章&#xff1a; RNAseq(4)–Hisat2进行序列比对及Samtools格式转化 RNA-seq(5):序列比对&#xff1a;Hisat2 hisat2比对软件将reads比对到参考基因组 hisat2比对 RNA-seq数据分析使用方法&#xff08;陈建国 译&#xff09; 转录组分析2——比对基因组 RNA-seq练习 第二部…

RNA-seq分析htseq-count的使用

HTSeq作为一款可以处理高通量数据的python包,由Simon Anders, Paul Theodor Pyl, Wolfgang Huber等人携手推出HTSeq — A Python framework to work with high-throughput sequencing data。自发布以来就备受广大分析人员青睐,其提供了许多功能给那些熟悉python的大佬们去自信…

转录组学习之序列比对(Hisat2)[学习笔记通俗易懂版]

转录组学习之序列比对&#xff08;hisat2&#xff09;[学习笔记通俗易懂版] data :2023.7.25 recorder :CYH-BI 特别注意&#xff1a;本文为我自己学习的学习记录&#xff0c;没有任何权威&#xff0c;只能仅供初学者提供思路与参考。 本文知乎地址&#xff1a;https://zhua…

Hisat2安装及比对

Hisat2和STAR是目前转录组分析过程中用来做比对的两款主要工具&#xff0c;记得有一篇好像是2017年的文章专门比较了几款转录组比对工具对结果的影响&#xff0c;结论中认为两款软件在实际使用过程中对结果影响及耗时区别不大&#xff0c;我认为选一款就可以&#xff0c;之前总…

Hisat2 比对到参考基因组

比对的流程&#xff1a;建立索引→比对到参考基因组→SAM转BAM文件→BAM建立索引 1.准备参考基因组、建立索引 ## 参考基因组准备:注意参考基因组版本信息 # 下载&#xff0c;Ensembl&#xff1a;http://asia.ensembl.org/index.html # http://ftp.ensembl.org/pub/release-…

数据项组成数据元素,数据元素组成数据

数据元素&#xff1a;是组成数据的、有一定意义的基本单位。 数据项&#xff1a;一个数据可以由若干个数据项组成。数据项是数据不可分割的最小单位。 数据元素&#xff1a;字段、域、属性 数据项&#xff1a;元素、结点、顶点、记录 数据项组成数据元素&#xff0c;数据元…

数据结构 基本概念(数据项--数据元素--数据对象-数据类型-抽象数据类型)

//数据结构基本概念 #include<iostream> using namespace std;/* 数据 – 程序的操作对象&#xff0c;用于描述客观事物 数据的特点&#xff1a; 可以输入到计算机 可以被计算机程序处理 数据是一个抽象的概念&#xff0c;将其进行分类后得到程序设计语言中的类型。如&am…

根据结构体数组中某一数据项对结构体数组排序

/* *copyright(c) 2018,HH *All rights reserved. *作 者&#xff1a;HH *完成日期&#xff1a;2018年8月17日 *版本号&#xff1a;v1.0 * *问题描述:输入结构体数组&#xff0c;并根据结构体中的某一数据项对整个结构体数组进行排序 *输入描述&#xff1a;&#xff1b; *程序输…

点击echarts柱状图动态改变数据项颜色样式

首先附上参考文章连接&#xff1a;https://blog.csdn.net/weixin_42870683/article/details/103528254添加链接描述 今天来实现点击echarts柱状图&#xff0c;动态改变柱状图数据项颜色样式的案例。只要认真做&#xff0c;很容易学会~ 首先引入ECharts.js文件 <!-- 引入 …

数据结构考研:数据、数据元素、数据项、数据对象、数据结构的区别/详细解释(计算机/软件工程/王道论坛)

一、问题背景 博主最近在准备2020年春招复习数据结构这门功课时&#xff0c;采用了王道论坛的《2020年数据结构考研复习指导》这本书&#xff0c;该书的第一章节便是数据结构的基本概念&#xff1a;数据、数据元素、数据项、数据对象、数据结构。但该书对这几个容易混淆的概念…

数据,数据元素 数据项,数据对象的详细理解

1.数据(Data)&#xff1a;数据就是用户输入到计算机被计算机程序处理的一些符号&#xff0c;比如图片还有声音等.... 2.数据元素(Data Element)&#xff1a;是数据的基本单位&#xff0c;数据元素用于完整的描述一个对象&#xff0c;比如一个学生表&#xff0c;学生表也是由 数…

element el-transfer穿梭框的使用,自定义穿梭框的数据项

本文概述基本穿梭框效果自定义数据项实现右侧列表元素变化时触发方法 本文概述 查看element官方文档可以了解到 el-transfer穿梭框的基本使用方法&#xff0c;本文主要介绍数据项的自定义渲染和右侧列表元素变化时触发方法的实现。 自定义数据项&#xff0c;除了基本的el-tra…

数据结构之数据、数据元素、数据项、数据对象之间的关系

首图 # 前言 博主介绍&#xff1a; -- 本人是小奇&#xff0c;一个喜欢读书、交友、技术分享的Java程序员&#xff0c;更喜欢整理分享一些Java面试题&#xff0c;如果大家有需要可以关注我的公众号『小奇Java面试』领取资料。 文章目录 首图 前言 文章目录 关键字定义 1、数…

数据、数据元素、数据项、数据对象的理解

理解数据结构与算法时&#xff0c;觉得大多数的书上讲的定义特别抽象&#xff0c; 数据、数据元素、数据项、数据对象这四个概念特别难懂 本人理解如下&#xff1a; 假设有两张表&#xff0c;A表为人员表&#xff0c;B表为课程表&#xff0c;这两张表就是数据 、 而单独的一…

数据结构中数据、数据对象、数据元素、数据项之间的关系

数据、数据对象、数据元素、数据项 我们在学习数据结构时首先熟悉的一定是这四个名词&#xff0c;那么在数据家族里这四位成员都是什么关系呢&#xff1f; 严蔚敏的数据结构c语言版一书中解释是这样的&#xff1a; 数据&#xff1a;是客观事物的符号表示&#xff0c;是所有能…

快速理解数据,数据对象,数据元素,数据项间的关系

个人学习路途的记录&#xff0c;有问题可在评论区留言&#xff0c;随缘在线 —————————————————分割线————————————————————- 由于看了较多的文章&#xff0c;并没有找到一篇胎教级的描述&#xff0c;所以个人总结了一下。 首先是教科…

数据、数据元素、数据项、数据对象的介绍和理解

最近在读《大话数据结构》这本书 第一章上面的介绍数据结构相关概念 总结如下图&#xff1a; 数据结构是相互之间存在一种或多种特定关系的数据元素的集合。 对于数据 数据对象 数据元素 数据项 这四个概念 理解的不是很好 我先说下课本上是怎么说的 然后再根据自己和网上的理…