生信小白学习日记Day3——NGS基础 NGS分析注解(质量分析软件)

article/2025/9/14 11:40:45

2019年5月27日,天气舒适,忙碌一天之后开始今天的生信学习。今天就昨天Day2-2的一些标记加以查询说明,仅供参考。

NGS基础

NGS分析注解

1. 质量分析软件

昨天提到,拿到数据后可以通过一些软件来评估测序质量的好坏,包括fastqc、multiqc、SolexaQA等。我们今天来了解一下multiqc和SolexaQA的使用。
multiqc
来自于博文:https://blog.csdn.net/qazplm12_3/article/details/84550515
原来multiqc是基于Phython的用于整合fastq质控结果的工具。通常质控工具给出的结果都是针对一个样品产生一个报告,而当样品数量繁多时,我们必须借助工具将其整合再分析。multiqc有如下几个优点:
1)能将测序数据的多个QC结果整合成一个HTLM网页交互式报告,同时也能导出pdf文件;
2)支持多种分析类型的质控结果查看,如:RNAseq、Whole-Genome Seq、Bisulfite Seq、Hi-C和MultiQC_NGI;
3)支持整合68种软件分析的结果,而且支持的软件还在持续增加,也可以自己写作一个插件,具体见下图。
在这里插入图片描述
我并没有用过类似fastQC和multiQC这类的质控工具和整合工具,分析基因组数据也仅仅是停留在简单改改别人脚本再去跑的阶段,如有时间,可亲自试试,再来写写心得。
1.安装MultiQC
依赖python2.7+, 3.4+ 或者 3.5+

#pip安装
pip install git+https://github.com/ewels/MultiQC.git  #Installation with pip
#conda安装
conda install -c bioconda multiqc  # Installing with conda

pip
pip 是 Python 包管理工具,该工具提供了对Python 包的查找、下载、安装、卸载的功能。目前如果你在 python.org 下载最新版本的安装包,则是已经自带了该工具。
Python 2.7.9 + 或 Python 3.4+ 以上版本都自带 pip 工具。
pip 官网:https://pypi.org/project/pip/

  • 你可以通过以下命令来判断是否已安装:
pip --version
  • 若还未安装,可通过以下代码进行安装:
$ curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py   # 下载安装脚本
$ sudo python get-pip.py    # 运行安装脚本

conda
Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。 Conda 是为 Python 程序创建的,适用于 Linux,OS X 和Windows,也可以打包和分发其他软件。
查了conda是什么,发现这篇写的很好,介绍了如何安装conda以及利用conda安装生信软件,以后可能会用到。
https://www.jianshu.com/p/edaa744ea47d

2. 运行MultiQC
直接指定MultiQC要分析的文件路径即可,若数据在当前目录下输入multiqc .即可。

multiqc .
multiqc data/
multiqc data/ ../proj_one/analysis/ /tmp/results
multiqc data/*_fastqc.zip
multiqc data/sample_1*

使用–ignore忽略掉某些文件

multiqc . --ignore *_R2*
multiqc . --ignore run_two/
multiqc . --ignore */run_three/*/fastqc/*_R2.zip

3. MultiQC报告解读(以RNA-Seq数据为例)
1. General Statistics
每一个样本reads数量、比对层面的质量评估整合统计表,点击Configure Columns可以选择显示或不显示某些项。点击Plot可以绘图。在这里插入图片描述
点击Plot可以对任意两种属性的评估结果做交互式二维图,若各样本均一性好,散点会比较集中,反之会出现某些离散的点,这样方便查看某些指标异常的离群样本。在这里插入图片描述
2. featureCounts
利用featureCounts工具计算每个基因外显子的reads数的结果展示。featureCounts不仅可以支持gene的定量,也支持exon, gene bodies, genomic bins, chromsomal locations的定量。功能类似的软件是HTSeq。
软件官网:http://bioinf.wehi.edu.au/featureCounts/
在这里插入图片描述
3. STAR
基于STAR比对工具的分析结果,STAR会将没有paired mapping的reads都剔除,避免single reads比对到基因组上;并且STAR对lower-quality(采用more soft-clipped和错配碱基)比对有较高的容忍度。
软件官网:https://github.com/alexdobin/STAR
更多分析工具比较见:转录组分析工具大比拼
在这里插入图片描述
4. Cutadapt
用cutadapt软件来对双端测序数据去除接头后的结果。

对测序数据进行过滤时cutadapt对测序数据进行识别、剪切并去除adapters, primers , poly_A等序列,移除被adapter污染的reads部分(指由于插入片段长度不够,测序仪读到的测序引物等序列)。具体见NGS基础 - 高通量测序原理。

软件官网:https://cutadapt.readthedocs.io/en/stable/
在这里插入图片描述
5. FastQC
MultiQC将fastqc工具分析得到的10个结果分别整合成一个模块,集中查看。

软件官网:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
在这里插入图片描述
明天再来,先挑一些重要的标记查阅,纸上得来终觉浅,须知此事要躬行,共勉。


http://chatgpt.dhexx.cn/article/llOchCM6.shtml

相关文章

NGS 数据过滤之 Trimmomatic

NGS Trimmomatic 支持多线程,处理数据速度快,主要用来去除 Illumina 平台的 Fastq 序列中的接头,并根据碱基质量值对 Fastq 进行修剪。软件有两种过滤模式,分别对应 SE 和 PE 测序数据,同时支持 gzip 和 bzip2 压缩文…

NGS基础名词解释(1)

什么是高通量测序? 高通量测序技术( High-throughput sequencing , HTS )是对传统 Sanger 测序(称为一代测序技术)革命性的改变 , 一次对几十万到几百万条核酸分子进行序列测定 , 因此在有些文献中称其为…

【评测】NGS建库试剂盒

NGS建库试剂 一、基本信息: 1、产品名称:SynplSeq DNA Library Prep Kit for Illumina 2、货号及规格 3、保存条件:-20℃ 二、产品描述: 1、产品介绍 文库构建是NGS测序的关键环节。SynplSeq DNA Library Prep Kit for illu…

NGS分析流程

NGS实验步骤 核酸提取与检测、文库构建与文库检测、上机测序 生信分析步骤 1. 质量分析 fastqc、multiqc、SolexaQA 测序数据的质量好坏会影响我们的下游分析。但不同的测序平台其测序错误率的图谱都是有差别的。因此,非常建议在我们分析测序数据之前先搞清楚如…

生信小白学习日记Day2-2——NGS基础 NGS分析

2019年5月26日下午,无意中看到hanli0902的关于NGS分析的博文https://blog.csdn.net/hanli1992/article/details/82790386有很多需要学习的地方,在这里贴一些并就不理解之处做些笔记,仅供参考。 NGS基础——NGS分析 NGS 分析步骤 1. 质量分析…

NGS实验室设计

NGS(Next-Generation Sequencing)实验室是进行高通量测序研究的场所,其规划布局需要考虑实验室的功能需求、设备需求、安全性、通风与空调、废弃物处理等多方面的因素。以下是NGS实验室规划布局需要考虑的几个方面: 1、实验室空间…

【gis技术】web墨卡托投影和经纬度直投的差别

本文不适用于不知道投影概念的人。 web墨卡托投影 是以经度0,纬度90为原点,x正轴朝东(右),y轴朝南(下); 格网分割为2*2格网划分,如图 经纬度直投的原点和轴向与前者一致…

墨卡托投影坐标系(Mercator Projection)原理

Web墨卡托投影坐标系: 以整个世界范围,赤道作为标准纬线,本初子午线作为中央经线,两者交点为坐标原点,向东向北为正,向西向南为负。 X轴:由于赤道半径为6378137米,则赤道周长为2*P…

网络墨卡托投影的前世今生

谷歌地图、微软地图、百度地图、腾讯地图、高德地图等网络地图所使用的投影都是网络墨卡托投影(Web Mercator),尽管我们喜欢把百度地图、高德地图称之为火星坐标系,不过它们还是没逃出网络墨卡托投影的手心。 网络墨卡托投影由墨卡…

墨卡托投影原理及瓦片公式推导

墨卡托投影 墨卡托投影将地球球面投影到一个圆柱体柱面上,将地球看作一个正球体时,以 O O O为地球球心,从球心向外辐射射线,与地球外接圆柱面交与 P ′ P P′。 设纬度为 ϕ \phi ϕ,经度为 λ \lambda λ,其中: ϕ ∈ ( − π 2 , π 2 ) \phi\in(-\frac{\pi}{2},\fr…

墨卡托投影实现

又称正轴等角圆柱投影。圆柱投影的一种,由荷兰地图学家墨卡托(G. Mercator)于1569年创拟。为地图投影方法中影响最大的。 设想一个与地轴方向一致的圆柱切于或割于地球,按等角条件将经纬网投影到圆柱面上,将圆柱面展为…

墨卡托投影推导

废话 为啥一堆人都说墨卡托投影是从圆心向圆柱面发射线, 反正我觉得不是那样, 不然公式显然就不对了(也可能是我马虎), 后来去wiki查了一下, 找到了公式的推导. 公式 x = R ( λ − λ 0 ) , y = R ln ⁡ [ tan ⁡ ( π 4 + φ 2 ) ] . {\displaystyle x=R(\lambda -\lambda …

墨卡托投影学习

看下图; 这是超图自带示例;墨卡托坐标系图层的加载; 右下角,看上去数字很大,还有五位小数,的数字,这值就是墨卡托坐标的值; 看一下代码,看不出来是墨卡托坐标系&#x…

墨卡托投影与瓦片地图

目录 一、开胃小知识 二、墨卡托投影 1、什么是墨卡托投影? 2、墨卡托投影的特点 3、墨卡托投影的缺点 三、瓦片地图 1、GIS介绍 2、瓦片地图原理 四、瓦片地图原理---续 1、经纬度 2、投影 3、瓦片 4、瓦片编号 5、关于中国的经纬度 一、开胃小知识 …

墨卡托投影简单介绍

墨卡托投影简单介绍 非洲没有想象的那么小,欧亚大陆也没有看上去那么大,一切都依赖于墨卡托投影。今天就跟小编一起来了解一下墨卡托投影吧。 1 什么是墨卡托投影? 墨卡托(Mercator)投影,又名”等角正轴圆柱投影”,荷…

横轴墨卡托投影参数_横轴墨卡托投影

说明 横轴墨卡托投影也称为高斯-克吕格投影,与墨卡托投影类似,不同之处在于圆柱与沿子午线而非赤道的球体或椭圆体相接触。通过这种方法生成的等角投影不会保持真实的方向。中央经线位于感兴趣区域的中心。这种中心对准方法可以最大程度减少该区域内所有属性的变形。此投影最…

一个小游戏让你彻底弄懂墨卡托投影

什么是墨卡托投影? 什么是墨卡托投影,这个问题我问过别人,同样也有很多人问过我。 受介质和技术的限制,我们平时看到的地图大多是平面的,那么如何将一个三维的地球画在平面上呢。 墨卡托投影就是将三维的地球表示在…

墨卡托投影

目录 一、墨卡托投影基本介绍 二、墨卡托投影由来 三、墨卡托投影的特点 四、墨卡托投影流行的原因 4.1、墨卡托投影对于航行的价值 4.2、墨卡托投影与政治 4.3、Web墨卡托投影 五、墨卡托投影的缺点 一、墨卡托投影基本介绍 墨卡托投影,是正轴等角圆柱投影…

墨卡托投影介绍

一、墨卡托投影 墨卡托投影,又称正轴等角圆柱投影,由荷兰地图学家墨卡托(G.Mercator)于1569年创拟。假设地球被套在一个圆柱中,赤道与圆柱相切,然后在地球中心放一盏灯,把球面上的图形投影到圆柱体上,再把…

Fiddler - 使用 Fiddler 监控本地 HTTP 请求,谷歌浏览器提示“隐私设置错误”

问题如下图所示,无论打开什么常用的网页,都提示这个,一开始以为在 “高级” 里点击 “继续访问” 即可,却没想到连这个按钮都没,而且每个网址访问都这样,想必是 Fiddler 在捣腾,于是想到是否证书…