生信小白学习日记Day2——NGS基础 illumina高通量测序原理

article/2025/9/14 10:51:20

2019年5月26日,周日,小雨
说明:阅读生信宝典和查阅文章的总结,原文请关注公众号生信宝典,参考的博文都附有链接,仅供参考。

生信宝典

NGS基础——高通量测序原理

本文介绍了测序文库构建原理、链特异性文库构建方式和识别方法、测序簇生成过程、双端测序过程、测序接头产生、PCR duplicate、测序通量选择标准等。原文都是一张张PPT,截图下来之后,附一些自己理解的注释吧
以目前最常用的illumina测序为例,其最基本的原理是利用可逆终止的、荧光标记的dNTP进行边合成边测序

  • 第一步,将DNA随机打断为短片段
    在这里插入图片描述
  • 第二步,序列两端添加接头
    在这里插入图片描述
    添加接头的目的是使得片段与flow cell上锚定的寡核苷酸序列相结合,进行下一步的链扩增和测序。那么flow cell是什么呢?它是流动池,就像可以流动各种液体的小池子,以Hiseq2500为例,它有2张flowcell,每张flowcell有8条通道,我们称为8个lane,常规的PE150测序1条lane产生的有效数据在120Gb以上,很少有一个样品需要测这么大的数据量,因此在测序时需要将多个文库样品混在同1条lane中,为了能够把测序数据按样本分离,在构建文库的时候,需要用不同index(标签序列)也有人称为barcode对文库进行标记。
    初此之外,接头还包括PE和SE测序的引物,它们是双端测序时所用的两条引物,以及P5和P7,它们是flow cell上的共价连接的接头,可以分别于片段的两条单链结合,使得片段被固定在flow cell 或者称之为 lane中。用一张更清晰的图进行说明:
    在这里插入图片描述
  • 第三步:Cluster generation 簇生成 (从这里往后来自https://blog.csdn.net/sixu_9days/article/details/78948914 ,总结的更加清晰简单易懂)
  1. Flowcell上随机分布了两种不同的寡核苷酸序列,分别与P5互补(即P5’),与P7一致(即P7)。
    在这里插入图片描述
  2. 待测sequence通过P5与folwcell上的P5’序列杂交互补,以待测sequence为模板进行互补链(即reverse strand)的延伸,互补链的两端为P5’和P7’。

在这里插入图片描述
在这里插入图片描述
3. 接下来模板链被切断并洗下在这里插入图片描述
Reverse strand的P7’与Flowcell上的P7杂交互补,进行链的合成,这就是我们所熟知的桥式PCR在这里插入图片描述
接下来合成的双链被解链,再分别与Flowcell上的接头杂交互补,延伸…解链,杂交,延伸,解链…如此重复35个循环
在这里插入图片描述
4. 桥式PCR完成后,使用NAOH将双链解链,并利用甲酰胺基嘧啶糖苷酶(Fpg)对8-氧鸟嘌呤糖苷(8-oxo-G)的选择性切断作用,选择性地将P5’与链的连接切断,留下与Flowcell上P7连接的链,也就是Forward strand。同时游离的3’端被阻断,防止不必要的DNA延伸
在这里插入图片描述

  • 第四步,测序
  1. 测序引物(sequencing primer)结合到靠近P5的测序引物结合位点1(sequencing primer binding site 1)上,在系统中加入四种dNTP和DNA聚合酶。这里的dNTP有两个特点:它是有荧光基团标记的,每种碱基标记的荧光基团不一样。它的3’末端连了一个叠氮基。这个叠氮基能够阻断后面的碱基与它相连
    在这里插入图片描述
    因此在聚合酶的作用下,与Forward strand相应位置碱基配对的dNTP就会结合到新合成的链上,而由于叠氮基的存在,后面的dNTP无法继续连接。这时用水将剩余的dNTP和酶给冲掉,将Flowcell进行扫描,扫描出来的荧光对应的碱基的配对碱基即是该链该位置的碱基。同时在这个Flowcell上有成千上万个cluster也在进行同样的反应,因此一个循环就能同时检测多个样本(这也是高通量的核心所在)。这个循环完成后,加入化学试剂把叠氮基和标记的荧光基团切掉,进行下一个循环(碱基的连接、检测与切除)。如此重复直至所有链的碱基序列被检测出。也就是Forward read 序列。
    在这里插入图片描述
  2. Index测序:所有循环结束后,read products 被洗掉,index1 primer与链上index primer1 结合位点杂交配对,进行index1的合成及检测在这里插入图片描述
  3. 以类似的方法进行index2和reverse strand的测序。

链特异性文库构建

也来自sixu_9days的博客:https://blog.csdn.net/sixu_9days/article/details/81222407
首先明确几个概念:
正义链(sense strand):两条互补的DNA链其中一条携带编码蛋白质信息的链称为正义链,又称编码链,因为它的序列与mRNA相同

反义链(antisense strand):另一条与之互补的称为反义链。而反义链虽然和RNA反向互补,但它可是真正给RNA当模板的链,因此反义链也是模板链

要注意的是:在一条包含有若干基因的双链DNA分子中,各个基因的正义链并不都是在同一条链上

正义链(sense strand)= 编码链(coding strand)= 非模板链
forword strand 上可以同时有sense strand 和 antisense strand。因为这完全是两个不同的概念

下面通过这张建库示意图来看看普通RNA-Seq建库和链特异性建库的差异在什么地方在这里插入图片描述
首先说说普通的RNA-Seq建库方式:它是在RNA逆转录成双链cDNA的两端,对称地加上了两个Y型的接头,然后变成文库。它有一个缺点,就是它是以双链DNA进行测序。所以测完序后,我们无法知道测出来的reads是来自正链还是负链。

链特异性建库(以图中间的dUTP方法为例)则是首先利用随机引物合成RNA的一条cDNA链,在合成第二条链的时候用dUTP代替dTTP,加adaptor后用UDGase处理,将有U的第二条cDNA降解掉。降解发生之后,双链的文库就只剩下了一条链(负链)。而这条链的两头是接的不同序列的接头。通过PCR扩增,最终只保留了第一条cDNA(负链)上机测序。这样最后的insert DNA fragment都是来自于第一条cDNA(负链),也就是dUTP叫fr-firststrand的原因。在测序的过程中先测得正链reads,再测得负链reads(能区分正负链reads,这就是和普通建库最根本的不同)。在这些reads比对到参考基因组时,那些比对到基因方向(正义链方向)的正链reads就是正义链reads,但是那些比对到基因方向反方向(反义链方向)的正链reads就是反义链reads。那么同样,比对到基因方向的负链reads就是正义链reads,而比对到基因方向反方向(反义链方向)的负链reads就是反义链reads。从而最终将所有正义链reads和反义链reads区分开来。因此在确定基因表达水平时,可以避免基因反义链上的reads匹配的干扰,从而更加准确的检测基因转录表达水平。而且LncRNA的测序也离不开链特异性建库技术。原因有三:

1)lncRNA的来源是具有链特异性的;

2)lncRNA来源就是编码蛋白(mRNA)​基因的反义链,是传说中的天然反义lncRNA(NAT-antisense lncRNA);如果是普通非链特异性建库,那么序列是来自mRNA,还是NAT-antisence LncRNA就难以区分了;

3)​链特异性建库可更准确地统计转录本的数量和确定基因的结构,准确区分获得的转录本来自基因组哪条链。​
后面有点被绕晕了。。休息会,下午接着学习下一部分


http://chatgpt.dhexx.cn/article/M6tuHRoG.shtml

相关文章

NGS数据分析实践:05. 测序数据的基本质控 [2] - MultiQC

NGS数据分析实践:05. 测序数据的基本质控 [2] - MultiQC 2. MultiQC2.1 帮助信息及运行代码2.2 报告解读2.3 小结 文接上篇:NGS数据分析实践:05. 测序数据的基本质控 [1] - FastQC 2. MultiQC NGS技术的进步催生了新的实验设计、分析类型和极…

NGS数据分析实践:03. 涉及的常用数据格式[2] - sam/bam格式

NGS数据分析实践:03. 涉及的常用数据格式[2] - sam/bam格式 2. sam和bam格式 系列文章: 二代测序方法:DNA测序之靶向重测序 NGS数据分析实践:00. 变异识别的基本流程 NGS数据分析实践:01. Conda环境配置及软件安装 NGS…

NGS数据过滤之trimmomatic

NGS 原始数据过滤对后续分析至关重要,去除一些无用的序列也可以提高后续分析的准确率和效率。Trimmomatic 是一个功能强大的数据过滤软件。 Trimmomatic 介绍 Trimmomatic 发表的文章至今已被引用了 2810 次,是一个广受欢迎的 Illumina 平台数据过滤工具…

NGS基础:测序原始数据批量下载

生物或医学中涉及高通量测序的论文,一般会将原始测序数据上传到公开的数据库,上传方式见测序文章数据上传找哪里;并在文章末尾标明数据存储位置和登录号,如 The data from this study was deposited in NCBI Sequence Read Archive under acc…

NGS之数据格式

生物信息中常见的几种数据格式有:fasta、fastq、bam、sam、vcf、bed、gff。 参考:http://www.biotrainee.com/thread-42-1-1.html FASTQ 参考:https://en.wikipedia.org/wiki/FASTQ_format fastq格式是文本格式。它有对应序列字符的质量分数&#xff…

生信小白学习日记Day3——NGS基础 NGS分析注解(质量分析软件)

2019年5月27日,天气舒适,忙碌一天之后开始今天的生信学习。今天就昨天Day2-2的一些标记加以查询说明,仅供参考。 NGS基础 NGS分析注解 1. 质量分析软件 昨天提到,拿到数据后可以通过一些软件来评估测序质量的好坏,…

NGS 数据过滤之 Trimmomatic

NGS Trimmomatic 支持多线程,处理数据速度快,主要用来去除 Illumina 平台的 Fastq 序列中的接头,并根据碱基质量值对 Fastq 进行修剪。软件有两种过滤模式,分别对应 SE 和 PE 测序数据,同时支持 gzip 和 bzip2 压缩文…

NGS基础名词解释(1)

什么是高通量测序? 高通量测序技术( High-throughput sequencing , HTS )是对传统 Sanger 测序(称为一代测序技术)革命性的改变 , 一次对几十万到几百万条核酸分子进行序列测定 , 因此在有些文献中称其为…

【评测】NGS建库试剂盒

NGS建库试剂 一、基本信息: 1、产品名称:SynplSeq DNA Library Prep Kit for Illumina 2、货号及规格 3、保存条件:-20℃ 二、产品描述: 1、产品介绍 文库构建是NGS测序的关键环节。SynplSeq DNA Library Prep Kit for illu…

NGS分析流程

NGS实验步骤 核酸提取与检测、文库构建与文库检测、上机测序 生信分析步骤 1. 质量分析 fastqc、multiqc、SolexaQA 测序数据的质量好坏会影响我们的下游分析。但不同的测序平台其测序错误率的图谱都是有差别的。因此,非常建议在我们分析测序数据之前先搞清楚如…

生信小白学习日记Day2-2——NGS基础 NGS分析

2019年5月26日下午,无意中看到hanli0902的关于NGS分析的博文https://blog.csdn.net/hanli1992/article/details/82790386有很多需要学习的地方,在这里贴一些并就不理解之处做些笔记,仅供参考。 NGS基础——NGS分析 NGS 分析步骤 1. 质量分析…

NGS实验室设计

NGS(Next-Generation Sequencing)实验室是进行高通量测序研究的场所,其规划布局需要考虑实验室的功能需求、设备需求、安全性、通风与空调、废弃物处理等多方面的因素。以下是NGS实验室规划布局需要考虑的几个方面: 1、实验室空间…

【gis技术】web墨卡托投影和经纬度直投的差别

本文不适用于不知道投影概念的人。 web墨卡托投影 是以经度0,纬度90为原点,x正轴朝东(右),y轴朝南(下); 格网分割为2*2格网划分,如图 经纬度直投的原点和轴向与前者一致…

墨卡托投影坐标系(Mercator Projection)原理

Web墨卡托投影坐标系: 以整个世界范围,赤道作为标准纬线,本初子午线作为中央经线,两者交点为坐标原点,向东向北为正,向西向南为负。 X轴:由于赤道半径为6378137米,则赤道周长为2*P…

网络墨卡托投影的前世今生

谷歌地图、微软地图、百度地图、腾讯地图、高德地图等网络地图所使用的投影都是网络墨卡托投影(Web Mercator),尽管我们喜欢把百度地图、高德地图称之为火星坐标系,不过它们还是没逃出网络墨卡托投影的手心。 网络墨卡托投影由墨卡…

墨卡托投影原理及瓦片公式推导

墨卡托投影 墨卡托投影将地球球面投影到一个圆柱体柱面上,将地球看作一个正球体时,以 O O O为地球球心,从球心向外辐射射线,与地球外接圆柱面交与 P ′ P P′。 设纬度为 ϕ \phi ϕ,经度为 λ \lambda λ,其中: ϕ ∈ ( − π 2 , π 2 ) \phi\in(-\frac{\pi}{2},\fr…

墨卡托投影实现

又称正轴等角圆柱投影。圆柱投影的一种,由荷兰地图学家墨卡托(G. Mercator)于1569年创拟。为地图投影方法中影响最大的。 设想一个与地轴方向一致的圆柱切于或割于地球,按等角条件将经纬网投影到圆柱面上,将圆柱面展为…

墨卡托投影推导

废话 为啥一堆人都说墨卡托投影是从圆心向圆柱面发射线, 反正我觉得不是那样, 不然公式显然就不对了(也可能是我马虎), 后来去wiki查了一下, 找到了公式的推导. 公式 x = R ( λ − λ 0 ) , y = R ln ⁡ [ tan ⁡ ( π 4 + φ 2 ) ] . {\displaystyle x=R(\lambda -\lambda …

墨卡托投影学习

看下图; 这是超图自带示例;墨卡托坐标系图层的加载; 右下角,看上去数字很大,还有五位小数,的数字,这值就是墨卡托坐标的值; 看一下代码,看不出来是墨卡托坐标系&#x…

墨卡托投影与瓦片地图

目录 一、开胃小知识 二、墨卡托投影 1、什么是墨卡托投影? 2、墨卡托投影的特点 3、墨卡托投影的缺点 三、瓦片地图 1、GIS介绍 2、瓦片地图原理 四、瓦片地图原理---续 1、经纬度 2、投影 3、瓦片 4、瓦片编号 5、关于中国的经纬度 一、开胃小知识 …