宏基因组生信分析方法介绍

article/2025/11/7 2:38:58

随着高通量技术的发展,宏基因组学(metagenomics)已经成为研究微生物群落物种及功能的前沿科学,在肠道微生物、环境微生物等研究领域具有广泛应用。宏基因组学通过对微生物群落全部DNA进行高通量测序,将测序序列与公共数据库进行比对或从头组装出微生物基因组,从而识别微生物群落的物种和功能基因

目前主流的宏基因组数据分析方法包括三种:基于测序结果进行组装的分析方法;基于reads直接和已知数据库进行比对的方法;基于分箱bin的方法。

常用到的分析工具见下图:

 

一、基于组装

数据分析从下机原始序列开始,首先对原始序列进行去接头、 质量剪切以及去除污染等优化处理。然后使用优质序列进行拼接组装和基因预测,将各样本预测得到的基因集合并在一起去冗余,得到非冗余基因集;对得到的非冗余基因集与NCBI的nr数据库进行比对,得到物种信息,与各个功能数据库(抗性基因ARDB/CARD、碳水化合物CAZy数据库、KEGG数据库,eggnog数据库、VFDB数据库)进行比对,得到不同功能的注释结果。并使用BWA软件将优化序列比对到非冗余基因集,计算得到各基因在各样品中的丰度信息(RPKM); 最后对物种和功能注释结果进行统计及后继分析。

具体分析的流程见下图:

 

二、基于Reads

基于Reads的宏基因组分析,使用质控好的优化序列与已知物种和功能数据库进行比对,从而得到每个样本的物种、功能注释信息和相对丰度。此方法最大的优势是不用进行基因组的组装,从而快速的得到群落的物种与功能组成信息。

物种注释:从质控好的优化序列出发,使用Kranken2软件和微生物数据库(包括RefSeq最近的99版本基因组数据,涵盖细菌、真菌、病毒、古菌、原生动物)鉴别样本中所含的物种,再用Bracken对Kraken2得到的分类结果进性分类后贝叶斯重新估算丰度来估算宏基因组样本的种级别相对丰度;

功能注释:从质控好的优化序列出发,使用HUMAnN3软件和蛋⽩质数据库(UniRef90)进⾏⽐对,根据UniRef90 的ID 和各个功能数据库ID的对应关系,统计各个功能数据库对应功能相对丰度;

其他功能数据库:使⽤FMAP软件将各样本质控好的优化序列与参考数据库进⾏⽐对(基于DIAMOND),根据⽐对结果,统计出每个样本⽐对到各参考序列的reads数,从⽽计算相对丰度;

具体分析流程见下图:

三、基于Bin分析

宏基因组分箱(Binning)是将序列组装得到的Contigs按物种分开归类的过程。基于Binning的宏基因组分析流程,数据分析从下机原始序列开始,首先对原始序列进行去接头、 质量剪切以及去除污染等优化处理。然后使用优质序列进行拼接组装得到Contigs;使用metabat2和maxbin2软件分别对每个样本的Contigs进行分箱;不同软件分箱得到的bin进行合并(binning_refiner)、提纯(MAGpurify);然后将所有样优化后的bin进行去冗余(dRep);而后分别从物种和功能方面进行信息统计。

具体分析流程见下图:

四、三种方法各自的优缺点:

1、基于组装的方法可以得到各个ORF的丰度信息,不管该ORF是否有对应的功能或是物种信息。如果是环境样本,微生物非常复杂,里面会得到的ORF信息量大,导致分析需要的时间延长。

2、基于Reads与已知序列Mapping的方法,没办法表征大量尚未分离和测序的微生物群体。现有的比对算法只能发现近缘关系,且仅能用于分析数据库中与基因组最密切相关的环境微生物。

但是基于基于Reads与已知序列Mapping的方法可以快速的得到物种和功能分析的结果。

3、Binning:Metagenome 组装完成后,我们得到的是成千上万的 contigs,我们需要知道哪些 contigs 来自哪一个基因组,或者都有哪些微生物的基因组。所以需要将 contigs 按照物种水平进行分组归类,称为 "bining"。主要依据是:来自同一菌株的序列,其核酸组成是相似的。优势:通过宏基因组测序尽可能完整的组装出样本中菌株的基因组。


http://chatgpt.dhexx.cn/article/XZkHuFfv.shtml

相关文章

宏基因组分析-基于组装

一、介绍 宏基因组 ( Metagenome) 指特定环境下所有生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因。一般从环境样品中提取基因组DNA, 进行高通量测序,从而分析微生物多样性、种群结构、功能信息、与环境之间的关系等。 宏基因组的分析目前主要包…

逻辑回归的常见问题

文章目录 逻辑回归概括逻辑回归的基本假设逻辑回归的损失函数交叉熵损失函数的原理交叉熵损失函数的直观理解logistic回归和线性回归的关系线性回归和逻辑回归的异同逻辑回归是线性模型吗类别的分界线是什么逻辑回归输出值是概率吗逻辑回归也可以处理多分类逻辑回归的求解方法梯…

SQL逻辑运算

SQL逻辑运算符 SQL 逻辑运算符逻辑运算符 ALL逻辑运算符 AND逻辑运算符 ANY逻辑运算符 BETWEEN逻辑运算符 EXISTS逻辑运算符 IN逻辑运算符 LIKE逻辑运算符 NOT逻辑运算符 OR逻辑运算符 IS NULL SQL 逻辑运算符 运算符描述ALL所有运算符用于比较的值到另一个值组中的所有值ANDA…

逻辑英语-写作

指日可待 In this way, a better tomorrow will not be a question of if, but when.1、shoulder 我们应当承担起保护环境的重任。 We must shoulder the liability of -----2. Word 我对你的感谢已经溢于言表 My thanks to you is beyond words.3. house 容纳 A wise man she…

逻辑英语公式R1+R2

一、主谓宾 1.1、主语 一般是名词,一般是动作的发出者,或者是被描述的对象 1.2、宾语 一般也是名词,一般是主语作用到的对象。 1.3、谓语 如果没有谓语那么这个世界就是静态,谓语就是来让这个主语和谓语产生关系。 常见的是…

串口USART和UART

串口通信: UART是通用串行数据总线,用于异步通信。该总线双向通信,可以实现全双工传输和接受。UART主要用于主机与辅助设备通信。 UART的功能计算器内部采用并行数据,不能直接把数据发到Modem,必须经过UART整理才能进…

【通信接口】UART、IIC、SPI

目录 一、预备知识 1、串行与并行 2、单工与双工 3、波特率 二、UART 三、IIC 四、SPI (一对一、一对多) 五、IIC、SPI异同点 参考文章:这些单片机接口,一定要熟悉:UART、I2C、SPI、TTL、RS232、RS422、RS485…

基于FPGA的UART接口设计

一、顶层设计思路: UART即通用异步收发传输接口(Universal Asynchronous Receiver/Transmitter),简称串口,是一种常用的通信接口,其协议原理就不赘述了,不了解的可以自己查阅资料。(…

单片机通信接口:UART、I2C、SPI、TTL、RS232、RS422、RS485、CAN、USB

参考资料: 这些单片机接口,一定要熟悉:UART、I2C、SPI、TTL、RS232、RS422、RS485、CAN、USB、SD卡 秒懂所有USB接口类型,USB接口大全 1. UART UART(通用异步收发器)指的是一种物理接口形式(硬件)。 UART是异步,全双…

通信接口:UART、I2C、SPI、TTL、RS232、RS422、RS485、CAN、USB

1. UART UART(通用异步收发器)指的是一种物理接口形式(硬件)。 UART是异步,全双工串口总线。它比同步串口复杂很多。有两根线,一根TXD用于发送,一根RXD用于接收。 UART的串行数据传输不需要使用时钟信号来同步传输,而是依赖于发送…

USB,串口(RS232、RS485),UART接口

USB转串口即实现计算机USB接口到通用串口之间的转换。为没有串口的计算机提供快速的通道,而且,使用USB转串口设备等于将传统的串口设备变成了即插即用的USB设备。作为应用最广泛的USB接口,每台电脑必不可少的通讯接口之一,它的最大…

Uart接口的详细解释

我面试的时候一般喜欢问应聘者一个问题:UART与RS232/RS485的区别与联系?很多人对于这个问题答得都不是很好。还有些人压根就没有想过这个问题,一直认为他们是同一个东西,就是咱们俗称的串口。 我刚入嵌入式的大门时,对…

UART接口说明

逼近年关事情多,少了更新。今天冒个泡。说下UART通信接口。 UART扫盲 前面做了SPI和I2C,前两者一个是摩托,一个是飞利浦背书,简单好理解。这个UART就相对复杂一点,全称universal Asynchronous Receiver/Transmitter …

UART接口详解

文章目录 简介硬件接线RS232RS485RS232和RS485比较 通信原理uart和usart的区别实例针对STM32的串口数据位特点,改成对应PC的串口数据校验当使用9600波特率的时候,通讯稳定,当使用115200波特率的时候,通讯变得不稳定。 简介 UART全…

UART接口介绍

0 Preface/Foreword UART是Universal Asynchronous Receiver and Transmitter简称,中文为 通用异步接收和发送器,是常用的串行通讯接口。 RS-232:RS-232标准接口(aka. EIA RS-232)是常用的串行通信接口标准之一&#…

一文理解UART通信

还记得当年的打印机,鼠标和调制解调器吗?他们都有巨大笨重的连接器和粗电缆,并且必须拧到你的电脑上。这些设备正是使用UART协议与计算机进行通信。虽然USB几乎完全取代了旧的电缆和连接器,但UART绝对没有过时。您会发现目前许多项目中使用U…

Ajax传json对象(jQuery)

Ajax传json对象 相信很多小伙伴想要通过Ajax传输json数据给后端,本来直接发送一个data: JSON.stringify(obj)就可以了,但是发现后端的请求参数中有一个参数需要int类型,这个时候就需要用到对象了。 封装对象 首先得到数据并封装对象 &…

十分钟搞懂JSON(JSON对象---JSON字符串---对象 之间的区别)

好记性不如烂笔头&#xff0c;相信我&#xff0c;看了之后你会彻底搞懂JSON 前言&#xff1a;前天被JSON对象&#xff0c;JSON字符串&#xff0c;JAVA对象搞混了&#xff0c;不知道各自代表的意思&#xff0c;我就查了资料&#xff0c;总结为一篇博文。 另外我想List<User&g…

【python】将json字符串转化为json对象

首先导入python自带的json模块 import json loads方法将json<key,value>字符串转化为dict形式 info {"name":"Lucy","age":22,"addr": "China"} print(type(info)) info_dict json.loads(info) print(info_dict)…

将js对象转化为json对象

<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title><script type"text/javascript">//编写 一个JavaScript对象&#xff0c;var user {name: "asdas",age…