微生物组-扩增子16S分析和可视化(2022.10)

article/2025/1/13 10:30:55

课程改为长直播模式,报名后就可以学习,时间更充裕,练习更充分

具体见:易生信培训改为长周期模式

福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析、宏基因组、转录组的线上/线下同时开课。报名参加线上直播课的老师可在1年内选择参加同课程的一次线下课 。期待和大家的线上线下会晤。

目前可以通报的信息:

  • 临床基因组学线上/线下开课时间:2022/8/26-2022/8/28

  • 宏基因组线上/线下开课时间:2022/8/19-2022/8/21

  • 扩增子线上/线下开课时间:2022/10/14-2022/10/16

  • 转录组线上/线下开课时间:2022/10/21-2022/10/23

  • 报名链接:http://www.ehbio.com/Training/

a439e6e54b0d7260637711c0f14347b9.jpeg

在广大粉丝的期待下,《生信宝典》联合《宏基因组》在北京于2022-10-14到 2022-10-16推出《扩增子16S分析》专题培训第17期(线上课和线下课程同步开通),为大家提供一条走进生信大门的捷径、为同行提供一个扩增子分析实战学习和交流的机会、助力学员真正理解分析原理和完成实战分析,独创四段式教学(3天集中授课+自行练习2周+集中讲解答疑+上课视频回看反复练习),“教—练—答—用”四个环节统一协调,真正实现独立分析大数据

关于学习生物信息学分析的重要性,请阅读《生物信息9天速成班—成为团队中不可或缺的人》。

课程简介

宏基因组/微生物组是当今世界科研最热门的研究领域之一,为加强本领域的技术交流与传播,推动中国微生物组计划发展,中科院青年科研人员创立“宏基因组”公众号,目标为打造本领域纯干货技术及思想交流平台。成立两年,分享专业技术原创文章3000+篇,关注人数13万+,累计阅读量31,000,000+。

请详细阅读课程简介,如果以下内容您全精通,不必参加此培训。

本课程一共3天,每天6节课,共18节课,全部课程均理论与实战结合(只要课上讲的内容,都是要带你亲自实现的分析)。从分析平台搭建、Linux和R基础、图表解读和绘图实战、扩增子分析标准流程、功能预测、差异统计分析以及各类高级分析(进化树、网络、环境因子、随机森林、Adaboost和来源追溯等),和CNS级图片编辑和排版。3天时间,老司机带您完成自学需要3个月甚至是3年的崎岖之路,助力您真正玩转扩增子分析。

课程大纲

每节课1小时一个主题,理论结合实战,学懂原理,实战操作,全是老司机多年经验和代码的无私分享。下面是课程安排,如11代表第一天第一节课,26代表第二天第六节课,41为两周后的线上集中视频答疑。

编号主题简介
11分析平台搭建Win10:git、R、Rstudio、R包、STAMP、AI等
12Linux基础简介、优势、常用操作、序列处理、软件安装等
13R基础发展史、生物学中应用、ggplot2绘图、模板
14图表解读常用16种图表意义、使用场景
15结果可视化16种图表的数据整理和在线绘制
16发表级图版制作Adobe Illustrator制作CNS标准图版
21扩增子介绍背景知识、分析原理、科学问题
22扩增子分析流程vsearch+usearch跨平台分析流程
23STAMP统计分析玩转样本筛选、差异比较和统计图表保存
24多样性分析R语言实现多样性、物种组成和差异比较图表
25QIIME2Linux平台QIIME2私人定制流程
26网络分析文章解读,实战网络绘制和属性比较
31PICRUSt功能预测KEEG功能组成预测和统计绘图
32Faprotax,Bugbase细菌元素循环和表型层面功能挖掘
33机器学习随机森林分类回归,重现两篇Nature分析、来源追溯
34进化分析序列筛选、比对、进化树构建和美化
35环境因子文章解读,高分文章重现
36研究热点展望总结、把握研究热点、展望技术发展趋势
37考试50题自评学习效果、知识点回顾
41答疑-线上答疑、考试内容串讲

教程内容简介如下:

一、生信基础知识和技巧

还在为没有Linux服务器而无法分析扩增子数据而苦恼吗?其实你的个人电脑就是扩增子分析的利器。易生信团队独创实现了跨平台的分析流程,在大家的Windows笔记本上可以轻松实现扩增子领域的绝大多数分析,第一节课带你轻松在自己的本本上搭建数据分析平台。

c78ad1935fdd777e601f1d200d509b99.jpeg

图1. 易生信首创基于Win10优化的扩增子分析流程,笔记本秒变大数据分析平台

推荐使用Windows10系统,8G及以上内存分析更流畅。 我们也会分享给大家在Linux上配置整个分析流程的代码 (Mac跟Linux类似,无须区别对待,但部分软件可能安装方式不同,未做深入测试,不建议参加培训时使用)。

同时讲解生物学家必要掌握的Shell和R语言基础知识,保证你高效、稳定的使用扩增子分析平台。

237c7365e253f14967a10eed05a5ab88.jpeg

图2. Shell和R学习大纲,首创Rstuio中鼠标点击可完成Shell脚本和R语言分析,既打开生信的大门,又不会增加生物学家时间成本

二、图表解读和绘制

针对很多老师缺少系统的生信背景,看不懂分析文章图表,更对绘制各式图表手足无措。

我们推出过如下两个系列,共16篇原创文章,对8种图形进行讲解和R语言绘图。

  • 扩增子图表解读-理解文章思路

  • 扩增子统计绘图-冲击高分文章

但这些只是入门,在培训上,我们将结合发表高水平文章,进一步讲解16种常用分析图型结果的原理和使用范围,让您不仅读懂图,更知道如何应用于自己的研究,并亲自轻松完成绘图。

针对大家使用R语言绘图学习时间成本较高的问题,易生团队针对常用16种图开发了免费绘图网站,一键出图,更可鼠标点选参数修改图形的个性样式。

26a24e44e10f0e3a7a40ead4019681ff.jpeg

图3. 16种常用图形的绘制。可使用我们的在线绘图工具实现。

为了让各种统计图片实现出版级的组图,特开设了一节Adobe Illustrator修图排版课,讲述基本使用技巧,轻松掌握精髓,让你文章图版档次向CNS看齐,轻松成为实验室的修图和拼图达人。

c70a729a9410fd662e73f549f67deeee.jpeg

图4. AI排版本子图为CNS出版级组图示例(Science, 2016封面文章)

三、扩增子基础和分析流程

b627a1eb0304a536912af278b2a19419.jpeg

图5. 典型的扩增子结构模型图

  • 扩增子背景知识

  1. 背景:国际微生物组(人类HMP、环境EMP)计划、中国微生物组计划

  2. 研究对象:人、动物、植物、环境

  3. 研究方法:培养组学、扩增子测序 (最常用)、宏基因组、宏转录组、宏蛋白组、宏代谢组、宏表观组等

  4. 宏基因组学的研究热点:微生物多样性、宏基因组、培养组、肠菌与疾病、MWAS

  5. 扩增子基本原理:细菌/古菌 16S、真菌18S/ITS结构、引物选择等

  6. 实验设计:样品制备和建库中的误区

  7. 文章套路:扩增子分析SCI文章的物种组成、功能预测常用套路

  8. 主流方法优缺点比较:QIIME、QIIME2、mothur、Usearch-unois3、dada2等方法

  • 扩增子分析流程

之前我们发布了基于QIIME(引用24000+)+USEARCH(引用14000+)组合的史上最详细中文扩增子分析流程,累计阅读10000+。

  • 扩增子分析流程-把握分析细节

同时在2017年推出了2018年正式接档QIIME的最新流程QIIME2的官方中文帮助文档,累计阅读10万+。

  • QIIME2中文教程-把握分析趋势

想使用QIIME和QIIME2的小伙伴可直接点击上方链接学习。课上也会带大家用服务器操作,分享最新私人定制流程。

但上面两种分析流程仍有很多缺点,如需要Linux服务器,安装和操作复杂,学习时间成本过高等不足。

易生信团队组织宏基因组、生信宝典的一线生信专家,为广大生物学家,定制了一套安装部署简单、鼠标点击编程、支持主流操作系统、学习成本低、又灵活的扩增子分析流程,助力生物学家轻松分析数据,更专注生物学现象的挖掘。

2ef84b88bb501ab0faedf9ed2c1593a1.jpeg

图6. 扩增子分析流程金字塔,数据量从下向上逐渐减少

  • 扩增子流程如下:

  1. 实验设计的编写

  2. Illumina测序数据的质控:fastqc, mulitqc

  3. 质控流程:双端序列合并、切除barcode和引物、质控

  4. 生成OTU/ASV:序列去冗余、聚类clust_otu生成OTU或unoise3去噪生成ASV(Amplicon Sequence Variants)

  5. OTU筛选:嵌合体生成原理及去除方法、去除线粒体、叶绿体和宿主非特异扩增污染、生成代表性序列和OTU表

  6. 物种注释及进化树构建

  7. 常用Alpha多样性指数计算

  8. 常用Beta多样性距离矩阵计算

现在你可以在自己笔记本或台式机上轻松分析扩增子啦!并且支持最新的去噪生成ASV方法,想自己亲自分析的朋友,快来北京参加扩增子专题培训班吧!

7a5658154460cbbcee769b7e22856798.jpeg

图7. 常用宏基因组统计作图软件STAMP & LEfSe

引用过千次的STAMP绘制Extended barplot大家应该很常见,带你半小时速成。LEfSe引用超4000+次,它的柱状图和圈图随处可见,但服务器超级难用,即上传痛苦,又要久等。我们为学员定制了国内专享服务器,随时为你服务。有服务器的伙伴还可以获得安装和使用的教程,在自己的服务器上可重复计算,不受网络和地域限制自己随时随地使用。

四、可重复计算和统计绘图

对于可重复计算要求比较高、对细节有进一步分析要求的学员,我们还会教大家当前最顶级的R语言统计分析框架,让你零基础轻松实现可重复计算,满足顶级文章的代码公开和网页可重复要求(这些资源在生信公司是价格几十万的绝密流程代码,一般人是没有机会见到的)。

e80703381b9e7bfc05485bd39050e4a4.jpeg

图8. 数10种高质量图的R源代码实现可重复计算

在自己电脑上轻松修改输入文件、参数。可全程记录分析过程,保证从数据到发表级图形的可重复计算,让团队分析水平上升到大牛级别。

  1. Alpha多样性各种指数:Shannon、Chao1、Observed OTU、PD whole tree等,并配合Anova,LSD统计;

  2. Beta多样性各种距离矩阵:Bray Curtis、Jaccard、Weighted Unifrac、Unweighted Unifrac等结果的树状图、箱线图、散点图展示样品间差异;并配合Adonis, Anosim, MRPP统计

  3. 有监督的主坐标轴分析 (CCA/RDA),展示组间差异,anova.cca统计

  4. DESeq/edgeR/t.test/wilcoxon统计组间差异,计算Pvalue和FDR

  5. 热图、曼哈顿图、火山图展示两组间比较差异分类单元、OTU/ASV

  6. 韦恩图、三元图、网络图展示两组及多组间相同与不同

五、功能预测和机器学习

学习PICRUSt分析原理、常用结果展示样式及文章解读。实战进行官网、本地、在线分析,并对结果进行整理,方便STAMP、LEfSe以及R分析。下图为预测结果经STAMP快速分析的结果展示,学员可以在老师带领下35分钟内完成以上分析。

1373076077abc2908b0baae8871710f5.jpeg

图9. 功能预测结果使用STAMP统计和可视化

对于不满足用KEGG功能预测和统计结果的小伙伴,我们还进一步讲解FAPROTAX (2016, Science)的分析,适合研究环境、元素循环的同行;此外还有BUGBASE分析,实现细菌代谢、厌氧性、革兰氏分类等表型预测,适合医学领域的同行使用。

5a2ecf11055309ab3552d529017d157e.jpeg

图10. 重现两篇Nature文章机器学习分类和回归分析

上图:Wilck-2017-Nature,采用Adaboost进行分类和测试集验证准确率。
下图:Subramanian-2014-Nature,采用随机森进行回归、交叉验证、测试集检验模型准确率和热图展示特征OTUs时间序列变化。
高分文章离我们并不是遥不可及,在你的本本上,1个小时轻松重现每一个子图的分析和绘制。读懂这两类分析的结果。

六、网络和环境因子分析

0f47618a553f09dbfa18666295eb063a.jpeg

图11. 两组网络比较、以及网络属性比较(Wang-2018-Gut)

还以为随便画个网络就能当文章的主图吗?这个时代早已成为历史。现在的高分文章,至少要求多网络比较,标配网络属性比较。在这里有微生物所微生物网络研究方向的博士,带你进入网络的世界,四步走实现即美观又有意义的网络分析:读懂网络——绘制单个网络——绘制多个网络——网络属性比较及可视化。这么前沿的技术,估计世界范围内只有这里会教你。

c56e437e3401ff5300ea707b23f84cad.jpeg

图12. 环境因子分析(Metcalf-2016-Science)

环境因子分析是很多研究的标配,常用的Vegan包引用过万次就知道它的重要性。但平时看到的图不是低分文章,就是不够美观。易生信团队精选Rob Knight团队2016年Science杂志中经典环境因子分析为例,让你的分析和可视化一步到位,向CNS看齐。

往期精彩回顾

fa89ccc040a71b89059ea01bee568883.jpeg
dc101ed25464acf4c964483b1a5d9c9d.jpeg
6481d4a05a8253888acd89a9db2eebf3.jpeg32a063e64274498a8869024d53b9ef2e.jpeg

主讲教师

主讲老师包括中科院微生物所、遗传发育所、基因组所、生物物理所等多名本领域一线技术专家。

刘永鑫,生物信息学博士,中科院高级工程师,青促会会员,iMeta期刊执行主编,宏基因组公众号创始人。研究方向为微生物组数据分析、方法开发与优化和科学传播。目前以第一作者(含共同)或微生物组数据分析负责人在ScienceNature BiotechnologyCell Host & Microbe 等杂志发表论文40+篇,引用7000+次。微生物组分析平台QIIME 2项目参与人。受邀以第一作者和/或通讯作者(含共同)在Protein & CellCurrent Opinion in Microbiology遗传 等杂志发表微生物组研究方法综述。2017年7月创办“宏基因组”公众号,目前分享本领域相关原创文章2900余篇,代表作品有《微生物组图表解读、分析流程和统计绘图》、《QIIME2中文教程》等,关注人数13万+,累计阅读3100万+。

陈同,博士,副研究员,2015毕业于中科院遗传发育所,生物信息博士,在Cell Stem Cell(IF=23.2,第一作者兼封面文章)、Nature Communications、Nucleic Acids Research X 3、Protein & Cell 等高水平杂志以第一作者或主要作者发表文章,运营有数十万人关注的《生信宝典》微信公众号,给你不一样的学习生信体验。

助教团队

十余名中国科学院、清华、北大博士(含在读),轮值讲师和助教,辅助学员学习和矫正培训过程中不足的点。

授课模式

本课程以讲解流程和实际操作为主,采用独创四段式教学:

  • 第一阶段 3天集中授课;

  • 第二阶段 自行练习2周;

  • 第三阶段 在线直播答疑;

  • 第四阶段 培训视频继续学习;

  • 实现教-练-答-用四个环节的统一协调。

培训时间

2022-7-15到 2022-7-17(线上/线下同步开放)
每天早9点到晚6点,半封闭式教学 (最后1小时为集中讨论时间,最后一天会稍微提前一些,多留出时间讨论,也方便老师乘车返回)
报到时间:上课当天

授课地点

线上线下同步开课:在线会议平台,如腾讯会议。

北京市海淀区中关村东路18号 财智国际大厦C座 C1105

课程价格

1. 开课两周前报名 4500 元/人 (住宿自行解决,提供培训期间午餐)

2. 名额有限,每次课程报名满40人后自动关闭报名通道

3. 提供易汉博基因科技实习机会或工作机会

注意事项 *

1. 需自备笔记本电脑。推荐使用Win10系统,4G以上内存。如果使用其它操作系统,以培训软件能安装运行为主。

2. 课程实践根据需要会提供云计算平台。

3. 培训班所有数据,文档为内部资料,仅供参阅,未经允许不得翻印外传登刊。

4. 上课期间禁止录音,录像。

5. 成功付款的学员,若临时有紧急事情不能到来的,可申请延期,更换后续培训班;也可申请退款。

6. 若临时有事不能参加,请提前联系。开课前两周退报,预付款全退。开课前两周内,预付款退800元,开课前一周内,预付款退500,开课前两天,预付款不退。

7. 不可先延期再退款。

更多课程的详细介绍,请扫描下方二维码。

873ca80b8e7e7aa6c715fe662aa06cf1.png

易生信同时推出多门相关课程,连报、团购有优惠!

  1. 连报优惠——连报n门课,每个课程便宜n-1百元;

    连报课程的优惠不出现在第一门,而是已累计的形式出现在后面几门中,也就是第一门完成了第二门才有优惠。

  2. 老学员优惠

    第二门课程减100,第三门课程减200,后面类比,最多不超过500元。

  3. 多人组团优惠,优惠幅度为参团人数-1百元 (报名时付款时有团员退出的,优惠按实际参团人数计算)。
    4. 优惠后最终价格最低不低于4000元。优惠信息处于动态变化中,价格以系统最终计算出的正确价格为准。

还可与团购同时优惠!推荐扩增子(入门)+宏基因组(进阶)按顺序学习,祝你分析水平更上一层楼,成为实验中不可或缺的人,赶快报名吧!。

c08ea2482d30c04a69b81b7ef8927840.jpeg

访问 http://www.ehbio.com/Training/ 或点击阅读原文跳转报名页


http://chatgpt.dhexx.cn/article/dUAvpF4G.shtml

相关文章

iMeta | 易扩增子(EasyAmplicon):易用、可重复的微生物组扩增子分析流程

点击蓝字 关注我们 易扩增子(EasyAmplicon):微生物组研究中易用的扩增子分析流程 iMeta主页:http://www.imeta.science 研究论文 ● 原文链接DOI: https://doi.org/10.1002/imt2.83 ● 2023年1月27日,中国农科院基因组所刘永鑫团队、中国中医…

扩增子qiime2分析流程

写在前面:写这篇博客只是为了总结自己对扩增子分析流程的理解,加深对扩增子的映像。 扩增子分析前的准备: 软件 qiime2(2023.5)qiime2官方下载地址 ###配置文件下载: wget https://data.qiime2.org/dis…

扩增子全长检测

在土壤、水体、粪便等样本中,里面的微生物有很多种类,其中细菌和真菌是最为常见的微生物。 在细菌的多样性研究,比较多的关注的是编码细菌核糖体16srRNA的序列,由9个可变区和保守区组成。真菌基因也是由ITS1和ITS2高变区以及多个…

扩增子测序

技术介绍 微基生物可利用二代高通量测序、三代高通量测序等平台对土壤、水体、粪便、肠道内容物、唾液、皮肤等样本中的16S rRNA基因/18S rRNA基因/ITS/功能基因等进行检测,检测样本中微生物的种类和相对丰度。 检测项目 16S rRNA基因测序: 16S rRNA基因为编码原…

扩增子定量检测

技术介绍 微基生物提供扩增子定量检测服务。扩增子测序是指利用二代高通量测序、三代高通量测序等平台对土壤、水体、粪便、肠道内容物、唾液、皮肤等样本中的16S rRNA基因/18S rRNA基因/ITS/功能基因等进行检测,检测样本中微生物的种类信息和相对丰度。相对丰度反…

扩增子分析全面升级!加量不加价,数据更多新玩法

加量不加价! 扩增子标准分析流程全面升级! 微生物是一类以分解代谢为主的生物类群,在微生物群落研究中,扩增子一直是了解微生物群落构成及分布的重要手段。基于marker gene的扩增子测序可以反映系统中的微生物多样性的组成。常见…

扩增子分析解读4去嵌合体,非细菌序列,生成代表性序列和OTU表

写在前面 之前发布的《扩增子图表解读》系列,相信关注过我的朋友大部分都看过了(链接直达7月文章目录)。这些内容的最初是写本实验室的学生们学习的材料,加速大家对同行文章的解读能力。 《扩增子分析解读》系列文章介绍 扩增子分析是目前宏基因组研究…

扩增子分析流程 —— 数据处理(vsearch)

本篇文章是笔者学习了刘永鑫老师的扩增子教程以后,根据自己的学习过程总结了一篇使用vsearch工具处理序列数据得出OTU表的文章。笔者这篇文章会根据笔者自身的学习思路,每一步的数据处理都会从三个方面(是什么、为什么和怎么做)去…

扩增子高通量测序

扩增子测序是指利用合适的通用引物扩增环境中微生物的16S rDNA/18S rDNA /ITS高变区或功能基因,通过高通量测序技术检测PCR产物的序列变异和丰度信息,分析该环境下的微生物群落的多样性和分布规律,以揭示环境样品中微生物的种类、相对丰度、进…

从零搭建一个属于自己的智慧语音“魔镜”(MagicMirro+wukong-robot)语音部分

这里我采用的是wukong-robot的开源项目,这个项目可以说是目前语音部分最好的解决方案,给大家分析下整个语音部分的构成,大致分为下面几个模块。 这里的语音识别(ASR)和语音合成(TTS)可以使用百…

树莓派——智能推送

树莓派——智能推送 本教程为python实训作业的笔记,包括了从如何烧系统到最后作品成型我所踩过的坑,走过的弯路(说多都是泪啊_) 开头篇 首先,老爷保号,bug远离我。 随着科技的发展,广告行业的…

树莓派安装开源项目——wukong_robot和魔镜结合 个人经验总结

首先安装树莓派镜像 系统:windows10 工具:SD卡、读卡器、树莓派3b、SD卡格式化工具、win32DiskImager、Raspbian系统镜像、Xshell(ssh工具) 镜像下载可选用官网 https://www.raspberrypi.org/downloads/ 后续镜像烧录与初始化修改 ,可参考多…

从零搭建一个属于自己的智慧语音“魔镜”(MagicMirro+wukong-robot)魔镜部分

语音部分结尾有已经烧录好的完整版镜像,动手能力较差的小伙伴,可以前去自取。 一、系统环境 硬件:原子镜、相框、显示器、至少8g的内存卡、树莓派3b 软件:2019-07-10-raspbian-buster的镜像 镜像链接:https://www.ra…

树莓派使用入门

作者 QQ群:852283276 微信:arm80x86 微信公众号:青儿创客基地 B站:主页 https://space.bilibili.com/208826118 参考 官方文档 官方Github Github raspberrypi/documentation 树莓派(Raspberry pi) 使用Pi Imager安装烧录操作系…

基于树莓派的智能魔镜,支持人脸识别、情感监测、热词唤醒、语音交互,以及与手机APP交互、温湿度/新闻热点/日期显示等

目录 功能清单 界面演示 系统框图 设计方案 整体结构 网站设计 app设计 魔镜界面设计 温湿度传感器 光电传感器 相关教程 第三方库的安装 安装库 换源 安装mqtt 安装Qt5 git clone提速 安装Adafruit_DHT opencv安装 安装字体 安装portaudio 安装snowboy 安装…

将Linux可执行文件变成可执行命令

查看PATH环境变量 echo $PATH 或 env | grep PATH 添加路径到PATH export PATH/usr/test:$PATH 临时改变,只能在当前的终端窗口中有效,当前窗口关闭后就会恢#复原有的path配置,通过修改.bashrc文件可以永久保存。 vim ~/.bashrc export PA…

linux执行软件,软件可执行文件 linux 可执行文件

如何制作exe程序可执行文件 Java制作成exe的安装文件真是太复杂了,有几种打包软件,比如InstallAnyWere等,可以打包成你想要的安装文件,但那个软件是英文版的,功能也挺大的,我也没找到相关的资料&#xff0c…

linux 如何运行一个可执行文件

本文只为整理思路,供自己日后参考。现在就从从一个执行文件a.out的运行开始,自上而下地分析linux是如何运行一个执行文件的。 1、首先,需要了解一下a.out这个目标文件。a.out在linux下是ELF(Executable Linkable Format&#xff…

浅析linux可执行文件

程序是以可执行文件的形式存放在磁盘上的,可执行文件既包括目标代码也包括数据。我们一般所使用的库函数可以被静态的拷贝到可执行文件中,也可以运行时动态链接。 可执行文件是一个普通文件,它描述了如何初始化一个新的执行上下文,也就是如何开始一个新的计算。当进程开始执…

python打包为linux可执行文件

1、将python文件打包后(dist及log文件不需要打包)上传至linux服务器,同一目录下 注:不要打包成zip格式,zip从windos上传至linux解压后会存在编码格式不一致的问题 2、安装pyinstaller打包库 pip installer pyinsta…