使用Trinity进行转录组组装

article/2025/8/19 21:26:17
2013053-a7d7602c84becb61.png
Trinity

Trinity是Broad Institute和Hebrew University of Jerusalem开发的RNA-Seq数据 转录组组装工具,包括三个模块,

  • Inchworn(尺蠖): 将RNA-seq数据组装成单个转录本,通常是主要转录亚型的全长转录本
  • Chrysalis(蛹): 这一步将上一步得到contig进行聚类,对于每个聚类构建完整的德布罗意图(de Bruijin graph)。每个转录本表示的是给定基因或者一组有着共同序列的基因的全部转录组成。 之后会根据图中不相交的点对全部短读数据进行拆分
  • Butterfly(蝴蝶): 并行处理各个图(graph), 追踪每个图中的短读和配对短读的路径,最后报告可变剪切亚型的全长转录本,并且区分出旁系同源基因的转录本

如果不能理解上面这段话,就尝试理解下面这张图吧

2013053-e88fc3f8d879519f.png
流程图

当然如果示意图也让你不好理解的话,那就直接用软件吧,反正这些流程图的目标就是想告诉你,“用我,没毛病”

软件安装用bioconda就行了。

conda create -n Trinity trinity -y
source activate Trinity

运行流程

当你在命令行敲出Trinity后,他就会输出一大堆信息。那么多信息分成3个部分:

  • 必须参数:包括--seqType表示输入序列类型,--max_memory允许使用最大内存(一般64G),还有输入数据的所在位置
  • 可选参数:包括链特异性测序参数--SS_lib_type, 线程数--CPU, 允许的最低组装contig长度--min_contig_length, 是否标准化--no_normalize_reads
  • 常见用法说明
Trinity --seqType fq --max_memory 50G  \--left condA_1.fq.gz,condB_1.fq.gz,condC_1.fq.gz \--right condA_2.fq.gz,condB_2.fq.gz,condC_2.fq.gz \--CPU 6  
# 有基因组引导组装
Trinity --genome_guided_bam rnaseq_alignments.csorted.bam --max_memory 50G \--genome_guided_max_intron 10000 --CPU 6

在常见用法中,Trinity提供了两种使用方式,一种是没有参考基因组进行组装,另一种则是先将序列回帖到参考基因组上,然后再进行组装。

前者很好理解,至于后者,大家可能会有疑问,这和TopHat2+Cufflink或HISAT2+StringTie的组合组装策略有什么区别呢?

Cufflinks和StringTie是根据参考基因组位置组装出转录本,基于原来的基因组返回GFF3文件,而Trinity只利用了参考基因组的位置信息,将同一个位置的read从头组装。这样的好处是在于,如果一个基因组存在多个旁系同源基因,无参考基因组组装可能会将这些基因的转录本组装成一个。但是如果原来的组装N50质量过差,片段化明显,就还是推荐使用无参考组装策略。

在运行中过程中,需要注意以下几点

  1. 质量控制(Quality control)。Trinity的--trimmomatic参数会调用Trimmomatic对数据进行过滤,这一步可以用其他软件完成。目前的RNA-seq质量也不需要过多的过滤。
  2. Trinity中有一个"In silico Read Normalization",用于对read进行标准化,适用于超过300M的数据,默认开启,可以用--no_normalize_reads关闭。标准化的原因是,由于某些高表达基因会被检测到很多次,但是对于组装没有帮助,所以可以提前剔除。
  3. 如果基因组中基因密度大(比如说真菌),一些转录本可能会在UTR区域有重叠。那么为了尽可能降低转录本的错误融合,需要用到--jaccard_clip。对于植物和脊椎动物,就不需要考虑这一步。

其他参数:

  • normalize_max_read_cov: 某些基因的表达量特别高,可以通过限制覆盖度的策略提高组装效率

输出解读

运行结束后,最后的结果是trinity_out_dirTrinity.fasta.Trinity将含有相同序列的转录本进行聚类,这种聚类可以被粗粗的被认为成一个基因的多个转录本。举个例子

 >TRINITY_DN1000|c115_g5_i1 len=247 path=[31015:0-148 23018:149-246]AATCTTTTTTGGTATTGGCAGTACTGTGCTCTGGGTAGTGATTAGGGCAAAAGAAGACACACAATAAAGAACCAGGTGTTAGACGTCAGCAAGTCAAGGCCTTGGTTCTCAGCAGACAGAAGACAGCCCTTCTCAATCCTCATCCCTTCCCTGAACAGACATGTCTTCTGCAAGCTTCTCCAAGTCAGTTGTTCACAGGAACATCATCAGAATAAATTTGAAATTATGATTAGTATCTGATAAAGCA

"TRINITY_DN1000|c115" 是Trinity 聚类编号,“g5”是基因编号,“i1”是转录亚型编号

评估组装质量

有如下几种方法可以评估组装的质量

  1. 使用Bowtie/BWA将RNA-seq回贴到组装的转录组上,有80%以上的回帖率就行了。
  2. 用全长重构蛋白编码基因去搜索已知蛋白序列,见representation of full-length reconstructed protein-coding genes,
  3. 使用BUSCO根据保守同源基因进行评估
  4. 计算E90N50,
  5. 计算DETONATE得分
  6. 使用TransRate评估转录组组装

转录本定量

直接根据转录本进行基因表达丰度定量工具根据是否比对分为两类

  • alignment-based: RSEM, eXpress
  • alignment-free: salmon, kallisto

估计转录本丰度

Trinity提供了align_and_estimate_abundance.pl脚本用于调用不同的程序进行表达量定量。

RSEM相对于salmon或kallisto提供了更多的信息,但是速度明显地慢于salmon和kallsito。如果仅需要每个转录本的count, TPM和FPKM,那么更推荐用salmon。如果你为了更多的信息,愿意等待的话,那么你可以选择用RSEM.


http://chatgpt.dhexx.cn/article/caJDEYeb.shtml

相关文章

TrinityCore魔兽世界服务器-环境搭建(Debian11)

TrinityCore是模拟魔兽世界(World of Warcraft)的开源项目。 我这里学习搭建环境,基于以下: 客户端World of Warcraft 3.3.5(12340或13930版本)服务端TrinityCore3.3.5分支 下面是我自己用的客户端(12340&#xff0…

魔兽世界私服Trinity,从源码开始

缘起因由 在一个无所事事的周末下午,突然想起魔兽世界,官方的账号很久没有上了,里面的大小号现在连满级都不是。以前曾经搭过传奇和星际争霸战网的私服自娱自乐,也听说过魔兽世界有开源的服务端模拟,既然兴致来了就小小…

魔兽世界开服教程wow服务器框架Trinirycore构建

首先明杰先给各位普及一下TrinityCore是什么 TrinityCore 是c实现MMORPG框架 来自MaNGOS,大型网络对象服务,随着时间的推移,该项目代码广泛的优化,改善和清理代码。 需要准备的架设工具: 端(版本&#xff0…

Trinity(3)

转自:http://blog.sina.com.cn/s/blog_83f77c940102v7xu.html 1:分析流程图如下 2: 首先就是将样本的reads合并在一起命令如下: cat 1M_READS_sample/*.left.fq > reads.ALL.left.fq cat 1M_READS_sample/*.right.fq > reads.ALL.right.fq 3:开始…

Trinity使用流程

原文地址:http://www.plob.org/2014/12/22/8826.html 1:分析流程图如下 2: 首先就是将样本的reads合并在一起命令如下: 1 cat 1M_READS_sample/*.left.fq > reads.ALL.left.fq 2 cat 1M_READS_sample/*.right.fq > reads.ALL.right.fq 3:开始拼接 …

安装trinity、解决报错

生信软件安装 Trinity安装 文章目录 生信软件安装一、安装trinity报错二、解决报错 一、安装trinity报错 解压代码: tar -zxvf trinityrnaseq-v2.14.0.FULL_with_extendedTestData.tar.gz进入软件文件夹 cd trinityrnaseq-v2.14.0/然后输入make进行安装&#xf…

【Free RTOS简介】

free rtos学习笔记之整体简介 简介 free rtos实际上是分为两个部分,即free和rtos,其中free是免费的意思,rtos(Real Time Operating System)则是实时操作系统的意思,连在一起是,这个实时操作系…

缺陷检测~Anomalib

这里说说如何应用Anomalib在数据集不平衡的情况下检测缺陷 Paula Ramos,英特尔 AI 软件布道师,美国 武卓,英特尔 AI 软件布道师,中国 Samet Akcay,英特尔人工智能研究工程师/科学家 在《如何应用Anomalib在数据集不平…

MS-RTOS正式发布啦!!!

仓库地址 GitHub:https://github.com/ms-rtos?fromtimeline GiTee:https://gitee.com/ms-rtos 一、MS-RTOS 简介 MS-RTOS(Micro Safe RTOS) 是翼辉信息全新设计的一款面向未来的安全实时操作系统,其最大的特点是开创…

15. RDMA之RoCE Soft-RoCE

转自:https://zhuanlan.zhihu.com/p/361740115 阅读本文前建议温习“RDMA概述”一文,了解下RDMA领域的基本概念。 我已经在基本概念篇里面跟大家对本领域的基本知识进行了科普,在对于基本的宏观概念有了认识之后,我们就可以开始更…

用firadisk+grub4dos实现的RAMOS的方法

论坛里有很多Ramos的教程,不过大多数大是MS自己的Ramdisk驱动用Ntldr引导方式实现的,最近新兴一个驱动叫firadisk,这个是Grub4DOSMap --mem虚拟出来的硬盘在WIN下的驱动,通过这种方式也能做出Ramos,而且限制很少&#…

基于 PyTorch 的目标检测和跟踪(无敌版)

一个不知名大学生,江湖人称菜狗 original author: jacky Li Email : 3435673055qq.com Time of completion:2023.2.1 Last edited: 2023.2.1 目录 图像中的目标检测 视频中的目标跟踪 作者有言 在文章《基于 PyTorch 的图像分类器》中,介绍…

CMSIS-RTOS是什么?

关注星标公众号,不错过精彩内容 作者 | strongerHuang 微信公众号 | strongerHuang CMSIS:Cortex Microcontroller Software Interface Standard,Cortex微控制器软件接口标准。它包含的内容比较多: CMSIS-RTOS:主要用于…

RAM Sequential

前段时间,在公众号上偶然看到一篇很不错的技术分享文章:《南湖处理器DFT设计范例》。文中详细介绍了中科院计算所的RISC-V处理器实施的DFT设计。 去年,也基于一款处理器应用过Share Test Bus技术,但在memory界面fault测试的问题&a…

monoSLAM

单目相机的优点(和双目相机相比):双目相机测得的深度距离收到基线长度的限制,单目相机就可以解决这个问题。 参考博客:http://blog.csdn.net/heyijia0327/article/details/50758944 (一定要看&#xff0c…

Linux一键实现ramos打造自己的livecd

软件名:remastersys作者:nerun个人亲测可用,kali和ubuntu下都成功了,直接一键将当前使用的系统打包成iso,启动测试如下:1:iso直接加载启动成功进入ramos2:iso解压文件到根目录&#…

RAMOS系统简介及制作

同步发布在个人博客上:https://www.zhyong.cn ,可通过搜索文章名称找到该文章! RAMOS系统简介 内存操作系统(RAMOS)是全内存运行,启动后不依赖硬盘的Windows系统。它的原理是利用特殊的软件把多余的内存虚拟为内存盘,然…

如何打造内存操作系统RAMOS?

如何打造内存操作系统RAMOS?添加链接描述 把系统放进内存里 自己打造高速RAMOS 所谓内存操作系统就是全内存运行,系统将不再依赖硬盘。如今科技这么发达,电脑内存也越来越大,如果我们可以利用剩余内存来制作虚拟磁盘&#xff0c…

RAMOS(全内存操作系统)初识----仅供测试

内存操作系统(RAMOS)是全内存运行,启动后不依赖硬盘的Windows系统。它的原理是利用特殊的软件把多余的内存虚拟为内存盘,然后将制作好的操作系统镜像释放到这个虚拟内存盘中运行,让Windows操作系统和应用软件完全工作于内存之中,从…

英语拼读规则

前言: 想学英语就要用英语的思维去学。不能用某国某人指定的方法。误人子弟呀!! 一、就英语就要像学汉语一样要学会拼音,拼音会了汉字自然就会读了。 第一步:26个字母的【音标】要记牢。不只会写字母 也要会写字母对应…