Trinity使用流程

article/2025/8/20 8:39:52

原文地址:http://www.plob.org/2014/12/22/8826.html

1:分析流程图如下

f3

2: 首先就是将样本的reads合并在一起命令如下:

1 cat 1M_READS_sample/*.left.fq > reads.ALL.left.fq
2 cat 1M_READS_sample/*.right.fq > reads.ALL.right.fq

3:开始拼接

1 $TRINITY_HOME/Trinity.pl --seqType fq --JM 10G --left reads.ALL.left.fq --right reads.ALL.right.fq --SS_lib_type RF --CPU 6 --seqType fq —-output ./trinity_out_dir

输出文件:Trinity.fasta

4:拼接统计

1 $TRINITY_HOME/util/TrinityStats.pl trinity_out_dir/Trinity.fasta>./assembly_report.txt

输出文件:assembly_report.txt

5:比对reads评估表达量(每个样本都需要单独比对)

1 $TRINITY_HOME/util/align_and_estimate_abundance.pl --transcripts Trinity.fasta --seqType fq --left reads_1.fq --right reads_2.fq --est_method RSEM --aln_method bowtie --trinity_mode —prep_reference

比对输出:bowtie.csorted.bam 

RSEM输出

RSEM.isoforms.results  : EM read counts per Trinity transcript

RSEM.genes.results     : EM read counts on a per-Trinity-component (aka... gene) basis, gene used loosely here.

过滤比对

1 <span class="s1">$TRINITY_HOME/util/filter_fasta_by_rsem_values.pl </span><span class="s1">--rsem_output=/path/to/RSEM.isoforms.results[,...] --fasta=/path/to/Trinity.fasta --output=/path/to/output.fasta</span> <span class="s5">--fpkm_cutoff=1200</span>

过滤值需要根据需求自己设定。

6:差异表达分析(edgeR)

假定有四个样本,转录本定量输出为:

LOG.isoforms.results 

DS.isoforms.results 

HS.isoforms.results

PLAT.isoforms.results

注意:--samples_file为样本分组信息文件 group.txt ,例如:

Throat sample2.sam

Saliva sample3.sam

Throat sample4.sam

Vaginal sample5.sam

--contrasts 为样本不同条件下比较compare.txt:

Throat Saliva

Vaginal  Saliva

Throat  Vaginal

7:提取最好的OFR

1 $TRINITY_HOME/trinity-plugins/transdecoder/TransDecoder -t  transcripts.fasta -m  100 —search_pfam /path/to/pfam_db.hmm to search —CPU 6

输出文件:

  • Trinity.fasta.transdecoder.pep
  • Trinity.fasta.transdecoder.cds
  • Trinity.fasta.transdecoder.bed
  • Trinity.fasta.transdecoder.gff3

8:功能注释

下载的软件:Trinotate、Trinity、sqlite、NCBI Blast、HMMER、signalP v4、tmhmm v2、RNAMMER

比对数据库:SwissProt、Uniref90、Pfam domains 

标准化数据:

查看源代码
打印 帮助
1 makeblastdb -in uniprot_sprot.fasta -dbtype prot
2 makeblastdb -in uniref90.fasta -dbtype prot
3 hmmpress Pfam-A.hmm

blast比对(比对的数据库可以换成nr/Uniref90

# search Trinity transcripts

1 blastx -query Trinity.fasta -db uniprot_sprot.fasta -num_threads 8 -max_target_seqs 1 -outfmt 6 -evalue 1e-5 > blastx.outfmt6

# search Transdecoder-predicted proteins

1 blastp -query transdecoder.pep -db uniprot_sprot.fasta -num_threads 8 -max_target_seqs 1 -outfmt 6 -evalue 1e-5 > blastp.outfmt6

功能域

1 hmmscan --cpu 8 --domtblout TrinotatePFAM.out Pfam-A.hmm transdecoder.pep > pfam.log

信号肽

1 signalp -f short -n signalp.out transdecoder.pep

跨膜结构

1 tmhmm --short < transdecoder.pep > tmhmm.out

识别rRNA

1 $TRINOTATE_HOME/util/rnammer_support/RnammerTranscriptome.pl --transcriptome Trinity.fasta  --path_to_rnammer /usr/bin/software/rnammer_v1.2/rnammer

输出:Trinity.fasta.rnammer.gff

9:Load transcripts and coding regions

查看源代码
打印 帮助
1 $TRINITY_HOME/util/support_scripts/get_Trinity_gene_to_trans_map.pl Trinity.fasta >Trinity.fasta.gene_trans_map
2  
3 Trinotate Trinotate.sqlite init --gene_trans_map Trinity.fasta.gene_trans_map --transcript_fasta Trinity.fasta --transdecoder_pep transdecoder.pep

10:Output an Annotation Report

1 Trinotate Trinotate.sqlite LOAD_swissprot_blastp blastp.outfmt6
2 Trinotate Trinotate.sqlite LOAD_swissprot_blastx blastx.outfmt6
3 Trinotate Trinotate.sqlite LOAD_pfam TrinotatePFAM.out
4 Trinotate Trinotate.sqlite LOAD_tmhmm tmhmm.out
5 Trinotate Trinotate.sqlite LOAD_signalp signalp.out
6 Trinotate Trinotate.sqlite report >trinotate_annotation_report.xls

输出文件:trinotate_annotation_report.xls

原文来自:http://blog.sina.com.cn/s/blog_83f77c940102v7xu.html



http://chatgpt.dhexx.cn/article/DeMLTqt9.shtml

相关文章

安装trinity、解决报错

生信软件安装 Trinity安装 文章目录 生信软件安装一、安装trinity报错二、解决报错 一、安装trinity报错 解压代码&#xff1a; tar -zxvf trinityrnaseq-v2.14.0.FULL_with_extendedTestData.tar.gz进入软件文件夹 cd trinityrnaseq-v2.14.0/然后输入make进行安装&#xf…

【Free RTOS简介】

free rtos学习笔记之整体简介 简介 free rtos实际上是分为两个部分&#xff0c;即free和rtos&#xff0c;其中free是免费的意思&#xff0c;rtos&#xff08;Real Time Operating System&#xff09;则是实时操作系统的意思&#xff0c;连在一起是&#xff0c;这个实时操作系…

缺陷检测~Anomalib

这里说说如何应用Anomalib在数据集不平衡的情况下检测缺陷 Paula Ramos&#xff0c;英特尔 AI 软件布道师&#xff0c;美国 武卓&#xff0c;英特尔 AI 软件布道师&#xff0c;中国 Samet Akcay&#xff0c;英特尔人工智能研究工程师/科学家 在《如何应用Anomalib在数据集不平…

MS-RTOS正式发布啦!!!

仓库地址 GitHub&#xff1a;https://github.com/ms-rtos?fromtimeline GiTee&#xff1a;https://gitee.com/ms-rtos 一、MS-RTOS 简介 MS-RTOS&#xff08;Micro Safe RTOS&#xff09; 是翼辉信息全新设计的一款面向未来的安全实时操作系统&#xff0c;其最大的特点是开创…

15. RDMA之RoCE Soft-RoCE

转自&#xff1a;https://zhuanlan.zhihu.com/p/361740115 阅读本文前建议温习“RDMA概述”一文&#xff0c;了解下RDMA领域的基本概念。 我已经在基本概念篇里面跟大家对本领域的基本知识进行了科普&#xff0c;在对于基本的宏观概念有了认识之后&#xff0c;我们就可以开始更…

用firadisk+grub4dos实现的RAMOS的方法

论坛里有很多Ramos的教程&#xff0c;不过大多数大是MS自己的Ramdisk驱动用Ntldr引导方式实现的&#xff0c;最近新兴一个驱动叫firadisk&#xff0c;这个是Grub4DOSMap --mem虚拟出来的硬盘在WIN下的驱动&#xff0c;通过这种方式也能做出Ramos&#xff0c;而且限制很少&#…

基于 PyTorch 的目标检测和跟踪(无敌版)

一个不知名大学生&#xff0c;江湖人称菜狗 original author: jacky Li Email : 3435673055qq.com Time of completion&#xff1a;2023.2.1 Last edited: 2023.2.1 目录 图像中的目标检测 视频中的目标跟踪 作者有言 在文章《基于 PyTorch 的图像分类器》中&#xff0c;介绍…

CMSIS-RTOS是什么?

关注星标公众号&#xff0c;不错过精彩内容 作者 | strongerHuang 微信公众号 | strongerHuang CMSIS&#xff1a;Cortex Microcontroller Software Interface Standard&#xff0c;Cortex微控制器软件接口标准。它包含的内容比较多&#xff1a; CMSIS-RTOS&#xff1a;主要用于…

RAM Sequential

前段时间&#xff0c;在公众号上偶然看到一篇很不错的技术分享文章&#xff1a;《南湖处理器DFT设计范例》。文中详细介绍了中科院计算所的RISC-V处理器实施的DFT设计。 去年&#xff0c;也基于一款处理器应用过Share Test Bus技术&#xff0c;但在memory界面fault测试的问题&a…

monoSLAM

单目相机的优点&#xff08;和双目相机相比&#xff09;&#xff1a;双目相机测得的深度距离收到基线长度的限制&#xff0c;单目相机就可以解决这个问题。 参考博客&#xff1a;http://blog.csdn.net/heyijia0327/article/details/50758944 &#xff08;一定要看&#xff0c…

Linux一键实现ramos打造自己的livecd

软件名&#xff1a;remastersys作者&#xff1a;nerun个人亲测可用&#xff0c;kali和ubuntu下都成功了&#xff0c;直接一键将当前使用的系统打包成iso&#xff0c;启动测试如下&#xff1a;1&#xff1a;iso直接加载启动成功进入ramos2&#xff1a;iso解压文件到根目录&#…

RAMOS系统简介及制作

同步发布在个人博客上&#xff1a;https://www.zhyong.cn &#xff0c;可通过搜索文章名称找到该文章&#xff01; RAMOS系统简介 内存操作系统(RAMOS)是全内存运行&#xff0c;启动后不依赖硬盘的Windows系统。它的原理是利用特殊的软件把多余的内存虚拟为内存盘&#xff0c;然…

如何打造内存操作系统RAMOS?

如何打造内存操作系统RAMOS&#xff1f;添加链接描述 把系统放进内存里 自己打造高速RAMOS 所谓内存操作系统就是全内存运行&#xff0c;系统将不再依赖硬盘。如今科技这么发达&#xff0c;电脑内存也越来越大&#xff0c;如果我们可以利用剩余内存来制作虚拟磁盘&#xff0c…

RAMOS(全内存操作系统)初识----仅供测试

内存操作系统(RAMOS)是全内存运行&#xff0c;启动后不依赖硬盘的Windows系统。它的原理是利用特殊的软件把多余的内存虚拟为内存盘&#xff0c;然后将制作好的操作系统镜像释放到这个虚拟内存盘中运行&#xff0c;让Windows操作系统和应用软件完全工作于内存之中&#xff0c;从…

英语拼读规则

前言&#xff1a; 想学英语就要用英语的思维去学。不能用某国某人指定的方法。误人子弟呀&#xff01;&#xff01; 一、就英语就要像学汉语一样要学会拼音&#xff0c;拼音会了汉字自然就会读了。 第一步&#xff1a;26个字母的【音标】要记牢。不只会写字母 也要会写字母对应…

英语名词复数s的发音规则

目录 1. 英语名词复数s的发音规则 1. 在清辅音后发/s/&#xff0c;[p], [t], [k], [h]; [f], [x], [s], [&#x1d6c9;], [ꭍ]; [ts], [tr], [tꭍ]。记忆顺口溜&#xff1a;婆婆有位特殊的客户 &#xff0c;她叫福西施&#xff0c;t前缀 2. 在浊辅音和元音后发/z/音&#x…

英语口语中的音变现象及读音规则

英语口语中的音变现象是指再说英语的过程中出于“省力” 的原因&#xff0c;在读英语的时候唇舌处于放松的状态&#xff0c;可以让我们更轻松地说英语。音变现象包括&#xff1a;连读&#xff0c;弱读&#xff0c;缩读&#xff0c;浊化&#xff0c;异化。这五大音变现象最具有代…

英语语法---读音规则

一、48个音标&#xff08;音素&#xff09;简表&#xff08;18大语音语变现象&#xff09; 单元音又分为前元音、中元音和后元音&#xff0c;其区分点在于发音时舌身是在口腔的前部、中部还是后部 音素发音链接&#xff1a;https://en-yinbiao.xiao84.com/ 18大语音语变现象&…

链表之头指针、头结点、首元结点、空链表

链表之头指针、头结点、首元结点、空链表 文章目录 链表之头指针、头结点、首元结点、空链表前言疑问整理头指针&#xff0c;头结点&#xff0c;首元结点定义首元结点定义头指针定义头结点定义 疑问回答 前言 最近在用力扣刷链表的题&#xff0c;总是写不出来&#xff0c;对这…

求二叉树指定结点到根结点的路径c++ 非常详细。

看了很多 没有看见完整的代码 我喜欢喂饭喂到嘴边。 部分代码参考16 二叉树&#xff1a;以x为根的子树的深度_DHU杨骅麟(紫外线过敏)的博客-CSDN博客 面试经典&#xff08;16&#xff09;--二叉树根节点到指定节点的路径_nginux的博客-CSDN博客_二叉树根节点到目标节点路径 运…