原标题:这篇发生Cell的数据库到底特殊在哪里?
一个表面上“很水”实际上“很牛逼”的数据库
各位小伙伴们大家早上好~欢迎大家继续来听我碎碎念circRNA。我们承接上文,继续来说说circRNA与疾病之间的关系。今天介绍的主角是MiOncoCirc数据库,看到这个名字大家应该也能猜出来是一个与肿瘤相关的数据库。早先我就给大家安利过一款肿瘤特异性circRNA的数据库—CSCD数据库,同样是探讨circRNA与肿瘤之间的关系。那我们今天介绍的MiOncoCirc数据库又有什么自己的特点呢?circRNA的数据库千千万,重点还是要抓住每个数据库最大的特点,做到有的放矢。接下来就让我们一起看看这个数据库的特色叭~
数据库的网址为:https://mioncocirc.github.io/,大家在使用的时候不要忘记引用参考文献哦~
Vo JN, Cieslik M, Zhang Y, Shukla S, Xiao L, Zhang Y, Wu YM, Dhanasekaran SM, Engelke CG, Cao X, Robinson DR, Nesvizhskii AI, Chinnaiyan AM. The Landscape of Circular RNA in Cancer. Cell. 2019 Feb 7;176(4):869-881.e13. doi: 10.1016/j.cell.2018.12.021. PMID: 30735636; PMCID: PMC6601354.
传送门:
一、MiOncoCirc数据库实操演示
各位眼尖的小伙伴看到上面引用的参考文献时不知道会不会虎躯一震~没错,MiOncoCirc数据库最早于2019年2月7日发表在Cell杂志上,文章题目为 The Landscape of Circular RNA in Cancer,由美国密西根大学研究人员一手操办。
相比于之前给大家介绍的各种circRNA数据库,MiOncoCirc数据库可谓是“根正苗红”,赢在了起跑线上。然鹅!MiOncoCirc数据库的操作又属实简单,一目了然,能够提供的信息不多,就鼠标点点点而言,仅仅展示了研究团队的一部分成果,如同冰山一角,更重要的是埋在数据库背后的内容。所以我们今天采用倒叙的手段来介绍MiOncoCirc数据库,先说说怎么使用,再回过头来说明这个数据库的优秀之处,为何能发上Cell。毕竟我也怕前面枯燥的内容说一堆,一顿操作猛如虎,你们不得无聊地左上角点击关闭了(苦涩.jpg)。
输入网址https://mioncocirc.github.io/,进入数据库主页面。可以看到上方菜单栏仅分为四个部分:“Home”,“Download Data”,“Query Data”,“About Us”。当前页面即为“Home”模块,介绍了研究团队借助MiOncoCirc数据库已发表的成果。下方的三张图片总结为四个词“Pan-Cancer”,“Capture Sequencing”,“Biomarkers”,“rt-circRNAs”,反映了MiOncoCirc数据库最大的四个亮点,我们将在之后逐一解释说明。
“Download Data”方便用户下载数据库中的所有资料,包括2000+肿瘤样本中circRNA的数据和注释信息等。
“About Us”提供了数据库的简单介绍以及操作指南等。
最重要的是第三部分“Query Data”,承担了MiOncoCirc数据库所有的检索工作,但是页面非常简单,仅上方和右侧两处可以自行输入或者选择要检索的circRNA。注意这里需要输入circRNA的宿主基因的名称检索,检索结果在页面中央显示,MiOncoCirc数据库提供该circRNA在染色体上的位置,宿主基因的名称,转录本ID等。点击该条检索结果,等候片刻,下方即可出现该circRNA在不同肿瘤中的表达情况柱状图,右键保存图片可直接用于文章发表,给做肿瘤或者生信小伙伴的文章添砖加瓦~
二、MiOncoCirc数据库基本介绍
MiOncoCirc数据库的实操介绍到此为止,各位小伙伴是不是有种猝不及防、戛然而止的感觉呀?接下来我们就要透过现象看本质了,深挖为什么仅仅一个“Query Data”的数据库能发上Cell杂志,成为肿瘤领域circRNA研究的新宠儿。还记得前文提到的MiOncoCirc数据库的几个关键词嘛?接下来我们逐一进行讲解。
1. “Pan-Cancer”
说到“Pan-Cancer”,泛癌这个特点,先给大家看一眼MiOncoCirc数据库的一段介绍:
大致意思就是,用于研究circRNA诊断价值的数据库有很多,包括circBase,CIRCpedia,circRNAdb以及CSCD等,但是MiOncoCirc数据库是首个由癌症临床样本所汇编而成的数据库,一共包括超过2000个临床肿瘤样本,而其他数据库基于肿瘤细胞系所构建。由于从天然的肿瘤微环境中取材的临床组织样本相较于体外细胞系而言更能准确地反应癌症患者体内的病理生理学过程,因此MiOncoCirc数据库相较于其他数据库在反应癌症circRNA差异表达上更具有代表性和准确性。MiOncoCirc数据库的大样本量收集使得用户得以对某一个circRNA进行泛癌分析,直观认识到某一个circRNA在多种肿瘤中的表达情况。
2. “Capture Sequencing”&“Biomarker”
MiOncoCirc数据库最大的亮点在于其采用了一种全新的circRNA鉴定技术----外显子捕获测序技术。说到这个不得不先说说常规的全转录组或者circRNA测序的流程。核糖体RNA(rRNA)遗传信息保守性较高,在不同组织、器官中十分稳定,而研究者更倾向于研究信息含量更为丰富的mRNA或非编码RNA等。因此,在转录组测序中常采用去除rRNA的建库方式,能最大程度地保留转录组RNA信息,提高测序有效数据量。circRNA测序在此基础上还需要更进一步进行RNase R的处理,去除线性转录本,富集circRNA以提高检测效率。MiOncoCirc数据库研究团队采用的外显子捕获测序技术相较于常规的测序流程可以检测出更多的circRNA转录本,且仅用微量的RNA(<5 μg)即可达到测序目的,因此适用于尿液、唾液等无创性的circRNA检测,方便circRNA biomarker方面的研究。这是MiOncoCirc数据库其中之一的潜在应用价值,数据库内收录的circRNA与circbase数据库相比并不完全一致,其原因就在于检测circRNA的灵敏度更高,鉴定方法也并不相同。
3. “rt-circRNAs”
最后我们来说一说rt-circRNAs这个概念。很多小伙伴可能对这个名词比较陌生,rt-circRNAs全称为read through circRNAs。大家都知道绝大多数circRNA由某一个基因的外显子环化而成,而近几年发现了一些新的circRNA,其所组成的外显子可能并不只是来源于同一个基因,而是由多个基因的外显子组成,每个基因贡献出自己的一部分外显子后,进行反向剪接形成一个新的circRNA。这种circRNA称之为f-circRNAs。若这种提供给f-circRNAs外显子的基因位于同一条链上的相邻位置,则称为rt-circRNA,因为在进行读取的时候可以一溜往下检测出来。已有文献报道,rt-circRNA的形成是一种比较普遍的转录现象,在生物体内发挥着重要的作用。MiOncoCirc数据库由于其独特的外显子捕获测序技术,在其数据库内收录了大量rt-circRNAs,方便做这一方面的用户进行检索。
MiOncoCirc数据库的检索功能非常简单,仅一个“Query Data”页面可以进行检索,但是该数据库收录的内容非常丰富,不仅有大样本量的临床组织样本证据支持,同时其特有的外显子捕捉测序技术得以在分泌液中提取微量的RNA即可检测到circRNA,极大地提高了检测的灵敏度,扩充了数据库中circRNA收录的数量。MiOncoCirc数据库还收录了rt-circRNAs,给部分小伙伴们带来了便利。整个数据库透露着“ 虽然我看上去很水,但是实际上我很牛逼”的大智若愚的气息,各位小伙伴但请按需使用,毕竟发上Cell的数据库驾驭起来难度不小,如何深挖是一门艺术~
撰文 丨火 火
排版 丨四金兄
值班 | 菠小萝
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
(👆点击“预 约”就完事了!!!)
责任编辑: