生物信息学数据挖掘

article/2025/11/7 12:35:41

数据挖掘简介
数据挖掘(Data Mining, DM)是指从大量数据中提取或“挖掘”知识。数据挖掘是在大量数据中寻找新的有趣模式和关系的科学。它被定义为“通过挖掘存储在仓库中的大量数据来发现有意义的新关联,模式和趋势的过程”。数据挖掘有时也称为数据库知识发现(Knowledge Discovery in Databases,KDD)。它已成功应用于生物信息学中,该技术需要丰富的数据,并对已有的数据进行挖掘,并常常应用于生物学中的基因表达,蛋白质建模,生物标记物鉴定,药物发现等。新数据挖掘方法的开发提供了一种迅速扩展生物数据的有用方法。目前,数据挖掘方法已广泛用于生物信息学数据分析的各个发现。

生物信息学
生物信息学是一门存储,分析和利用来自生物数据(例如基因组数据,转录组数据,蛋白质组数据,微生物数据,代谢组数据,微阵列芯片数据以及通过湿法实验生成的数据)信息的科学。利用这些数据进行挖掘和分析序列,分子,基因表达或途径信息。同样,新型数据挖掘方法的开发将在生物信息学数据分析中发挥重要作用。

数据挖掘的任务
数据挖掘是从现有数据自动生成信息的过程。 数据挖掘的主要目标是“预测”和“描述”。 数据挖掘可以执行的主要任务如下:

  • 分类: 分类是对输入数据项分类为几个预定义类别(即现有数据)之一的功能。
  • 估计:对于给定的输入数据,得出一些未知连续变量的值。
  • 预测:与分类和估计相同,但不同之处在于记录方式是根据将来的结果或者评估值进行分类的。
  • 关联规则:确定哪些数据组合在一起,也称为依赖关系建模。
  • 聚类:将总体的元素通过聚类分析分为多个组或类。
  • 描述和可视化:对数据进行描述或者使用可视化技术表示数据。
    数据挖掘流程
    在这里插入图片描述FIG1. Process of Knowledge Discovery through Data Mining.
    图片来源:https://littlefield.co/an-introduction-into-data-mining-in-bioinformatics-964511e9ea21

数据挖掘在生物学领域中的应用
随着测序技术和生物信息学的发展,越来越多的生物学数据以及数据库产生,存储了大量的生物学数据。因此,通过数据挖掘的方法对现有数据进行挖掘并有效利用,变得越来越重要。
生物医学领域:使用数据挖掘技术有助于在生物医学产业的特定领域内进行全面的研究。并且使研究人员可以更好地了解生物学机制,以便在医疗保健和生命知识领域发现新的治疗方法。
动植物研究:对不同的物种数据库数据进行整合分析,研究不同物种之间的进化关系。对同一物种的不同组学数据库数据进行整合分析,全面系统地对此物种生物学机制进行研究。

参考文献

  1. Zaki M J ,et al. Data Mining in Bioinformatics (BIOKDD)[J]. Algorithms for Molecular Biology Amb, 2007, 2(1):4-4.
  2. Khalid R . Application Of Data Mining In Bioinformatics[J]. Indian Journal of Computer Science and Engineering, 2010, 1(2).
  3. Momeni Z, et al. A Survey on Single and Multi Omics Data Mining Methods in Cancer Data Classification[J]. Journal of Biomedical Informatics, 2020, 107:103466.

http://chatgpt.dhexx.cn/article/qpqlIY4d.shtml

相关文章

知识图谱-生物信息学-医学顶刊论文(Bioinformatics-2021)-SumGNN:通过有效的KG聚集进行多类型DDI预测

3.(2021.3.26)Bioinformatics-SumGNN:通过有效的KG聚集进行多类型DDI预测 论文标题: SumGNN: multi-typed drug interaction prediction via efficient knowledge graph summarization 论文地址: https://academic.oup.com/bioinformatics/article-pdf/37/18/2988/40471587/bt…

常用生物信息学格式介绍

转载于:http://ju.outofmemory.cn/entry/193943 前言 在各个行业都是有行业标准的,这样才能统一规范而方便后面的分析,在生物信息学领域中主要是各种大量序列数据、注释数据等,这些都是有特定的格式去表示,下面列举几…

life science 研究领域之生物信息学

life science 研究领域之生物信息学 不读名校吗 2018-08-02 17:35 点击标题下「bangbangacademy」可快速关注 No.1 生物信息学 什么是生物信息学 生物信息学( B ioinformatics)是一门新兴的交叉学科。很多人会认为:生物信息学既涉及…

知识图谱-生物信息学-医学顶刊论文(Briefings in Bioinformatics-2021):生物信息学中的图表示学习:趋势、方法和应用

4.(2021.6.24)Briefings-生物信息学中的图表示学习:趋势、方法和应用 论文标题: Graph representation learning in bioinformatics: trends, methods and applications 论文期刊: Briefings in Bioinformatics 2021 论文地址: https://www.researchgate.net/profi…

生物信息学、系统生物学 期刊 会议

生物信息学、系统生物学是交叉学科,可选择期刊比较广泛,这里只列举一些平时关注的刊物: -------------------------------------------- Nature Biotechnology Nature Methods 上述两个刊物有Computational Biology相关的栏目,顶…

知识图谱-生物信息学-医学顶刊论文(Bioinformatics-2021)-MUFFIN:用于DDI预测的多尺度特征融合

2.(2021.3.15)Bioinformatics-MUFFIN:用于DDI预测的多尺度特征融合 论文标题: MUFFIN: multi-scale feature fusion for drug–drug interaction prediction 论文地址: https://www.researchgate.net/profile/Jianmin-Wang-3/publication/350100336_MUFFIN_Multi-Scale_Featur…

知识图谱-生物信息学-医学顶刊论文(Bioinformatics-2021)-KG4SL:用于人类癌症SL预测的知识GNN

5.(2021.7.12)Bioinformatics-KG4SL:用于人类癌症SL预测的知识GNN 论文标题:KG4SL: knowledge graph neural network for synthetic lethality prediction in human cancers 论文地址:https://academic.oup.com/bioinformatics/article/37/Supplement_1…

生物信息学数据库

生物信息学数据库分类概览 生物与计算机的结合让生物进入大数据时代,为方便管理各种生物数据,科学家们开发了各式各样的生物数据库。了解与自己研究领域相关的数据库,并加以利用可能会使研究工作得到事半功倍的效果。在此将常用数据库按照以…

生物信息学有哪些SCI期刊推荐? - 易智编译EaseEditing

以下是几个生物信息学领域的SCI期刊推荐: Bioinformatics: 该期刊是生物信息学领域最具影响力的SCI期刊之一,涵盖了生物信息学、计算生物学、系统生物学、生物医学工程等多个研究方向。 BMC Bioinformatics: 该期刊是生物信息学…

生物信息学的发展与未来

欢迎关注bioinfor 生信云!有一起想做公众号的朋友欢迎联系我! 1.发展历史 今天我们大部分人认为,现代生物信息学是最近出现的,有利于下一代测序数据分析。然而,生物信息学的起源发生在50多年前,当时台式计…

生物信息学常用数据库

写在前面 说来惭愧,感觉读到研究生,说来说去张口闭口也就是TCGA、GEO、ARRAYEXPRESS、GTEX数据库,感觉还不如一些临床医生自学生物信息学的,平常都没去探索一些新的数据库,这边做个记录.黑色部分代表我查到的简介&…

生物信息学必备网站大全

生物信息学与生物计算:http://bioinformatics.weizmann.ac.il/ 这是生物信息学和生物计算学的网站,由Weizmann科学研究所,生物服务部和Crown人类基因组学中心支持。研究领域主要涵盖序列分析,蛋白质组学和基因组学等。该网站提供了…

生物信息学期刊

欢迎关注公众号 AI and Bioinformatics更全面 根据平时自己的收藏,整理一下自己的记录,期刊排名暂无顺序 1. Bioinformatics 该期刊是生物信息学领域的顶级期刊,是CCF B类期刊也是SCI一区的,审稿速度也比较快。出版社是Oxford …

学习如何做好网站关键词的诊断工作

广州seo认为网站关键词诊断一般都是在建站前需要做好的工作。或者是在现有的网站上也可以做关键词的诊断,这样可以看出你的网站的关键词是否部署得当,如果部署有问题的话,也可以再次修改一下,让你的网站排名能够更好一些。那么在网…

怎样布局网站关键词最合理

关键词布局对一个网站来说是至关重要的,应按照关键词的热度大小,依次分布在首页、栏目页、内页。首页应放核心关键词,栏目页关键词是首页关键词的扩展,内页长尾词是栏目关键词的扩展。以保定seo(www.eoobd.com为例&…

网站关键词怎么优化排名(网站关键词通常可以选择哪些词)

网站核心关键词的选取需要具备哪些条件 在对网站优化的过程中,肯定少不了对网站关键词的选取,关键词的选择又是网站优化中十分重要的一步,那么网站在选择关键词的过程中需要遵循哪些原则呢?关于这个问题老张带你了解一下。 1、首…

网站刷关键词_如何让关键词SEO排名,长期稳定?

对于每个企业主而言,他们都期望关键词SEO排名,可以长期稳定,从而带来持续不断可观的收入,但在现实工作中,关键词排名几乎是一个动态指标,如果你试图让关键词SEO排名,长期稳定,我们可…

网站关键词排名:关键词排名提升的5个方法!

在SEO工作中,利用网站获取流量,针对搜索引擎优化,我们脱离不了关键词,只有精准的提高关键词与页面的相关性,才有机会获得更好的排名: 你可以尝试,通过如下方法: 1、网站标题包含核心…

网站关键词SEO排名,SEO长尾关键词排名工具

网站关键词如何优化上首页,SEO关键词优化是我们搜索引擎优化中比较重要的一个环节,不管是我们的核心关键词优化还是长尾关键词打造。正确的优化方式可以增加我们网站与搜索引擎的相关性,有助于我们的网站在排名中攀升,并最终为我们…

网站关键词排名,如何快速提升?

对于企业网站排名而言,每一个网站运营专员都希望,可以在较短的时间内,针对网站关键词快速排名,但有的时候,我们知道,搜索引擎的排名有一个评估的时间周期,它涉及诸多因素,比如&#…