知识图谱初步学习(零)——本体是什么

article/2025/9/6 19:24:42

知识图谱初步学习(零)——本体是什么

文章目录

    • 知识图谱初步学习(零)——本体是什么
      • 前言
      • 一、 哲学层面理解
      • 二、 引申到语义层面理解
      • 三、学术层面
      • 四、其他层面
        • - 术语
        • - 语义网
      • 五、本体与类、本源、实体、符号的区别
      • 六、用语义三角形理解本体
        • - 术语
        • - 词汇表
        • - 叙词表
        • - 叙词表与本体的二者区别?
        • - 语义:词语的含义。
        • - 语义三角形
      • 七、 总结

前言

之前一直稀里糊涂的学习本体,还没有明白本体到底是什么东西,今天详细记录一下什么是本体,若有不对之处还请各位指正。

一、 哲学层面理解

本体(Ontology) 的概念最早起源于哲学领域,是哲学家用来探讨世界本源的一种理论思路。本体’这个概念在哲学层面上是形而上的(本体应该是稳定的,不能轻易变化),是只可意会不可言传的,因为所有的描述都成为了“本体的外在符号",我们世界上的所有图像语言、我们看到的、听到的、感受到的,都成为符号到本体的某种映射。它研究何物存在以及以何种方式存在等问题。
例如:水是有液体固体和气体三种形态,但是不管在什么状态下水也就是水分子构成的,水分子又是氢原子和氧原子构成的,于是我们可以说:水的本体都是氢元素和氧元素的组成。依次往下推氢原子和氧原子的本体是质子中子和电子…直到夸克不能再往下细分了。
那么能否直接说水的本体就是夸克呢?显然是不能的。本体不能跨级。按照逻辑学中的关系的传递性来说关系有时候是反传递性的,举个例子:老明是小明的爸爸,小明是小关的爸爸,那么老明是小关的爸爸,显然是不对的。
水的本体
如:苹果的图片,苹果,apple这三个都是符号。但是现实中实实在在的苹果这个事物,就是亚里士多德口中的“实
体”,巴门尼德口中的“存在”,和本体论中所说的“本体”。
概念三角形
根据概念三角形可以将苹果表示成如下的图:(中间的是虚线,画错了)
在这里插入图片描述

二、 引申到语义层面理解

如:把{“THU”,“Tsinghua”, “Tsinghua University”,“清华”,“清华大学”}这个符号集都映射到“清华大学”这个“本体”上来。(可以理解为都是映射到本体的符号的集合)再深一层,我们建立了本体的集合,就可以去发掘本体之间深层的关系(映射的本体和符号之间的关系),有可能是“属性-本体”的关系,有可能是“子类-本体”的关系,也有可能是“本体-本体”的对立或者是近似关系。描述语义层面的本体关系的语言就是RDF和OWL等。
再深一层的话,在建立好本体之间的关系之后能干什么呢?我们就可以进行语义层面上的推理,推理的结果可以映射回语言层面形成新的组合。
举个例子:
我们把各民族表示苹果的语言,都映射到“苹果”这个本体上,这是第一步本体映射;
苹果这个“本体”可以跟“名词主体”建立隶属关系,这是第二步建立本体之间的逻辑关系;
“名词主体”可以跟在“动词主体”之后,形成动宾结构,我们在这个动宾结构之上,经过反映射,就可以实现各语种之间的翻译,这是逻辑推理和实际应用。

三、学术层面

学术层面:本体是共享概念模型的形式化、规范、明确的说明。
这是最常见的定义。这里的说明可以理解成符号的意思。概念模型不单单是概念,还包括了概念之间的关系组成的一个系统。
这个定义包含了四个方面:共享(share) 、概念化(Conceptualization) 、 形式化(Formal) 、明确(Explicit),
下面对这4个分别介绍:
共享:是这个领域公认的术语组成的集合。(被大家都认可的, 大家都可以用的,比如图书分类法)
概念化:指本体对事物的描述所形成了-组组的概念。(本体能 够反映事物的特有属性和范围的。(逻 辑中概念的
定义) )
明确性:指本体中的术语、属性和定理都是有明确的定义,不是模棱两可的。(确定的, 唯一-的, 非矛盾的)
形式化:指本体能够被计算机可读,能够被计算机所处理。(形 式逻辑里面的形式)

四、其他层面

其他层面:一种描述术语及术语间关系(描述苹果、香蕉、水果之间的关系)的概念模型。

- 术语

该术语包含了哪些词汇(逻辑学中的外延)术语之间的关系 (逻辑学中的矛盾、反对、包含、全同、互异、差等关系…)

本体可以简单也可以复杂。如:最简单的词汇表(只定义术语集合,不定义术语之间的关系)也可以看成是一种“本体”;但严格意义上的本体,是既定义了术语、也定义了术语之间关系的。生活中,最常见、最成熟的本体,就属图书馆里的图书分类法了。
本体,以图书分类法为例, 一方面限定了术语集合 (即规定大家必须采用共同承认的一套词汇,禁止私自发明新词),另-方面定义术语之间的上下位关系(如: 计算机技术隶属于工业技术,软件技术隶属于计算机技术,等等)。只要大家都认同该本体,并在实践中长期遵守该本体,依照它来编排和索引书目,那么日后寻找一本书就会非常方便。通过这个简单的例子,我们可以发现,本体在实践中非常重要的一点就是:认同(专 业术语称为ontology commitment)。从这点来说,本体一定意义上起到了是标准化的作用。另一点很重要的就是:**本体应该是稳定的,不能轻易变化。**由本体演化引入的更新代价将是巨大、甚至是灾难性的! (比如:图 书分类如果迭代了更新可能会让人们很难找到自己想要的书籍。)

- 语义网

(Semantic Web)中的本体(尤其是在学术界)常常有所特指,通常大家认为Semantic Web中的本体是用RDFS或OWL描述的本体。RDFS、OWL可以表达比前面提到的图书分类更复杂的本体,比如定义同义词、反义词,对属性的值域施加约束(限 制事物之间的关系进一步延伸。) 等等。

五、本体与类、本源、实体、符号的区别

  • 本体与类的区别:类:具有相同属性的事物。类的分子:组成某类的个别事物。
    本体包括类,类是本体中的一部分,本体不仅包括类,还包括类与类、实例与实例、属性与属性之间的关系。简而言之:“本体有关系,类没有。”见其他层面的本体定义。
  • 本体与本源:本源主要说明的是事物基质和元素的来源,以及作为原初物的“母体”性的存在。 本体是形而上的抽象概念,类似于本原,但比本原更为普遍化,任何事物都能抽象出本体的存在,事物映射成为本体的外在符号。本体也就是存在本身,亚里士多德称为本体。
  • 本体与实体的区别: 实体是概念具象化之后的产物。
  • 本体与符号的区别: 现实世界里我手里拿着一个实实在在的苹果,这就是本体,但是我如果去描述它就成了符号,比如用中文“苹果"、英文apple.那么它(“苹果”, "apple’ 还是指这个实实在在的苹果? )就是符号。你一旦试图描述它,任何描述的东西都是符号。
  • 本体只有一个吗?否,比如苹果的本体和飞机的本体当然是不同的本体,但本体之间的关系的研究也是非常重要的,虽然苹果的本体和飞机的本体是不同的,但都可以归类到物品的分类中,当然不同本体还有不同的属性,这些都是本体论的研究范畴。

六、用语义三角形理解本体

- 术语

在特定专业学科领域用来表示概念的称谓的集合。(表示专业领域词汇的集合)词汇还是词汇表? (无关系)

- 词汇表

收录某些专业学科的语词、术语和短语,按照一定顺序排列,有的还给出简单释义或对等词的词汇集。通常有单语、双语、多语之分。词汇:①一种语言中所有的词以及固定结构(set phrase),如成语、惯用语的总汇。②一定用语范围内的词语总和。

- 叙词表

(有关系) 例子?叙词表又称为,它是一种语义词典,由术语及术语之间的各种关系主题词表构成,能反映某学科领域的语义相关概念。

- 叙词表与本体的二者区别?

叙词表中只包含“用、代、属、分、参、族"这样的简单的语义关系。而ontology中概念间的关系,则被描述得更为广泛深入、细致和全面。这是二者的最主要区别,也是为什么基于ontology的系统可以实现语义检索和半自然语言、乃至自然语言检索功能的奧妙所在。来源:《叙词表与本体的区别》

- 语义:词语的含义。

在这里插入图片描述

- 语义三角形

语义三角形也叫概念三角形,这就是理论上的本体。本体核心问题就是概念化,语言三角形就是对概念和指称进行定义的,本体构建的时候本体里面的东西其实都不是概念,而是符号。

语义三角形图如下:
在这里插入图片描述

为什么中间是虚线呢?
这个虚线的箭头叫做指称指称就是指代概念的一个名称,这个术语代表的不是这个事物本身,而是代指这个事物的概念,也可以理解成符号。
比如我叫小明,那能说小明就是我吗,不能,因为小明这2个字就是一个符号,并不能代替小明这个人,还有好多叫这个名字的,小明这是一个单独的概念,有自己的外延和内涵,是独一无二的,所以这里面的虚线只是一个指称,而不是实指。

七、 总结

总而言之,本体的核心问题就是概念化,构建本体的时候里面的一个个不是概念而是符号,本体不仅包括类,概念,还包括类与类之间的关系,概念和概念的关系(概念模型),类的属性等。本体包含了公认术语组成的一个集合,是可以共享的,比如图书馆图书分类;本体又是形式化的,指代的是事物的符号,同时也是被计算机可读的;本体是明确的,不可能一个事物有多个本体,本体不是模棱两可的。所以说本体是共享概念模型的形式化、规范、明确的说明。
可以记成:“共盖姓名龟”。先想本体就像一个(盖)念模型,不仅有概念还有概念之间的关系构成了一个系统就是概念模型,这个模型是享(共)的,本体就是起到了一个标准化的作用,标准化就需要式化,确化(姓名)的说明。


http://chatgpt.dhexx.cn/article/uR6B2oeL.shtml

相关文章

本体(Ontology)概述

认识本体 本体(Ontology)的概念源自于哲学领域,在哲学中的定义为“对世界上客观事物的系统描述,即存在论”。哲学中的本体关心的是客观现实的抽象本质。而在计算机领域,本体可以在语义层次上描述知识,可以看…

区块链 Vs. 互联网,创新在哪里?

本文转载自共识未来公众号 引言:最近关于区块链革命的提法少了很多,我们很少再听到“区块链即将颠覆互联网”的提法,这似乎也寓意着区块链技术(加密技术)正在进入一个理性发展的阶段,如果按照Gartner的技术…

js提交form表单

【背景】 前段时间将边用边学javascript.pdf书看完了,其中之前最不熟悉的也是这次印象最深刻的就是提交form表单,所以在这里总结一下js提交form表单,以及表单中对应的一些扩展知识O(∩_∩)O~ 【概念】 表单在网页中主要负责数据采集功能;一个表单偶三个基本组成部分&am…

JavaScript笔记-点击button提交form表单

功能如下&#xff1a; 点击购买后&#xff0c;点击确定。 确定调用了一个js函数&#xff0c;提交form表达给后端 代码如下&#xff1a; <div class"modal-footer"><button type"button" class"btn text-white border bg-dark" data-b…

yeild函数

1、把函数变成一个生成器 2、起到延迟的作用&#xff0c;在需要的时候产生结果&#xff0c;节省资源 3、声明一个序列不同的是生成器在不使用的情况下&#xff0c;是不占内存的 def getNum(n):i 0while i < n:print(i)i 1getNum(5)def getNum(n):i 0while i < n:retu…

Python关键字------yeild

文章目录 yeild例子 在阅读python程序源码的时候&#xff0c;发现yeild关键字&#xff0c;产生了疑惑&#xff0c;看了很多博客感觉没有能够讲清楚的。 yeild yeild其实可以理解成return&#xff0c;不够有点区别的是return是不会执行下面的语句&#xff0c;而yeild在满足一定…

join(),sleep() 和 yeild() 方法的区别

目录 1、join() 方法&#xff1a;释放锁 2、sleep() 方法&#xff1a;不释放锁 3、yeild() 方法&#xff1a;不释放锁 1、join() 方法&#xff1a;释放锁 使用场景&#xff1a; 等待调用 join() 方法的线程结束之后&#xff0c;程序再继续执行&#xff0c;一般用于等待异步…

C#中关于Task.Yeild()的探究

在与同事讨论async/await内部实现的时候&#xff0c;突然想到Task.Yeild()这个函数&#xff0c;为什么呢&#xff0c;了解一点C#async/await内部机制的都知道&#xff0c;在await一个异步任务&#xff08;函数&#xff09;的时候&#xff0c;它会先判断该Task是否已经完成&…

python yeild next使用注意事项

关于得带的基本使用方法&#xff0c;可以往上查一下。这里主要记录下在编码中可能遇到的报错&#xff0c;和处理方式。 import timedef func3():for i in range(5):yield iwhile True:a next(func3())print(a)time.sleep(1) 如果使用上面这种取值方式&#xff0c;你会发现会…

Java多线程礼让yeild()和插队join()方法案例

一. yeild()和join()方法 1.yeild():线程礼让&#xff0c;让当前正在执行的线程可能暂停&#xff0c;但不阻塞 2.yeild():当前正在执行的线程可能暂停&#xff0c;也可能不暂停。 3.yeild():是静态方法&#xff0c;而join()是非静态方法 4.join():能…

gitlab artifacts too large

gitlab在打包artifacts遇到&#xff1a; Uploading artifacts as “archive” to coordinator… too large archive 413 error 网上看了很多方案&#xff0c;一般都是说在admin账户的setting下找到CI/CD&#xff0c;把Maximum artifacts size (MB)改大点 当然这是其中一个点哈…

IDEA 解决 artifacts not found 问题

目录 1. 问题2. 解答方法一方法二 1. 问题 部署 Tomcat 时&#xff0c;选择 Edit Configuration 无 Artifact 选项。 2. 解答 方法一 选择 Fix 直接修复即可。 方法二 打开 Project Structure&#xff1b;选择 Aritfacts 选项&#xff1b;点击 号&#xff0c;选择 Web …

jenkins使用Send build artifacts over SSH遇到的坑

在jenkins构建项目后&#xff0c;优势需要把jar等文件复制到其他服务器&#xff0c;如下图&#xff0c;可以使用Send build artifacts over SSH功能。 但是在使用时可能会遇到无法复制成功 可以从以下几方面入手&#xff0c;基本可以解决该问题 1、检查是否配好了目标主机的用…

【论文笔记】Details or Artifacts: A Locally Discriminative Learning Approach toRealistic Image Super-Reso

细节还是伪纹理&#xff1a;真实图像超分辨率的局部判别方法 来自于CVPR2022&#xff0c;作者Jie Liang&#xff0c; Hui Zeng and Lei Zhang 论文地址&#xff1a;https://arxiv.org/abs/2203.09195 Abstract: 目前超分想要优异的纹理信息&#xff0c;那GAN&#xff08;生成…

解析IDEA中的Artifacts配置

1. Artifact 2. Artifact名称 3. Artifact类型 4. 输出路径&#xff08;也就是Deployment root部署根目录&#xff09;&#xff0c;项目运行后的输出根目录 5. 输出根目录&#xff0c;即4指定的地址 6. 输出目录下的结构层次 针对指定项目&#xff0c;对应分析 1. 输出根…

idea配置Tomcat时没有Artifacts选项

想要解决没有artifacts选项的问题&#xff0c;首先要配置项目结构。 点击加号&#xff0c;选择web 然后修改地址,编译后的文件将会生成在你修改的文件夹下&#xff0c;点击Apply应用所作的修改&#xff0c;然后点击Create Artifacts 此时idea就会在Artifacts下生成一个Web expl…

idea为web项目添加tomcat并配置Artifacts

背景 有一天聪明的小峰从网上找了一个web项目&#xff0c;但是只有代码没有启动步骤&#xff0c;作为小白的我解决这个问题也不太顺利特此记录一下。 主要解决的问题&#xff1a; 为项目添加tomact 配置Artifacts 引入 jar包 小峰找的项目地址&#xff1a;https://github.com/…

idea配置factets和Artifacts

最近需要把项目部署到服务器&#xff0c;需要打个war包&#xff0c;有好多不太明白&#xff0c;把搜索学习到的知识点汇总一下&#xff0c;以备后用&#xff0c;本人使用的版本是2020.3版本。 在说明这个配置过程之前&#xff0c;先简单的介绍一下这两个是什么&#xff0c;有什…

IDEA中WEB项目结构和Artifacts设置

公司的WEB项目结构一直比较随意&#xff0c;没有统一的规范&#xff0c;新增项目也是直接用旧的项目文件夹拷贝过去修改&#xff0c;时间长了以后项目文件结构混乱&#xff0c;研究了半天终于找到了&#xff08;可能&#xff09;正确的目录结构设置&#xff0c;能够直接输出正确…

棋盘效应(Checkerboard Artifacts)

定义&#xff1a;棋盘效应是由于反卷积的“不均匀重叠”&#xff08;Uneven overlap&#xff09;的结果。使图像中某个部位的颜色比其他部位更深&#xff1a; 具体原因&#xff1a;在反卷积操作时&#xff0c;如果卷积核&#xff08;Kernel&#xff09;大小不能被步长&#xff…