知识图谱从入门到应用——知识图谱的发展

article/2025/3/1 9:15:57

分类目录:《知识图谱从入门到应用》总目录
相关文章:
· 知识图谱的基础知识
· 知识图谱的发展
· 知识图谱的应用
· 知识图谱的技术结构


1945年,美国首任总统科学顾问Vannevar Bush曾提出了一个称为MEMEX的“记忆机器”的设想。他认为人的记忆偏重关联,而非像图书馆那样采用严格的层次分类目录组织大脑中的信息。因此,他提出设计一种Mesh关联网络来存储电子化的百科全书。MEMEX记忆机器的设想启发了超文本技术Hypertext的实现,而超文本技术则直接促成了互联网的最大应用——World Wide Web的发明。Web是由英国人Tim Berners-Lee提出的,他因为Web技术的贡献获得了2016年的图灵奖。1989年,Tim作为欧洲高能物理研究中心的计算机工程师,提出了一种基于超文本技术的信息管理系统建议书。如图1-8所示,在建议书中,就可以看到知识图谱的影子。

起初,他只是希望为高能物理研究中心的科学家设计一种新型的科技文献管理系统。他利用超文本链接技术实现科技文献之间的相互关联,并实现了世界上第一个能处理这种超文本链接的Web服务器和浏览器。他认为,信息应该以图的方式组织,图中的节点可以是任何事物,节点之间的链接代表事物之间的关联,这样将大幅提升信息检索的效率和能力。这种以图和链接为中心的系统,在开放的互联网环境里面更容易生长和扩展。这一理念逐步被人们实现,并演化发展成为今天的World Wide Web。

Semantic Web

1994年,Web已经在全世界范围内快速发展起来,成为互联网上的最大应用。但Tim指出,这种以文本链接为主的Web并非他设想中的终极Web的样子。他认为终极的Web应该是Web of Everythings。例如,一位教授的个人主页实际上描述的是他的各种属性信息,如果他的主页上有一个超链接指向浙江大学的官方主页,这个超链接实际上指的是这名教授和浙江大学是雇佣关系,但这个超链接没有这方面的语义描述,搜索引擎也无法识别和处理这种语义关系。因此,他于1998年正式提出了Semantic Web(语义网)的概念。与经典Web一样,Semantic Web也是以图和链接为中心的信息管理系统,但不同之处是,图中的节点可以是粒度更细的事物,如一本书、个人、机构和概念等,图中的链接也标明这些事物之间的语义关系,如雇佣、朋友和作者等。这就是知识图谱的早期理念。

在Semantic Web提出以后的10余年里,催生了众多的语义网数据项目,比较著名的如谷歌知识图谱的核心数据来源Freebase,欧洲的LinkingOpenData,维基基金会倡导的WikiData等。由国内科研机构和企业共同发起的OpenKG收录了很多中文领域的语义网开放数据集。

谷歌公司于2010年收购了开发Freebase的Meta Web公司,并于2012年发布了首个基于知识图谱实现的搜索引擎。谷歌知识图谱本质上是Semantic Web理念的商业化实现。对于搜索引擎,知识图谱解决了一个难题,即精确的对象级搜索问题。传统搜索引擎只能返回很多相关页面,用户需要从海量文本中自行寻找答案,即所谓字符串级别的搜索。但用户希望直接搜索最终的答案,例如用户问:“浙江大学位于哪个城市”,希望得到对事物的精准描述——杭州市,而非返回很多页面,让用户自己从众多页面中寻找正确答案,即所谓事物对象级别的搜索。谷歌通过构建庞大的知识图谱,以结构化而非纯文本的方式描述事物的属性以及事物之间的关联关系,就可以实现这种对象级的精准搜索。当然,知识图谱的价值不止搜索。

典型的知识图谱项目

接下来简要介绍历史上出现过的典型知识图谱项目。Freebase是早期的语义网项目,主要通过开放社区协作方式构建,在经过近8年的开发和数据积累后,其母公司MetaWeb于2010年被谷歌收购。谷歌随后在Freebase基础之上发布了其面向搜索的知识图谱。Wikidata在一定程度上可以看作Freebase的后续发展,它由维基基金会支持,同样也是依靠开放社区众包构建。它的目标是要成为世界上最大的免费知识库,并采用了CC0完全自由的开放许可协议。Schema.org是谷歌等搜索引擎公司共同推动的Web数据Schema标准。Schema.org本质上是一种轻量级的本体,定义了有关人物、机构和地点等最常用的1000多个类和关系。任何人都可以利用这个Schema描述自己的数据,并以RDFa、Mcirodata等格式插入网页或邮件中。这使得每个人或机构都可以定制自己的知识图谱信息,并被搜索引擎快速地抓取和更新到后台数据库中。

DBPedia也是早期的语义网项目。DBPedia意指数据库版本的Wikipedia,是从Wikipedia抽取出来的链接数据集。DBPedia采用了一个较为严格的本体,包含人、地点、音乐、电影、组织机构、物种和疾病等类定义。YAGO是由德国马普研究所研制的链接数据库。YAGO主要集成了Wikipedia、WordNet和GeoNames三个来源的数据。其主要特点是考虑了时间和空间维度的知识表示。YAGO是IBM Watson的后端知识库之一。WordNet是最著名的词典知识库,主要用于词义消歧等自然语言处理任务。由普林斯顿大学认知科学实验室从1985年开始开发,与谷歌知识图谱以实体关系为主不同,它主要定义词与词之间的语义关系。ConceptNet源于MIT的Open Mind Common Sense项目,由著名的人工智能专家Marvin Minsky于1999年建议创立。与谷歌知识图谱相比,ConceptNet侧重于词与词之间的关系,更加接近于WordNet,但比WordNet包含的关系类型更多。

BabelNet是多语言词典知识库,它集成了WordNet在词语关系上的优势和Wikipedia在多语言方面的优势。通过机器翻译技术,自动化地构建了目前最大规模的多语言词典知识库,目前包含了271种语言和1400万个同义词组。前面介绍的主要是英文领域的部分较为典型的知识图谱项目。在中文领域,中国中文信息学会语言与知识计算专业委员会于2015年启动了OpenKG中文开放知识图谱项目的建设,系统地收集和整理了中文领域的众多开放知识图谱,读者可以访问OpenKG官网了解。

知识图谱的演进

知识图谱并非突然出现的全新技术,而是很多相关领域不断发展融合的结果。一方面,知识图谱具有人工智能的基因,这可以追溯到1960年,人工智能领域学者提出的知识表示方法——语义网络的本质就是一种知识图谱的表示方式,如下图所示。人工智能发展历史上提出的一些典型的知识表示方法,如框架系统、产生式规则、本体论和描述逻辑等。另外一方面,知识图谱也具有很鲜明的互联网基因。互联网的发展特别是万维网的发展促进了人类知识的共享和开放领域数据如Wikipedia的众包积累,没有万维网数十年积累的开放数据,也不会有谷歌的知识图谱。此外,利用图结构的方式描述万物关系和记录事物知识的理念也来源于万维网。因此,需要从多个不同的技术视角全面地掌握知识图谱的本质内涵。

知识图谱的演进

参考文献:
[1] 陈华钧.知识图谱导论[M].电子工业出版社


http://chatgpt.dhexx.cn/article/2Nu6bTCs.shtml

相关文章

知识图谱从入门到应用——知识图谱的基础知识

分类目录:《知识图谱从入门到应用》总目录 相关文章: 知识图谱的基础知识 知识图谱的发展 知识图谱的应用 知识图谱的技术结构 知识图谱是有学识的人工智能 早期的人工智能有很多持不同观点的流派,其中两个历史比较悠久的流派通常被称为…

知识图谱的应用领域

1.3 知识图谱的价值 知识图谱最早的应用是提升搜索引擎的能力。随后,知识图谱在辅助智能问答、自然语言理解、大数据分析、推荐计算、物联网设备互联、可解释性人工智能等多个方面展现出丰富的应用价值。 1.辅助搜索 互联网的终极形态是万物的互联,而…

最详细的知识图谱的技术与应用

导读:从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图…

知识图谱是什么?一文了解其技术与应用场景案例

导读:悟已往之不谏,知来者之可追。 小编整理了各种关于人工智能的学习资料库(知识图谱、图像处理opencv\自然语言处理、机器学习、数学基础等),还有AI大礼包:Pytorch、实战框架视频、图像识别、OpenCV、计算…

言简意赅,盘点知识图谱在各领域的应用

言简意赅,盘点知识图谱在各领域的应用 01 语义匹配02 搜索推荐03 问答对话04 推理决策05 区块链协作 什么是知识图谱?通俗易懂 01 语义匹配 语义匹配是搜索推荐、智能问答和辅助决策的基础。在没有知识图谱以前,文本匹配主要依靠字面匹配为…

知识图谱有哪些应用领域?

知识图谱通常应用于自然语言处理和人工智能领域,常用于提高机器学习模型的准确性和效率。它还可以用于数据挖掘、信息检索、问答系统和语义搜索等领域。近年来知识图谱在电子商务、金融、公安、医疗等行业逐步开始落地,在这些行业的渗透、深入中&#xf…

云主机 环境搭配 交接文档

1.各个文件夹作用 2.pycharm 同步文件到服务器: 设置被上传服务器路径 3. 远程 操作服务器 首先安装远程链接软件 以上环境基本搭配完善

计算机使用交接记录表,交接文档_计算机软件及应用_IT计算机_专业资料

交接文档_计算机软件及应用_IT计算机_专业资料 (6页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 9.9 积分 GainGainViewController(赚学饼)//获取赚学饼列表数据?(void)getData〃领取奖励?(vo…

交接文档怎么写_怎么写一篇实用的需求说明文档

应该很多人都遇到过这种场景吧:某天同事突然微信发来一句话:你写过产品需求文档吧,给我发一个模版。他们突然提出这种需求的时候,多半是在客户现场,出于客户要求,要完成一项叫做“写一个产品需求文档”的工…

如何快速离职?离职交接工作清单(前端)

前言 这是一篇前端离职项目交接清单(front-end handover checklist)。 仰天大笑出门去,我辈岂是蓬蒿人? 金三银四就要到了,大家一定跃跃欲试,甚至已经收获了很多offer。 即将入职公司:同学请问下周可以入职吗&#x…

开发交接文档_为开发人员创造更好的设计交接体验

开发交接文档 It’s 2020. We’re supposed to have flying cars and space travel. We should at least have our process for design handoff nailed down at this point. 现在是2020年。我们应该有飞行汽车和太空旅行。 在这一点上,我们至少应该确定我们的设计移交过程。 …

NvrSDK交接文档

这是使用md格式写成,为了方便阅读我就直接放到博客上了 一.工作内容 外面客户购买了我们的NVR产品,需要提供SDK包做二次开发解答客户对接SDK过程中遇到的问题解决SDK本身存在的bug根据新的需求增加接口 总结起来就是:提供SDK安装包、解答对…

某社区项目交接文档

某社区项目 本项目技术栈较为陈旧,使用framework7template7gulplessrequireJS。页面也存在很多迭代之后废弃的,故整理起来非常复杂,本文档将从几个方面试图对本项目进行梳理 为了使开发快速高效,使用了以下辅助工具:…

ds交接文档

环境 Qt Qt版本:Qt5.7.0以上,QT release下载地址http://download.qt.io/official_releases/qt/ Qt中文输入法软键盘需要重新编译qtvirtualkeyboard模块 qmake CONFIG"lang-en_GB lang-zh_CN"当前linux下部署版本是QT5.7.1,放在…

工作交接文档示例

工作交接 创建人 张三 联系方式 1234567890(QQ) 创建时间 2017/08/18 阅读人员 Java开发 公司简介 xx信息科技开发有限公司是一家…… 愿 景: 定 位: 使 命: 业务构成 公司主要产品有: 其中,几个主要用户对象…

交接文档整理

一、开发 无 TD 文档,先进行协商,避免出现口头需求、全部由开发背锅情况。优先处理 bug,半天内可以搞定就做,否则不予处理。情形:查询前需要先进行 insert。MD5。工作流中间过程业务处理,根据流程编号重新…

【交接文档】如何写好工作交接文档

反驳不需要写文档的言论 有很多工程师都持有一个观点:“不用看(写)文档,文档都在代码里”,还有一部分人认为,文档容易过时,很难跟上代码的更新节奏,因而没有必要写文档。 接手业务的时候吐槽别人不写文档&a…

动态域名解析概述及操作步骤讲解

随着IPv4公网资源的紧缺,以及越来越多的互联网服务发展,许多用户都采取了动态域名解析的方法来解决内网穿透和服务器搭建问题。那么动态域名解析是什么?怎么操作呢?本文将详细介绍。 动态域名解析概述 现在广大的互联网&#xf…

最全DNS域名解析流程及域名注册(细节!)

DNS详解 DNS解析流程详解 图 1 DNS解析流程图 ​ 1.客户机上的用户在应用程序(如web浏览器)中输入网址。应用程序首先检查其浏览器缓存,如果缓存中有,则这个域名解析过程就结束。如果浏览器缓存中没有,浏览器会查找本地的hosts文件是否有这个映射关系,如果有,就先调用这个…

域名解析的过程和具体步骤

1. 域名解析就是国际域名或者国内域名以及中文域名等域名申请后做的到 IP 地址的转换过程。 . <?xml:namespace prefix o ns "urn:schemas-microsoft-com:office:office" /> 1 &#xff1a;例如客户机向本地服务器发请求&#xff0c;要求解 www.baidu.com 的…