WordNet介绍

article/2025/10/28 17:43:18

WordNet

1 WordNet简介 

传统词典一般都是按字母顺序组织词条信息的,这样的词典在解决用词和选义问题上是有价值的。然而,它们有一个共同的缺陷,就是忽略了词典中同义信息的组织问题。20世纪以来,语言学家和心理学家们开始从一个崭新的角度来探索现代语言学知识结构以及特定的词典结构,终于由Princeton大学研制成功了一个联机英语词汇检索系统—WordNet,它作为语言学本体库,同时又是一部语义词典,在自然语言处理研究方面应用非常广泛。

WordNet与其他标准词典最显著的不同在于:它将词汇分成五个大类:名词、动词、形容词、副词和虚词。实际上,WordNet仅包含名词、动词、形容词和副词。虚词通常是作为语言句法成分的一部分,WordNet忽略了英语中较小的虚词集。

WordNet最具特色之处是根据词义而不是词形来组织词汇信息。可以说WordNet是一部语义词典。但是与按字母排列的语义词典以及按主题排列的语义词典都不同,它是按照词汇的矩阵模型组织的。如表2.1所示。同义词集合(synonymy set)可以看作是词形(word form)之间一种具有中心角色的语义关系。WordNet2.0版本中,有115424个同义词集合,其中名词同义词集合就有79685个。基本上涵盖了我们常用的英语名词词汇。

表1 词汇矩阵概念示意:F1F2为同义词;F2是多义词

 

词形

F1

F2

F3

Fn

M1

E(1, 1)

E(1, 2)

       

M2

 

E(2, 2)

       

M3

   

E(3, 3)

     

           

Mm

         

E(m, n)

1简单说明了词汇矩阵的设想:假定表中的列代表词形,行代表词义,矩阵中的表元素对应列上的词形可以被用来表示相应表行上的词义(在一个适当的上下文环境中)。这样,表元素E(1,1)就表示:词形F1可以表示词义M1;如果同一表列中有两个表元素,则该词形具有两个义项,是个多义词(polysemy);如果同一表行中有两个表元素,则对应的两个词形是同义的,相应的两个词是同义词(synonymy)。

2 WordNet中的语义关系 

WordNet中除了具有中心角色的同义关系外,还有反义关系、上下位关系和部分关系。

2.1 反义关系

 反义关系(antonymy)是很难定义的一种语义关系。一个词x的反义词有时并不是非x。例如,“富有(rich)”和“贫穷(poor)”是一对反义词,但是要说某个人不富有并不意味着一定穷;许多人认为自己既不富也不穷。反义词似乎是一种简单的对称关系,实际上却是相当复杂的。反义词是一种词形间的语义关系,而不是词义间的语义关系。例如,词义{升高,上升}和{下落,下降}可能在概念上是相对的,其中[升高/下落]是反义词,[上升/下降]也是反义词。但是,如果说“升高”与“下降”与“上升”于“下落”是否是反义词,就要考虑一下了。所以有必要区分词形之间的语义关系和词义之间的语义关系。反义关系为WordNet中的形容词和副词提供了一种中心组织原则。

2.2 上下位关系 

同义词和反义词都是词形之间的词汇关系不同,上位关系(hypernymy/下位关系(hyponymy)是词义之间的语义关系。例如:{樟树}是{树}的下位词,{树}又是{植物}的下位词。下位/上位关系也称为从属/上属关系子集/超集关系,或ISA关系。如果以英语为母语接受以“An x is a (kind of) y”框架构造的句子,则同义词集合{x1,x2,…}表示的概念与同义词集合{y1,y2,…}表达的概念是下位概念和上位概念的关系。上下位关系具有某种限制,而且是一种不对称的关系。通常情况下,一个同义词集合如果有与之是下位概念和上位概念的关系的同义词集合,则也只有惟一的一个。即便是不惟一,同为上位概念的关系的同义词集合之间差别也是非常小的。这就产生了一种层次语义结构,其中下位词位于其上属关系的下层。这样的层次表达方法,Touretzky称作继承体系,它意味着下位词继承了上位词更一般化概念的所有性质,并且至少增加一种属性,以区别它与它的上位词以及该上位词的其他下位词。例如,“枫树”继承了其上位词“树”的属性,但却以其坚硬的木质、叶片的形状等特性区别于其他的树。这种方法为WordNet中的名词提供了一种核心的组织原则。2.5.2节中我们将根据WordNet名词体系中的这一继承体系的特点,定义基于一个概念(同义词集合)的概念链。

2.3 部分关系 

同义关系,反义关系和上下位关系都是比较容易理解的语义关系。另一种语义关系称为“部分-整体关系”(简记为HASA),语言学家称之为部分词(meronym/整体词(holonym)的关系。如果以英语为母语接受以“A y is an x”或“An x is a part of y”框架构造的句子,则同义词集合{x1,x2,…}表示的概念与同义词集合{y1,y2,…}表达的概念是部分概念和整体概念的关系。部分关系也具有某种限制,且是不对称的关系,可以构造一种部分等级关系。


3 WordNet名词体系中相关概念

下面,我们介绍WordNet名词体系中一些重要概念。

(1)    独立起始概念(Unique Beginner

如果有一同义词集合(即概念)没有上位同义词集合(即上位概念),则称之为独立起始概念(Unique Beginner)。在WordNet名词体系中,共有25个独立起始概念。其他名词通过上位/下位关系与这25个独立起始概念构成25个独立的层次结构。也就是说,标识着某个起始概念特点的属性将它的所有下位概念所继承,而这个起始概念就可以看作为是该语义领域内的所有概念(同义词集合)的一个原始语义元素。如表2所示。

2 WordNet名词体系的25个独立起始概念

{动作,行为,行动}

{自然物}

{动物,动物系}

{自然现象}

{人工物}

{人,人类}

{属性,特征}

{植物,植物系}

{身体,躯体}

{所有物}

{认知,知识}

{作用,方法}

{信息,通信}

{量,数量}

{事件}

{关系}

{知觉,情感}

{形状}

{食物}

{状态,情形}

{团体,组织}

{物质}

{场所,位置}

{时间}

{目的}

   

(2) 词典编撰IDLexicographer ID

每一个同义词集合(synonymy set)均有惟一的一个编号,这个编号就称为词典编撰IDLexicographer ID)。

(3)    概念链(Concept Chain

概念链一般的定义是这样一种结构::=(C,<),其中C代表的是概念集合,<代表概念间的下位/上位关系。也就是说概念链是由C概念集合中的概念通过概念间的上位/下位关系连接而成。

(4)    WordNet名词体系中的概念链(Concept Chain

WordNet名词体系中,我们定义概念链(Concept Chain)如下:

:=((C,<)<UBCi),其中UBCi表示WordNet名词体系的一个独立起始概念,C代表的是概念集合,<代表概念间的下位/上位关系。也就是说概念链是以一个独立起始概念UBCi为链首,通过概念间的上位/下位关系连接与C概念集合连接而成。同时C概念集合中的概念也是通过概念间的上位/下位关系进行连接。如图1所示。


图1
一个概念链(Concept Chain)的例子

图1展示的就是一个概念链的示意范例。小三角形代表的是词“football”。每一个小圆圈都代表WordNet中的一个同义词集合(也就是概念)。小圆圈旁边的注释就是该同义词集合的内容。注释中的数字是该同义词集合的词典编撰IDLexicographer ID)。这个示意范例表达的是:词“football”有两个义项,即它在两个同义词集合中出现,也就是对应图中的两个小圆圈。小圆圈之间用带箭头的线连接,表示的是小圆圈所代表的概念通过下位/上位关系联系起来,从而构成概念链概念链的首端对应的就是WordNet中的独立起始概念。比如:概念链ch1可以表示为:(3255461<2681909<3289024<3174243<3443493<19244<2645<16236<1740)。其中(3255461)作为概念链的末端代表的是词“football”的一个义项,而(1740)是WordNet中的独立起始概念,成为概念链的首端。概念“game equipment”(3289024)是概念“ball”(2681909)的上层概念,表达的语义更抽象。

URL of Wordnet: http://wordnet.princeton.edu


http://chatgpt.dhexx.cn/article/lIw3G9Uy.shtml

相关文章

nltk.download(‘wordnet‘)错误;Resource wordnet not found. Please use the NLTK Downloader to obtain th

问题 使用nltk.download(wordnet)下载不下来要用的包&#xff0c;导致代码加载资源错误 解决 离线下载NLTK Data github&#xff1a;nltk_data 将解压文件后得到的packages文件夹 目录下面的所有文件&#xff08;防止再少什么文件报错&#xff09; 按照下图报错中的目录&a…

WordNet简介

WordNet 1 WordNet简介 传统词典一般都是按字母顺序组织词条信息的&#xff0c;这样的词典在解决用词和选义问题上是有价值的。然而&#xff0c;它们有一个共同的缺陷&#xff0c;就是忽略了词典中同义信息的组织问题。20世纪以来&#xff0c;语言学家和心理学家们开始从一个崭…

快速了解WordNet

1、什么是WordNet WordNet是由Princeton 大学的心理学家&#xff0c;语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列&#xff0c;而且按照单词的意义组成一个“单词的网络”。 WordNet是一个覆盖范围宽广的英语词汇语义网。名…

Android studio调用webview出现Webpage not available

题记 今天写一个Android程序时&#xff0c;出现了Webpage not available&#xff0c;如下所示&#xff0c;无法显示浏览器&#xff0c;捣鼓了半个早上。 解决办法&#xff1a; 查看AndroidMainifest.xml是否有开权限和信任未加密流量。 添加的位置如下所示&#xff1a; <u…

解决genymotion使用内置浏览器访问网页Webpage not available的问题

1. 学习到Android使用浏览器打开外部网页的时候出现了网页不能够被访问的情况 2. 下面是几种具体的解决方案&#xff1a; ① Virtual Box的设置 首先需要关闭正在运行的genymotion模拟器&#xff0c;打开Virtual Box&#xff0c;右键你需要的设置的模拟器&#xff0c;点击社渚…

使用WebView时错误:WebPage not available

在第一行代码书中仅仅提到在AndroidManifest中添加 <uses-permission android:name"android.permission.INTERNET" />但实际上是不够的&#xff0c;经过参考 https://blog.csdn.net/zgd826237710/article/details/95520785?depth_1-utm_sourcedistribute.pc…

MSQL Webpage

Mars Nov 19, 2014

Webpage not available err_cleartext_not_permitted

在使用webview时&#xff0c;出现上面错误&#xff0c;你需要 1、添加网络权限 <uses-permission android:name"android.permission.INTERNET"/> 2、 在application中添加 android:usesCleartextTraffic"true" 运行成功

安卓上使用 WebView 提示:Webpage not available 的解决办法

文章目录 一、错误界面二、添加网络权限三、信任未加密流量四、参考链接 一、错误界面 二、添加网络权限 这一步是必须的&#xff0c;否则的话&#xff0c; WebView 加载不出来&#xff0c;手机界面会提示 Webpage not available。 在 AndroidManifest.xml 清单文件中添加&am…

webpage vue-cli 脚手架安装搭建

1、下载node解压版&#xff1a; 下载地址&#xff1a;https://nodejs.org/en/download/ 2、安装node 解压并安装到目录E:\Application\develop\node-v10.13.0-win-x64 3、配置环境变量 查看node版本 命令&#xff1a;node -v 4、vue-cli 脚手架 安装 参考&#xff1a;http…

a problem occurred with this webpage so it was reloaded

1 问题描述&#xff1a; Safari浏览器进入网站&#xff0c; 网站会&#xff08;不断&#xff09;重载。提示a problem occurred with this webpage so it was reloaded 2 问题演示视频、截图&#xff08;右图我需要重现并解决的&#xff09;&#xff1a; 视频地址&#xff1a;h…

vue26 —— webpage使用 -- 配置

1. 生成package.json文件 需要使用到package.json 通过npm init 生成 终端进入到对应文件夹&#xff0c;执行npm initpackage name: (02-配置) meetwebpack &#xff08;直接敲回车默认使用括号内的名字&#xff0c;但有中文不支持&#xff09; … 省略部分皆直接回车entry p…

No webpage was found for the web address

No webpage was found for the web address:http://127/0/1/course/4 提示非常明确&#xff0c;这个页面找不到&#xff0c; 页面找不到&#xff0c;首先想到的是不是HTML的代码书写&#xff0c;是否遗漏 接着路径配置的问题&#xff0c;于是返回到配置的urls检查&#xff0c;对…

Android模拟器Webview打开网页报webpage not available

错误如下&#xff1a; 解决方法如下&#xff1a; 1、添加网络权限 在 AndroidManifest.xml 清单文件中添加&#xff1a; <uses-permission android:name"android.permission.INTERNET"/> <uses-permission android:name"android.permission.ACCESS_…

详细记录更新winc1500固件及其网络配置页面(provisioning webpage)过程

在我之前的文章中&#xff0c;详细讲解了如何移植winc1500驱动到IMX1020单片机&#xff0c;想了解的朋友可以点击下面链接&#xff0c; 采用IMXRT1020驱动ATWINC1500模块_宇宸宇宸的博客-CSDN博客 在实际使用wifi模块时我们经常需要通过一个页面配置wifi的ssid和密码&#xf…

Android开发WebView组件报webpage not available

1、确认是否添加 网络权限设置 2、确认是否添加&#xff0c;否则会出现闪退或者直接app无法运行 android:usesCleartextTraffic"true" 到AndroidManifest.xml里 3、如果还是发现无法打开网页 考虑将原来的device删除&#xff0c;重新安装一个 最后成功解决问题

phontomjs webpage模块属性

随时随地阅读更多技术实战干货&#xff0c;获取项目源码、学习资料&#xff0c;请关注源代码社区公众号(ydmsq666) canGoBack Examples var webPage require(webpage); var page webPage.create(); // TODO: Finish page.canGoBack example. canGoForward Examples var …

phontomjs webPage模块方法

随时随地阅读更多技术实战干货&#xff0c;获取项目源码、学习资料&#xff0c;请关注源代码社区公众号(ydmsq666) addCookie addCookie(Cookie) {boolean} Introduced: PhantomJS 1.7 Add a Cookie to the page. If the domain does not match the current page, the Cooki…

webpage基本使用

webpack的基本使用 一.安装webpack (1) 打开项目目录终端&#xff0c;输入命令: npm install webpack webpack-cli -D (2) 然后在项目根目录中&#xff0c;创建一个 webpack.config.js 的配置文件用来配置webpack 在 webpack.config.js 文件中编写代码进行webpack配置&#…

集电极开路的门电路 OC门

当几个与非门输出端用导线直接相连时&#xff0c;可能会出现几个门的电流冲到同一个二极管上&#xff0c;造成烧坏&#xff0c;所以用集电极开路的门电路&#xff0c;统一在输出端接外接电源。 单个门电路的电路图 符号 使用时&#xff0c;一般将几个输出段导线连接&#xff0c…