中文WordNet的安装与使用

article/2025/10/28 17:47:52

最近在中文语料上数据分析,想借用一些外部资源,就想到了WordNet,在这里记录一下,以备后用。

文章目录

  • (一)WordNet的介绍
  • (二)WordNet的安装
  • (三)中英文WordNet的使用
    • (1)词义查询
    • (2) 同义词查询
    • (3) 其他查询

(一)WordNet的介绍

WordNet是由Princeton 大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。

它是一个覆盖范围宽广的英语词汇语义网。名词,动词,形容词和副词各自被组织成一个同义词的网络,每个同义词集合都代表一个基本的语义概念,并且这些集合之间也由各种关系连接。

WordNet包含描述概念含义,一义多词,一词多义,类别归属,近义,反义等问题,访问以下网页,可使用wordnet的基本功能: http://wordnetweb.princeton.edu/perl/webwn

(二)WordNet的安装

首先要安装nltk.

pip install nltk

然后用nltk的downloader下载“wordnet”,获取相关的数据。

import nltk
nltk.download('wordnet')  # 这是英文的wordnet

如果要使用中文的WordNet,需要再下载一个组件“omw”。

nltk.download('omw') # omw 代表Open Multilingual Wordnet

在这里插入图片描述
在这里插入图片描述
安装好以后,就可以使用啦。

(三)中英文WordNet的使用

(1)词义查询

word.definition()
  • 英文
from nltk.corpus import wordnet as wn# 获得单个词的定义查询
apple = wn.synset('apple.n.01')
print(apple.definition())# 获得该词的所有词性及解释下的定义
word = 'apple'
for w in wn.synsets(word):print(w.definition())# 输出:
# fruit with red or yellow or green skin and sweet to tart crisp whitish flesh# fruit with red or yellow or green skin and sweet to tart crisp whitish flesh
# native Eurasian tree widely cultivated in many varieties for its firm rounded edible fruits
  • 中文

因为中文在查询时,本质上还是映射到英文语义上去,所以不能直接用类似“秘密.n.01”这种形式,只用用synsets来查,synset是没有‘lang’这个参数的。

word = '秘密'
print('origin word:', word)
if len(wn.synsets(word,lang='cmn')) == 0:print('No this word')
for w in wn.synsets(word,lang='cmn'):print(w)print(w.definition())# 输出:
# origin word:秘密# Synset('mystery.n.01')
# something that baffles understanding and cannot be explained# Synset('secret.n.01')
#something that should remain hidden from others (especially information that is not to be passed on)# Synset('privacy.n.02')
# the condition of being concealed or hidden

一些注释

一个词可能同时具有动词、名词等多种词性,而且每个词性下可能具有多种解释。例如,在查询"privacy"一词时:

  • “privacy.n.01” 代表“the quality of being secluded from the presence or view of others”,
  • "privacy.n.02"代表“the condition of being cncealed or hidden”

n代表名词,v代表动词,数字代表第几个。
`

(2) 同义词查询

word.lemma_names()

具体调用过程与词义查询基本一致。

  • 英文
from nltk.corpus import wordnet as wn# 方法一:
print(wn.synset('apple.n.01').lemma_names())# 方法二:
for w in wn.synsets('apple'):print(w.lemma_names())
  • 中文
word = '秘密'for w in wn.synsets(word,lang='cmn'):print(w.lemma_names())# 输出
# ['privacy', 'privateness', 'secrecy', 'concealment']
# ['mystery', 'enigma', 'secret', 'closed_book']
# ['mystery', 'enigma', 'secret', 'closed_book']

这里相当于是,把中文的“秘密”与英文中的词做了一个对应,对应到三个名词,分别是上面提到的’mystery.n.01’,‘secret.n.01’ 和 ‘privacy.n.02’。在找同义词时,分别找到了“秘密”这个中文词对应的三个英文词的同义词。

(3) 其他查询

hypernyms() # 上位(父类)
hyponyms() # 下位(子类)lemma_names() # 同义
antonyms() # 反义entailments() # 蕴含关系part_meronyms() # 部分
substance_meronyms() # 实质
member_holonyms() # 成员

目前只用到了同位词,以后用到什么其他的模块,再来补充吧。

参考:
https://blog.csdn.net/xieyan0811/article/details/82314042
https://blog.csdn.net/MAILLIBIN/article/details/100580676


http://chatgpt.dhexx.cn/article/Vyj5KZkQ.shtml

相关文章

WordNet介绍

WordNet 1 WordNet简介 传统词典一般都是按字母顺序组织词条信息的,这样的词典在解决用词和选义问题上是有价值的。然而,它们有一个共同的缺陷,就是忽略了词典中同义信息的组织问题。20世纪以来,语言学家和心理学家们开始从一个崭…

nltk.download(‘wordnet‘)错误;Resource wordnet not found. Please use the NLTK Downloader to obtain th

问题 使用nltk.download(wordnet)下载不下来要用的包,导致代码加载资源错误 解决 离线下载NLTK Data github:nltk_data 将解压文件后得到的packages文件夹 目录下面的所有文件(防止再少什么文件报错) 按照下图报错中的目录&a…

WordNet简介

WordNet 1 WordNet简介 传统词典一般都是按字母顺序组织词条信息的,这样的词典在解决用词和选义问题上是有价值的。然而,它们有一个共同的缺陷,就是忽略了词典中同义信息的组织问题。20世纪以来,语言学家和心理学家们开始从一个崭…

快速了解WordNet

1、什么是WordNet WordNet是由Princeton 大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。 WordNet是一个覆盖范围宽广的英语词汇语义网。名…

Android studio调用webview出现Webpage not available

题记 今天写一个Android程序时&#xff0c;出现了Webpage not available&#xff0c;如下所示&#xff0c;无法显示浏览器&#xff0c;捣鼓了半个早上。 解决办法&#xff1a; 查看AndroidMainifest.xml是否有开权限和信任未加密流量。 添加的位置如下所示&#xff1a; <u…

解决genymotion使用内置浏览器访问网页Webpage not available的问题

1. 学习到Android使用浏览器打开外部网页的时候出现了网页不能够被访问的情况 2. 下面是几种具体的解决方案&#xff1a; ① Virtual Box的设置 首先需要关闭正在运行的genymotion模拟器&#xff0c;打开Virtual Box&#xff0c;右键你需要的设置的模拟器&#xff0c;点击社渚…

使用WebView时错误:WebPage not available

在第一行代码书中仅仅提到在AndroidManifest中添加 <uses-permission android:name"android.permission.INTERNET" />但实际上是不够的&#xff0c;经过参考 https://blog.csdn.net/zgd826237710/article/details/95520785?depth_1-utm_sourcedistribute.pc…

MSQL Webpage

Mars Nov 19, 2014

Webpage not available err_cleartext_not_permitted

在使用webview时&#xff0c;出现上面错误&#xff0c;你需要 1、添加网络权限 <uses-permission android:name"android.permission.INTERNET"/> 2、 在application中添加 android:usesCleartextTraffic"true" 运行成功

安卓上使用 WebView 提示:Webpage not available 的解决办法

文章目录 一、错误界面二、添加网络权限三、信任未加密流量四、参考链接 一、错误界面 二、添加网络权限 这一步是必须的&#xff0c;否则的话&#xff0c; WebView 加载不出来&#xff0c;手机界面会提示 Webpage not available。 在 AndroidManifest.xml 清单文件中添加&am…

webpage vue-cli 脚手架安装搭建

1、下载node解压版&#xff1a; 下载地址&#xff1a;https://nodejs.org/en/download/ 2、安装node 解压并安装到目录E:\Application\develop\node-v10.13.0-win-x64 3、配置环境变量 查看node版本 命令&#xff1a;node -v 4、vue-cli 脚手架 安装 参考&#xff1a;http…

a problem occurred with this webpage so it was reloaded

1 问题描述&#xff1a; Safari浏览器进入网站&#xff0c; 网站会&#xff08;不断&#xff09;重载。提示a problem occurred with this webpage so it was reloaded 2 问题演示视频、截图&#xff08;右图我需要重现并解决的&#xff09;&#xff1a; 视频地址&#xff1a;h…

vue26 —— webpage使用 -- 配置

1. 生成package.json文件 需要使用到package.json 通过npm init 生成 终端进入到对应文件夹&#xff0c;执行npm initpackage name: (02-配置) meetwebpack &#xff08;直接敲回车默认使用括号内的名字&#xff0c;但有中文不支持&#xff09; … 省略部分皆直接回车entry p…

No webpage was found for the web address

No webpage was found for the web address:http://127/0/1/course/4 提示非常明确&#xff0c;这个页面找不到&#xff0c; 页面找不到&#xff0c;首先想到的是不是HTML的代码书写&#xff0c;是否遗漏 接着路径配置的问题&#xff0c;于是返回到配置的urls检查&#xff0c;对…

Android模拟器Webview打开网页报webpage not available

错误如下&#xff1a; 解决方法如下&#xff1a; 1、添加网络权限 在 AndroidManifest.xml 清单文件中添加&#xff1a; <uses-permission android:name"android.permission.INTERNET"/> <uses-permission android:name"android.permission.ACCESS_…

详细记录更新winc1500固件及其网络配置页面(provisioning webpage)过程

在我之前的文章中&#xff0c;详细讲解了如何移植winc1500驱动到IMX1020单片机&#xff0c;想了解的朋友可以点击下面链接&#xff0c; 采用IMXRT1020驱动ATWINC1500模块_宇宸宇宸的博客-CSDN博客 在实际使用wifi模块时我们经常需要通过一个页面配置wifi的ssid和密码&#xf…

Android开发WebView组件报webpage not available

1、确认是否添加 网络权限设置 2、确认是否添加&#xff0c;否则会出现闪退或者直接app无法运行 android:usesCleartextTraffic"true" 到AndroidManifest.xml里 3、如果还是发现无法打开网页 考虑将原来的device删除&#xff0c;重新安装一个 最后成功解决问题

phontomjs webpage模块属性

随时随地阅读更多技术实战干货&#xff0c;获取项目源码、学习资料&#xff0c;请关注源代码社区公众号(ydmsq666) canGoBack Examples var webPage require(webpage); var page webPage.create(); // TODO: Finish page.canGoBack example. canGoForward Examples var …

phontomjs webPage模块方法

随时随地阅读更多技术实战干货&#xff0c;获取项目源码、学习资料&#xff0c;请关注源代码社区公众号(ydmsq666) addCookie addCookie(Cookie) {boolean} Introduced: PhantomJS 1.7 Add a Cookie to the page. If the domain does not match the current page, the Cooki…

webpage基本使用

webpack的基本使用 一.安装webpack (1) 打开项目目录终端&#xff0c;输入命令: npm install webpack webpack-cli -D (2) 然后在项目根目录中&#xff0c;创建一个 webpack.config.js 的配置文件用来配置webpack 在 webpack.config.js 文件中编写代码进行webpack配置&#…