Imagenet和wordnet的联系

article/2025/10/28 17:46:25

Imagenet数据集

是由根据WordNet层次结构(目前只有名词)组织的图像数据库,其中层次结构的每个节点都有成百上千的图像。其总共有大约21K类,每一类节点对应一个wnid(WordNet ID of class),1500多万张图片,如下图展示了32326类的Imagetnet数据集组织形式。
在这里插入图片描述
常用的为ISLVRC 2012(ImageNet Large Scale Visual Recognition Challenge)比赛用的子数据集,其中:

  • 训练集:1,281,167张图片+标签
  • 验证集:50,000张图片+标签
  • 测试集:100,000张图片,属于1000个不同的类别。

wordnet简介

传统词典一般都是按字母顺序组织词条信息的,这样的词典在解决用词和选义问题上是有价值的。然而,它们有一个共同的缺陷,就是忽略了词典中同义信息的组织问题。WordNet是由Princeton 大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。而每个不同的语义(sense)又可能对应多个词,如topic和subject在某些情况下是同义的,

WordNet与其他标准词典最显著的不同在于:它将词汇分成五个大类:名词、动词、形容词、副词和虚词。实际上,WordNet仅包含名词、动词、形容词和副词。虚词通常是作为语言句法成分的一部分,WordNet忽略了英语中较小的虚词集。

WordNet的语料库,在nltk_data文件夹下的corpora文件夹中,corprora文件夹是下载的,下载方式是使用两行代码。

pip install nltk
python -m nltk.downloader # 选择安装wordnet

WordNet与一般字典的不同在于组织结构的不同,它是以同义词集合(Synset)作为基本的构建单位来组织的,用户可以在同义词集合中找到一个合适的词去表达一个已知的概念。而与传统词典类似的是它也给出了定义和例句。

如果说WordNet是一个数据库,那么Synset就是一条数据的主键,而每一条数据,代表的是一个词义。

from nltk.corpus import wordnet as wn
wn.synsets('dog') # 得到'dog'的所有词义Out[1]: 
[Synset('dog.n.01'),Synset('frump.n.01'),Synset('dog.n.03'),Synset('cad.n.01'),Synset('frank.n.02'),Synset('pawl.n.01'),Synset('andiron.n.01'),Synset('chase.v.01')]

由上图可见,Synset由三部分组成,第一部分是词义,第二部分是词性,第三部分是编号。’dog’所有词义中词性为名词(n)的词性有7个,词性为动词(v)的有1个。这个排列顺序是根据该词义出现的次数排列的。

# 查看不同词义的定义
wn.synset('dog.n.01').definition() 
Out[3]: 'a member of the genus Canis (probably descended from the common wolf) that has been domesticated by man since prehistoric times; occurs in many breeds'wn.synset('dog.n.03').definition()
Out[4]: 'informal term for a man'

可以看到,同样的都是名词’dog’有着不同的定义。

# 查看例句(可能有多句,放在同一个列表中)
wn.synset('dog.n.01').examples()
Out[5]: ['the dog barked all night']wn.synset('dog.n.03').examples()
Out[6]: ['you lucky dog']# 查询同义词
wn.synset('dog.n.01').lemmas()
Out[7]: 
[Lemma('dog.n.01.dog'),Lemma('dog.n.01.domestic_dog'),Lemma('dog.n.01.Canis_familiaris')]# 查询每个同义词的写法
wn.synset('dog.n.01').lemma_names()
Out[8]: ['dog', 'domestic_dog', 'Canis_familiaris']

上面说过,wordnet中,Synset是一条数据的主键。这个主键和词性+8位offset对应。如下所示

# 查询词性
wn.synset('dog.n.01').pos()
Out[11]: 'n'# 查询8位offset
wn.synset('dog.n.01').offset()
Out[9]: 2084071# 由词性和8位offset得到synset
wn.synset_from_pos_and_offset('n',2084071)
Out[12]: Synset('dog.n.01')

在imagenet中,类别是词性+8位offset命名的,这被称为wnid,因此每一个类别均对应着一条Synset主键。所以知道了Synset主键之后,我们也可以得到其wnid(词性+8位offset):

def getwnid(u):s = str(u.offset())return 'n' + (8 - len(s)) * '0' + s # offset不显示前面的0,所以需要补0到8位。

所谓hypernym,表示某一个概念的上位词,假如A的上位词是B,简单的理解即是B是一个大的概念,A是B概念的一种情况,A更加具体。

# 例如,A概念表示狗,B概念表示家养动物,我们知道狗是家养动物的一种,则可以称家养动物是狗的一个上位词。wn.synset('dog.n.01').hypernyms() 
Out[13]: [Synset('canine.n.02'), Synset('domestic_animal.n.01')]

跟上位词对应,也有下位词概念,英文单词为hyponym,在下面的例子中,basenji、corgi等都是狗的不同品种,都是狗这个具体概念下的更加具体的概念。

wn.synset('dog.n.01').hyponyms()
Out[15]: 
[Synset('basenji.n.01'),Synset('corgi.n.01'),Synset('cur.n.01'),Synset('dalmatian.n.02'),Synset('great_pyrenees.n.01'),Synset('griffon.n.02'),Synset('hunting_dog.n.01'),Synset('lapdog.n.01'),Synset('leonberg.n.01'),Synset('mexican_hairless.n.01'),Synset('newfoundland.n.01'),Synset('pooch.n.01'),Synset('poodle.n.01'),Synset('pug.n.01'),Synset('puppy.n.01'),Synset('spitz.n.01'),Synset('toy_dog.n.01'),Synset('working_dog.n.01')]

http://chatgpt.dhexx.cn/article/ooDHiHx3.shtml

相关文章

【WordNet】词典——omw-1.4下载

from nltk.corpus import wordnet syns wordnet.synsets("bank") print(syns[0].name())运行这段代码时,编译器会提示找不到【omw-1.4】这个东西 官方地址 官方NLTK网址 但是要科学上网… 分享一个已经下载好的 链接:https://pan.baidu.c…

NLP——WordNet;Word Similarity; Word Sense Disambiguition

WordNet WordNet是一个广泛使用的英语词汇数据库和语义网络。它由普林斯顿大学认知科学实验室开发,旨在帮助人们理解单词之间的关系和意义。WordNet的主要目标是将英语词汇组织成一种层次结构,其中每个词都与其他相关词联系起来。WordNet中的单词按照它们…

nltk安装Wordnet出错[nltk_data] Error loading wordnet: <urlopen error [Errno 111]

LawsonAbs的认知与思考&#xff0c;还请各位读者批判阅读。 环境配置 ubuntu 18.04nltk 3.5在nltk中安装wordnet 出现问题[nltk_data] Error loading wordnet: <urlopen error [Errno 111]。解决方法适用于所有的nltk.download()报错 问题 在使用nltk中的语料库wordnet时…

WordNet介绍,一个开放知识图谱

1 WordNet简介 传统词典一般都是按字母顺序组织词条信息的&#xff0c;这样的词典在解决用词和选义问题上是有价值的。然而&#xff0c;它们有一个共同的缺陷&#xff0c;就是忽略了词典中同义信息的组织问题。20世纪以来&#xff0c;语言学家和心理学家们开始从一个崭新的角…

如何使用wordnet

介绍 WordNet是包含语义信息的英语词典。 wordnet根据单词的语义分组&#xff0c;相同语义的单词组合在一起称为synset&#xff08;同义词集&#xff09;&#xff0c;一个一词多义的单词将出现在它的每个语义对应的同义词集中wordnet为每一个synset提供了简短&#xff0c;概要…

中文WordNet的安装与使用

最近在中文语料上数据分析&#xff0c;想借用一些外部资源&#xff0c;就想到了WordNet&#xff0c;在这里记录一下&#xff0c;以备后用。 文章目录 &#xff08;一&#xff09;WordNet的介绍&#xff08;二&#xff09;WordNet的安装&#xff08;三&#xff09;中英文WordNet…

WordNet介绍

WordNet 1 WordNet简介 传统词典一般都是按字母顺序组织词条信息的&#xff0c;这样的词典在解决用词和选义问题上是有价值的。然而&#xff0c;它们有一个共同的缺陷&#xff0c;就是忽略了词典中同义信息的组织问题。20世纪以来&#xff0c;语言学家和心理学家们开始从一个崭…

nltk.download(‘wordnet‘)错误;Resource wordnet not found. Please use the NLTK Downloader to obtain th

问题 使用nltk.download(wordnet)下载不下来要用的包&#xff0c;导致代码加载资源错误 解决 离线下载NLTK Data github&#xff1a;nltk_data 将解压文件后得到的packages文件夹 目录下面的所有文件&#xff08;防止再少什么文件报错&#xff09; 按照下图报错中的目录&a…

WordNet简介

WordNet 1 WordNet简介 传统词典一般都是按字母顺序组织词条信息的&#xff0c;这样的词典在解决用词和选义问题上是有价值的。然而&#xff0c;它们有一个共同的缺陷&#xff0c;就是忽略了词典中同义信息的组织问题。20世纪以来&#xff0c;语言学家和心理学家们开始从一个崭…

快速了解WordNet

1、什么是WordNet WordNet是由Princeton 大学的心理学家&#xff0c;语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列&#xff0c;而且按照单词的意义组成一个“单词的网络”。 WordNet是一个覆盖范围宽广的英语词汇语义网。名…

Android studio调用webview出现Webpage not available

题记 今天写一个Android程序时&#xff0c;出现了Webpage not available&#xff0c;如下所示&#xff0c;无法显示浏览器&#xff0c;捣鼓了半个早上。 解决办法&#xff1a; 查看AndroidMainifest.xml是否有开权限和信任未加密流量。 添加的位置如下所示&#xff1a; <u…

解决genymotion使用内置浏览器访问网页Webpage not available的问题

1. 学习到Android使用浏览器打开外部网页的时候出现了网页不能够被访问的情况 2. 下面是几种具体的解决方案&#xff1a; ① Virtual Box的设置 首先需要关闭正在运行的genymotion模拟器&#xff0c;打开Virtual Box&#xff0c;右键你需要的设置的模拟器&#xff0c;点击社渚…

使用WebView时错误:WebPage not available

在第一行代码书中仅仅提到在AndroidManifest中添加 <uses-permission android:name"android.permission.INTERNET" />但实际上是不够的&#xff0c;经过参考 https://blog.csdn.net/zgd826237710/article/details/95520785?depth_1-utm_sourcedistribute.pc…

MSQL Webpage

Mars Nov 19, 2014

Webpage not available err_cleartext_not_permitted

在使用webview时&#xff0c;出现上面错误&#xff0c;你需要 1、添加网络权限 <uses-permission android:name"android.permission.INTERNET"/> 2、 在application中添加 android:usesCleartextTraffic"true" 运行成功

安卓上使用 WebView 提示:Webpage not available 的解决办法

文章目录 一、错误界面二、添加网络权限三、信任未加密流量四、参考链接 一、错误界面 二、添加网络权限 这一步是必须的&#xff0c;否则的话&#xff0c; WebView 加载不出来&#xff0c;手机界面会提示 Webpage not available。 在 AndroidManifest.xml 清单文件中添加&am…

webpage vue-cli 脚手架安装搭建

1、下载node解压版&#xff1a; 下载地址&#xff1a;https://nodejs.org/en/download/ 2、安装node 解压并安装到目录E:\Application\develop\node-v10.13.0-win-x64 3、配置环境变量 查看node版本 命令&#xff1a;node -v 4、vue-cli 脚手架 安装 参考&#xff1a;http…

a problem occurred with this webpage so it was reloaded

1 问题描述&#xff1a; Safari浏览器进入网站&#xff0c; 网站会&#xff08;不断&#xff09;重载。提示a problem occurred with this webpage so it was reloaded 2 问题演示视频、截图&#xff08;右图我需要重现并解决的&#xff09;&#xff1a; 视频地址&#xff1a;h…

vue26 —— webpage使用 -- 配置

1. 生成package.json文件 需要使用到package.json 通过npm init 生成 终端进入到对应文件夹&#xff0c;执行npm initpackage name: (02-配置) meetwebpack &#xff08;直接敲回车默认使用括号内的名字&#xff0c;但有中文不支持&#xff09; … 省略部分皆直接回车entry p…

No webpage was found for the web address

No webpage was found for the web address:http://127/0/1/course/4 提示非常明确&#xff0c;这个页面找不到&#xff0c; 页面找不到&#xff0c;首先想到的是不是HTML的代码书写&#xff0c;是否遗漏 接着路径配置的问题&#xff0c;于是返回到配置的urls检查&#xff0c;对…