ELMo模型简介

article/2025/3/5 9:48:06

word2vec是一种静态词嵌入方法,它不会随着上下文场景的变化而变化。但一词多义在现实中太常见了,因此这种静态嵌入的局限性在很多场景显得力不从心。而ELMo就是为解决这些问题提出的,它的提出意味着从词嵌入(Word Embedding)时代进入了语境词嵌入(Contextualized Word-Embedding)时代!

be6fb7920808d75c10f5619ce068e25b.gif

ELMo原理

845aec35a19bb14b8bac6ce3a0f2c5a3.png


ELMo是Embedding from Language Models的简称,它的核心思想体现在深度上下文(Deep Contextualized),除了提供临时词嵌入外,还提供生成这些词嵌入的预训练模型。因此在实际应用中,ELMo可以基于预训练模型,根据实际上下文场景动态调整单词的词嵌入表示。

ELMo首先把输入转换为字符级别的Embedding,根据字符级别的Embedding来生成上下文无关的word Embedding,然后使用双向语言模型(如Bi-LSTM)生成上下文相关的Embedding,其整体模型结构如下:

f81309fe9701131448fdc8d71021da8f.png

1.输入句子

句子维度B*W*C,其中B表示批量大小,W表示一句话中单词的个数,C表示每个单词的最大字符数目,可设置为某个固定值。对于一个批量中长短不一的语句,采取Padding方式对齐。

2.字符编码层

输入语句首先经过一个字符编码层(Char Encoder Layer),ELMo实际是对字符进行编码,它会对每个单词中所有字符进行编码,得到这个单词的表示。输入维度是B*W*C,经过字符编码层后的数据维度为B*W*D。这里展开进一步说明:

b47118eacaa9364ff7819ebf0aeb17b2.png

  • Char Embedding

对每个字符进行编码,包括一些特殊字符,如单词的开始<bow>、单词的结束<eow>、句子的开始符<bos>、句子的结束符<eos>、单词补齐符<pow>和句子补齐符<pos>等,维度会变为B*W*C*d,这里d表示字符的Embedding维度(char_embed_dim)

  • Multi-Scale CNN

Char Embedding通过不同规模的一维卷积、池化等作用后,再经过激活层,最后进入拼接和修改状态层(Concat&Reshape)

  • Concat&Reshape

把卷积后的结果进行拼接,使其形状变为(B,W,d1+...+dm),di表示第i个卷积的通道数

  • Highway Net

Highway Net类似残差连接,这里有2个Highway层

  • Linear Projection

该层为线性映射层:上一层得到的维度d1+...+dm比较长,经过该层后将维度映射到D,作为词嵌入输入后续的层中,这里输出维度为B*W*D

3.双向语言模型

对字符级语句编码后,该句子会经过双向语言模型(Bi-LSTM),得到输出维度(L+1)*B*W*2D,这里+1是加上最初的Embedding层,类似残差连接

4.混合层

得到各层的表征后,会经过一个混合层(Scalar Mixer),它会对前面这些层的表示进行线性融合,得出最终的ELMo向量,维度为B*W*2D

以上就是ELMo模型的总体流程,由于采用LSTM结构,因此其并发能力、关注语句的长度在大的语料库面前有点力不从心。而现在业界更普遍的是基于Transformer的BERT模型,因此,我们不对ELMo进行详细展开。该模型就介绍到此,以后有机会再展开。

参考资料:

《深入浅出Embedding》


http://chatgpt.dhexx.cn/article/yQyLvPOj.shtml

相关文章

【ELM回归预测】基于matlab粒子群算法优化ELM回归预测【含Matlab源码 1722期】

✅博主简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;修心和技术同步精进&#xff0c;Matlab项目合作可私信。 &#x1f34e;个人主页&#xff1a;海神之光 &#x1f3c6;代码获取方式&#xff1a; 海神之光Matlab王者学习之路—代码获取方式 ⛳️座右铭&#xff1a;…

【预测模型】基于 Elm神经网络的电力负荷预测模型matlab源码

1. 算法概述 **\ ELM算法针对的问题是单隐层的前馈神经网络(single-hidden layer feedforward neural networks&#xff0c;SLFNs)&#xff0c;算法特点在于输入层到隐层的权重W和偏差B可以随机设定&#xff0c;隐层激励函数具有无限可微的特征即可(常用的有radial basis、sine…

【预测模型-ElM分类】基于松鼠算法优化ElM神经网络实现数据分类附matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;修心和技术同步精进&#xff0c;matlab项目合作可私信。 &#x1f34e;个人主页&#xff1a;Matlab科研工作室 &#x1f34a;个人信条&#xff1a;格物致知。 更多Matlab仿真内容点击&#x1f447; 智能优化算法 …

模型学习 - ELM

本学弱喜欢在本子上记笔记&#xff0c;但字迹又丑。 望看不懂我的字的大佬不要喷我&#xff0c;看得懂的大佬批评指正。

【预测模型-ELM预测】基于蚁群算法优化极限学习机预测matlab代码

1 简介 针对变压器故障的特征,结合变压器油中气体分析法以及三比值法.提出了基于蚁群算法改进极限学习机的故障诊断方法.由于输入层与隐含层的权值和阈值是随机产生.传统的极限学习机可能会使隐含层节点过多,训练过程中容易产生过拟合现象.该方法运用蚁群算法对极限学习机的输…

【预测模型-ELM分类】基于鲸鱼算法优化核极限学习机实现数据分类附matlab代码

1 内容介绍 极限学习机&#xff08;&#xff45;&#xff58;&#xff54;&#xff52;&#xff45;&#xff4d;&#xff45; &#xff4c;&#xff45;&#xff41;&#xff52;&#xff4e;&#xff49;&#xff4e;&#xff47; &#xff4d;&#xff41;&#xff43;&…

【ELM预测】基于极限学习机ELM实现数据预测matlab源码

一、极限学习机的概念 极限学习机(Extreme Learning Machine) ELM&#xff0c;是由黄广斌提出来的求解单隐层神经网络的算法。 ELM最大的特点是对于传统的神经网络&#xff0c;尤其是单隐层前馈神经网络(SLFNs)&#xff0c;在保证学习精度的前提下比传统的学习算法速度更快。 二…

【ELM数据预测】粒子群算法优化ELM数据预测(含前后对比)【含Matlab源码 449期】

⛄一、粒子群算法优化极限学习机ELM简介 PSO-ELM优化算法预测模型 ELM模型在训练之前可以随机产生ω和b, 只需要确定隐含层神经元个数及隐含层神经元激活函数, 即可实现ELM预测模型的构建。在ELM模型的构建中, 只需确定初始ω和b, 而无需复杂的参数设置, 具有学习速度快、泛化…

免费不限速不限存储的网盘推荐

网盘这种东西倒闭的太多了&#xff0c;这年头存点东西真不容易&#xff0c;以前也陆陆续续用过很多网盘&#xff0c;但一直没统计&#xff0c;最近终于发现了一款好用的免费网盘推荐给大家。 替代对象&#xff1a;某度网盘 空间&#xff1a;超级会员免任务扩容至5T空间&…

“白嫖”时代进入最后倒计时,网盘行业到底是怎么由盛及衰的?

继金山网盘、UC网盘、新浪网盘、360网盘等等关停之后&#xff0c;网易网盘也要和大家说再见了。这是目前市场上最后一家完全免费的网盘&#xff0c;网易网盘的淡出也意味着网盘的免费时代终于还是画上了句号。 近日&#xff0c;网易宣布由于产品调整&#xff0c;网易网盘将于20…

在线付费听音乐平台网站源码

介绍&#xff1a; 越来越多音乐需要付费 今天免费给大家一款在线音乐源码 所有音乐免费听 付费音乐也可以 网盘下载地址&#xff1a; http://kekewl.org/PaFDdLJmVpB 图片&#xff1a;

「保护数据 人人有责」搭建免费可用的私有云 Next Cloud

前言 对于咱们个人来讲&#xff0c;早年都是白嫖各大厂商的公有云&#xff0c;各大厂商疯狂送空间&#xff0c;送起来像慈善家一样&#xff0c;一个T一个T的&#xff0c;但是随着时间的推移&#xff0c;以360网盘为代表的一批网盘倒下去了&#xff0c;上传的数据也只能再下载回…

微擎后端/知识付费阅读店铺小程序 V5.1.0 全套源码

简介&#xff1a; 更新动态&#xff1a; 版本号&#xff1a;5.1.0 – 普通版 [优化]优化后台基本设置操作体验 [优化]优化会员折扣功能的折后金额计算方式 [优化]优化视频文章预加载方式 [优化]优化全局图片懒加载流程 知识店铺内容付费阅读小程序&#xff0c;帮您轻松实现内容…

2023 诚通网盘在线解析无广告高速下载网站源码

对于用户来说&#xff0c;上传下载应该是网盘最大的痛点。而上传资源网盘肯定不会做限制&#xff0c;因为上传的资源越多&#xff0c;网盘占的市场份额会越大&#xff0c;所以只能从下载方面入手。 1.所以现在除了阿里外&#xff0c;其他的网盘不付费那就是给你几十K的速度&am…

又一知名云盘翻车:“免费不限量”变收费,用户被骗 5 年!

微信搜索逆锋起笔关注后回复编程pdf领取编程大佬们所推荐的 23 种编程资料&#xff01; 来源&#xff1a;扩展迷Extfans 互联网公司的套路有多深&#xff1f;坦白说&#xff0c;它们本质上没有任何区别。 最常见的操作大概就是&#xff1a;前期以各种免费福利圈养用户&#xff…

网盘的成本有多高?一个网盘成本是多少?

众所周知&#xff0c;中国的互联网产品都是建立在免费基础上的&#xff0c;当然这不是对企业&#xff0c;而是面向个人用户。 网盘作为现今存文件分享内容的一款新时代的云上U盘&#xff0c;几乎每个年轻人都有&#xff0c;目前比较有名的就是百度网盘&#xff0c;其他的几乎可…

百度网盘海外版免费不限速:真就是老用户与狗不得享受优惠?

去年9月30号&#xff0c;百度网盘宣布&#xff1a;以前享受2T免费空间的用户&#xff0c;有一部分将调整为100G。 当然了&#xff0c;付费用户肯定是不受影响的。 而免费的用户&#xff0c;除了空间被砍之外&#xff0c;那下载速度也…怎么说呢&#xff0c;硬是让我回忆起当年拨…

专业网盘设计分析

预计未来相当一段时间的主要精力会集中在优化一个行业专业网盘&#xff0c;其中主要的挑战是 大数据&#xff0c;某个行业第一公司一次迁移12TB 的业务资料&#xff0c;一个是并发&#xff0c;虽然是TB 业务&#xff0c;但是网盘的数据权限是企业主账户&#xff0c;一个主账户下…

新版知识付费系统付费阅读小程序源码知识付费平台

介绍&#xff1a; 2021知识付费系统付费阅读小程序源码知识付费平台源码。 知识付费的小程序源码的作用我就不多说了&#xff0c;现在都是知识付费的年代&#xff0c;也是付费学习的时代。 知识付费阅读小程序&#xff0c;带有代理&#xff0c;分销&#xff0c;课程资源更新等…

五大主流云盘横评对比,百度、腾讯、115、iCloud、OneDrive哪家更值得付费?

五大主流云盘横评对比&#xff0c;百度、腾讯、115、iCloud、OneDrive哪家更值得付费&#xff1f; 前言各大云盘免费服务对比各大云盘付费服务对比照片视频备份文件历史版本各家云盘会员购买建议百度网盘腾讯微云115网盘iCloudOneDrive 云盘安全吗&#xff1f;结尾 前言 互联网…