Deep Multimodal Representation Learning(深度多模态表示学习)

article/2025/9/20 15:57:49

多模态表示学习旨在缩小不同模态之间的异质性差距,在利用普遍存在的多模态数据中发挥着不可或缺的作用。基于深度学习的多模态表示学习由于具有强大的多层次抽象表示能力,近年来引起了人们的广泛关注。

多模态融合的核心问题是异质性间隙,而为了便于讨论如何缩小异质性差距,根据不同模态集成的底层结构,我们将深度多模态表示学习方法分为三个框架:联合表示、协调表示和编解码器(如上图Fig1).

那么又为什么称为表征学习呢?为传达世界上关于物体的全面信息,描述同一物体不同方面的各种认知信号被记录在文本、图像、视频、声音和图形等不同类型的媒体中。在表示学习领域,单词“模态”指的是一种特定的编码信息的方式或机制。因此,上面列出的不同类型的媒体也指模式,涉及几种模式的表征学习任务将被描述为多模态。由于多模式数据从不同的角度描述一个对象,通常在内容上互补或补充,它们比单峰数据更提供信息。

那么如果进行多模态融合呢?

如上图所示,由于来自不同模态的特征向量最初位于不等子空间中,与相似语义相关的向量表示将是完全不同的。在这里,这种现象被称为异质性间隙,这将阻碍多模态数据被后续的机器学习模块全面利用。解决这一问题的一种流行方法是将异构特征投影到一个公共的子空间中,其中具有相似语义的多模态数据将由相似的向量表示。因此,多模态表示学习的主要目标是缩小联合语义子空间中的分布差距,同时保持模态特定语义的完整。

深度多模态表示学习框架

接下来将介绍三个模块:联合表示、协调表示、编码-解码器.

联合表示(Joint representation):其目的是将单峰表示投射到一个共享的语义子空间中,从而融合多模态特征;

协调表示(coordinated representation):包括跨模态相似度模型和规范相关分析,这是寻求学习在协调子空间中每个模态的分离但有约束的表示;

编码器-解码器(encoder-decoder models):它努力学习用于映射一种模态到另一种模态的中间表示。

上图,(a)联合表示旨在学习一个共享的语义子空间;(b)协调表示框架在某些约束下学习每个模态的分离但协调表示;(c)编码器-解码器框架将一种模式转换为另一种模式,并保持其语义一致。

1)JOINT REPRESENTATION:
为了弥合不同模态的异质性差距,联合表示的目的是将单峰表示投射到一个共享的语义子空间中,其中多模态特征可以融合。如上图(a)所示,每个模态通过单个神经网络进行编码后,将它们都被映射到一个共享的子空间,在那里提取模态共享的概念并融合到一个向量中
融合多模态特征的最简单的方法是直接将它们进行连接。然而,这个子空间主要是由一个独特的隐藏层实现的调查,在其中,被转换的模态特定向量将被添加,从而来自不同模态的语义将被组合。
这个特性可以从下式看出,其中z是共享层中输出节点的激活,v是特定模态编码网络的输出,w是特定模态编码层与共享层之间的权值,下标索引表示不同的模态。

融合张量的定义可以表述如下:

 

 zm表示融合张量,zl、zv、za表示不同模态张量,表示外积操作。

但是为了更有表现力,学习到的向量被期望融合互补的语义,形成不同的模式。这个互补的属性不能自动保证,因为联合表示倾向于保留跨模态的共享语义,而忽略了特定于模态的信息。此时,就有2种解决方案:添加额外正则项,;添加追踪正则。

2)COORDINATED REPRESENTATION

协调表示框架不是在联合子空间中学习表示,而是在某些约束下为每个模态学习分离但协调的表示。由于在不同模式中包含的信息是不平等的,学习分离表征有利于坚持唯一和有用的模式特异性特征。

通常约束类型的条件、协调表示方法可以分为两组:基于跨模态相似度基于跨模态相关性

基于跨模态相似度:学习一个公共的子空间,其中向量从不同的模式可以直接测量;

基于跨模态相关:学习一个共享的子空间,使来自不同模式的表示集的相关性使最大化。

跨模态相似度方法在相似度度量的约束下学习协调表示。该模型的学习目标是保持模态间和模态内相似结构,期望与相同语义或对象相关的跨模态相似距离尽可能最小,同时期望具有不同语义的距离尽可能最大。

3)ENCODER-DECODER

编码器-解码器框架主要由两个组件组成,一个编码器和解码器。编码器将源模态映射为潜在向量v,然后解码器基于向量v生成一个新的目标模态样本。(虽然大多数编码器-解码器模型只包含一个编码器和一个解码器,但一些变体也可以由几个编码器或解码器组成。)

广义编解码器模型的学习目标,可以表示为:

 通过给定相应的视觉内容V和模型参数θ,使特征S的对数似然值最大化。

而像协调表示一样,为了更有效地捕获共享语义,一种流行的解决方案是通过一些正则化术语来保持模态之间的语义一致性。它取决于编码器和解码器之间的协调。


http://chatgpt.dhexx.cn/article/1JBLNocy.shtml

相关文章

干货!Labeling Trick: 一个图神经网络多节点表示学习理论

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! GNN 旨在学习单节点表示。当我们想要学习一个涉及多个节点的节点集表示(如链路表示)时,以往工作中的一个常见做法是将 GNN 学习到的多个单节点表示直接聚合成节点集的联合表示…

知识图谱表示学习

知识图谱是一种精细化的异构网络, 所以对其节点与边的表示学习也是一个热门的问题. 这里的学习依旧是得到它们的低维稠密向量. 这样做的好处: 降低知识图谱的高维性和异构性;增强知识图谱应用的灵活性;减轻特征工程的工作量;减少由于引入知识…

深度聚类:将深度表示学习和聚类联合优化

参考文献: 简介 经典聚类即数据通过各种表示学习技术以矢量化形式表示为特征。随着数据变得越来越复杂和复杂,浅层(传统)聚类方法已经无法处理高维数据类型。结合深度学习优势的一种直接方法是首先学习深度表示,然后再…

什么是表示学习(representation learning)表征学习 表达学习

机器学习算法的成功与否不仅仅取决于算法本身,也取决于数据的表示。数据的不同表示可能会导致有效信息的隐藏或是曝露,这也决定了算法是不是能直截了当地解决问题。表征学习的目的是对复杂的原始数据化繁为简,把原始数据的无效信息剔除&#…

知识表示学习模型

最近清华的THUNLP整理了Pre-trained Languge Model (PLM)相关的工作:PLMpapers,非常全面,想要了解最新NLP发展的同学不要错过。本来这篇是打算写一写Knowledge Graph BERT系列工作的,但是最近有在做知识图谱的一些东西所以就先整…

网络表示学习(network represention learning)

https://www.toutiao.com/a6679280803920216589/ 2019-04-13 15:40:48 1.传统:基于图的表示(又称为基于符号的表示) 如左图G (V,E),用不同的符号命名不同的节点,用二维数组&#x…

图表示学习

文章目录 1.导言1.1 为什么要研究图(graph)1.2 针对图结构的机器学习任务1.3 特征表示的难点1.4 特征表示的解决思路1.5 线性化思路1.6 图神经网络1.7 讨论:何谓Embedding1.8 总结 2.图结构表示学习2.1 deepwalk(深度游走算法)2.2 node2vec 3…

表示学习(特征学习)

文章目录 表示学习特征工程与表示学习深度学习的表示学习注:深度学习不等于多层神经网络什么时候用「手工提取」什么时候用「表示学习」? 关于特征表示学习的算法 参考资料 表示学习 表示学习的基本思路,是找到对于原始数据更好的表达&#…

表示学习与深度学习

1、表示学习 首先给出表示学习的定义: 为了提高机器学习系统的准确率,我们就需要将输入信息转换为有效的特征,或者更一般性称为表示(Representation)。如果有一种算法可以自动地学习出有效的特征,并提高最…

表示学习(Representation Learning)

一、前言 2013年,Bengio等人发表了关于表示学习的综述。最近拜读了一下,要读懂这篇论文还有很多文献需要阅读。组会上正好报了这篇,所以在此做一个总结。 鉴于大家都想要我的汇报PPT,那我就分享给大家,希望能对大家有所…

使用 Altium Designer 绘制PCB完整设计流程记录(2021.05.04更新)

前言 做了大半年的毕业设计,陆陆续续也是画了几个板子,有些东西感觉要趁现在记录下来,方便以后某天还想再画板子时查看。 修改日志 时间修改内容2021.05.04初稿完成 文章目录 前言修改日志一、关于AD版本二、原理图库和封装库三、绘制原理…

PCB设计流程步骤中的注意事项

PCB中文名称为印制电路板,又称印刷线路板,几乎所有电子设备中都会应用到PCB。这种由贵金属制成的绿色电路板连接了设备的所有电气组件,并使其能够正常运行。PCB原理图是一个计划,是一个蓝图。它说明的并不是组件将专门放置在何处&…

使用Cadence绘制PCB流程(个人小结)

之前使用过cadence画过几块板子,一直没有做过整理。每次画图遇到问题时,都查阅操作方法。现在整理一下cadence使用经历,将遇到问题写出来,避免重复犯错。 注:写该篇文章时,感谢于争博士的教学视频和《Cade…

AD原理图 PCB设计步骤

版权声明:本文为CSDN博主「唐传林」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/Tang_Chuanlin/article/details/79803575 本文总结一下AD画PCB的步骤,…

AD中画PCB详细流程

1.新建工程 先在电脑新建一个文件夹作为工程总文件夹,里面再新建三个子文件夹分别为BOM(Bill Of Materials)(物料清单)、PCB、SCH(Schematic)(原理图)如下图1.1.1 (注意:记住该路径,该工程所有…

干货|PCB电路板的组成、设计、工艺、流程及元器摆放和布线原则

大家对PCB电路板电路这个词很熟,有的了解PCB电路板的组成,有的了解PCB电路板的设计步骤,有的了解PCB电路板的制作工艺......但是对整个PCB电路板的组成、设计、工艺、流程及元器件摆放和布线原则,及后期的注意事项没有一个综合的了…

pcb板制作流程图解

转载链接:http://www.360doc.com/content/16/0529/15/33072037_563261798.shtml 我们来看一下印刷电路板是如何制作的,以四层为例。 四层PCB板制作过程: 1.化学清洗—【Chemical Clean】 为得到良好质量的蚀刻图形,就要确保抗蚀层…

PCB简单绘制一般步骤

1、使用CAD或CAXA,布局线路板图纸 2、生成DWG/DXF格式文件,比如A.dwg 3、使用Altium Designer,文件——新建——PCB,新建一块板子 4、导入A.dwg,文件——导入——DXF/DWG——选择A.dwg导入 ——作为元素导入——比例为mm——绘…

PCB 基础~典型的PCB设计流程,典型的PCB制造流程

典型的PCB设计流程 典型的PCB制造流程 • 从客户手中拿到Gerber, Drill以及其它PCB相关文件 • 准备PCB基片和薄片 – 铜箔的底片会被粘合在基材上 • 内层图像蚀刻 – 抗腐蚀的化学药水会涂在需要保留的铜箔上(例如走线和过孔) – 其他药水…

用AD画PCB流程介绍

大家好,这里主要介绍pcb(印刷电路板)绘制的一个流程,不管你是刚毕业还是想转行或者是在校大学生,不妨了解一下pcb工程师的基本工作内容。希望你看完之后有所收获。废话不多说,开整! 1、首先我们从硬件工程师那里拿到一份没有错误…