DyHNE-Dynamic Heterogeneous Information Network Embedding with Meta-path based Proximity

article/2025/8/28 16:47:38

在这里插入图片描述

文章目录

  • 摘要
  • 1 引言
  • 2 相关工作
    • 2.1 网络嵌入
    • 2.2 HIN嵌入
    • 2.3 动态网络嵌入
  • 4 DyHNE模型
    • 4.1 基本思想
    • 4.2 静态HIN嵌入
  • 5 结论

来源:IEEE Trans2020
作者:北邮陆元福等人

摘要

异构信息网络(HIN)嵌入的目的是学习节点的低维表示,同时保持HIN中的结构和语义。现有的方法主要集中在静态网络上,而一个真正的HIN通常会随着时间的推移而增加(删除)多种类型的节点和边。由于一个微小的变化都会影响到整个结构和语义,传统的HIN嵌入方法需要重新训练才能得到更新的嵌入,这既耗时又不现实。本文研究了动态HIN嵌入问题,提出了一种基于元路径邻近性的动态HIN嵌入模型(DyHNE)。具体来说,我们引入了基于元路径的一阶和二阶近似来保持HINs的结构和语义。随着HIN随时间的发展,我们自然地捕捉随着元路径增广邻接矩阵的扰动而发生的变化。然后,我们通过求解广义特征值问题来有效地学习节点嵌入,并利用特征值扰动在无需重新训练的情况下高效地推导出更新的嵌入。实验表明,DyHNE在有效性和效率方面超越了最先进的技术。
关键词:动态异构信息网络,网络嵌入,社会网络分析

1 引言

(HIN)揭示了网络(图)数据的分析,网络(图)数据由各种类型的边[1]连接的多种类型的节点组成。例如,DBLP网络有四种类型的节点:Author (A), Paper §, Conference ©和Term (T);以及多种类型的关系:作者与论文的写作关系、论文与会议的出版/出版关系等。此外,在HINs[2]中,描述节点之间复合关系的元路径被广泛用于利用丰富的语义。在DBLP中,meta-path APA表示合著关系,APCPA表示两位作者在同一个会议上发表论文。因此,HIN包含着复杂的结构和语义,研究HIN对于实际应用具有重要意义。
近年来,HIN嵌入作为一种很有前景的HIN分析方法引起了人们的广泛关注。它的目的是在保持HIN结构和语义信息的同时学习节点的低维表示,从而使各种下游应用,如节点分类[5]和链路预测[6],[7],都能受益于HIN的嵌入。提出了几种HIN嵌入方法。例如,基于随机漫步的方法[8]、[9],基于分解的方法[10]、[11]、[12],基于深度神经网络的方法[7]、[13]、[14]以及一些特定任务的方法[15]、[16]。然而,所有这些方法都是为静态HINs设计的,也就是说,结构和语义不会随着时间而改变。在现实中,HIN通常随着各种类型的节点和边的演化,例如新添加(删除)的节点或边,表现出高度的动态性。此外,动态HIN中节点和边的变化可能因类型而异。仍然以DBLP为例,一个导师与不同的学生就不同的论文进行合作,从而导致合著者关系和论文的不断发展。此外,大量的新论文被添加到网络中,而每年的会议数量几乎没有变化。
实际上,现有的HIN嵌入方法很难有效地处理动态HIN中如此复杂的演化。即使HIN发生微小的变化,这些方法也必须在每一个时间步骤中重复训练,非常耗时,不能满足实时处理的需求。虽然提出了一些处理动态网络[17],[18],[19]的方法,但它们没有考虑网络的异质性,在很大程度上忽略了HINs中的各种语义关系。直接使用这些方法进行动态HINs将不可避免地失去一些结构和语义,降低下游任务的性能。因此,在真实的HIN分析场景中,需要一种有效、高效的动态HIN嵌入方法。
基本上,动态HIN嵌入需要仔细考虑两个基本问题一个是如何有效地保留动态HIN中的结构和语义。由于网络结构和语义关系是HINs中最重要和最直接的两个信息,它们在本质上保证了学习嵌入的有效性。随着HIN的演进,新增加一个节点,以该节点为中心的局部结构会发生变化,这种变化会通过不同的元路径逐渐传播到所有节点,从而导致全局结构的变化。此外,新节点不仅会与邻域建立直接联系,还会通过各种元路径与其他节点建立复杂关系,这必然会影响HINs中的语义关系。因此,结构和语义都会随动态HIN的演变而改变。对于有效的动态HIN嵌入方法来说,对学习嵌入中的变化进行建模和编码(高阶)结构和语义是非常关键的,同时也是一个挑战

另一个问题是,当HIN随着时间的推移而发展时,如何在不对整个HIN进行再训练的情况下有效地更新节点嵌入。对于每个时间步骤,重新训练HIN嵌入方法是得到最优嵌入的最直接的方法。但显然,这种策略非常耗时,特别是在网络结构变化很小的情况下。在大数据时代,再训练方式变得不现实。这些问题促使我们寻求一种有效的方法来保持动态HIN嵌入的结构和语义。


在本文中,我们提出了基于元路径邻近性的动态异构信息网络嵌入模型(DyHNE),以有效地学习节点嵌入。受摄动理论[20]的启发,我们通过求解广义特征值问题来学习节点嵌入,并利用特征值摄动对HIN的演化进行建模。沿着这条路线,我们首先采用元路径增广邻接矩阵对HIN的类型进行建模,并建立一个基本的静态HIN嵌入模型(即StHNE),以保留基于元路径的一阶和二阶邻近性。这样我们可以更好地捕捉动态HINs中的结构和语义。为了捕捉HIN的演化,我们利用多个元路径增广邻接矩阵的扰动,以自然的方式模拟HIN的结构和语义的变化。最后,我们利用特征值摄动理论来考虑这些变化,并有效地推导出节点嵌入。这样,就不需要再训练HNE来获得最佳嵌入。
我们工作的贡献总结如下:

  • 本文首次研究了动态HIN的增量学习节点嵌入问题,使HIN嵌入在现实场景中更加实用。
  • 我们提出了一种静态HIN嵌入模型(StHNE),以保持HIN的结构和语义。在此基础上,提出了一种基于元路径相似性的动态HIN嵌入模型(DyHNE),可以有效地推导出更新后的嵌入结果,该模型可应用于节点数相对于时间复杂度为线性的大规模HIN嵌入。
  • 我们进行了全面的评价,以表明我们的模式在效力和效率方面大大超过了几个先进水平。

2 相关工作

在本节中,我们首先介绍了一般网络嵌入的相关方法,然后讨论了HIN嵌入的最新研究成果。最后,简要介绍了动态网络嵌入方面的最新研究成果。

2.1 网络嵌入

网络嵌入的目的是在保持网络[3],[4],[21]原始结构信息和性质的同时,将网络投射到一个低维潜空间中。在文献中,网络嵌入可以追溯到降维技术,该技术通常通过对网络[22],[23]进行分解来学习节点或边的潜在低维向量。Ahmed等人[24]提出将图表示为一个矩阵,其中矩阵元素对应于节点之间的边,然后进行矩阵分解学习图的低维表示。Isomap[22]的目标是通过近似保留数据对之间的测地线距离来寻找数据集的低维表示。这些基于分解的图嵌入方法在某些情况下取得了良好的性能。但是,由于大规模矩阵分解的计算量大,使得该算法对于大规模网络中的数据挖掘任务既不实用也不有效。

除了word2vec25外,对这个新兴的网络分析范式[17]、[18]、[26]、[27]、[28]、[29]、[30]、[31]、[32]、[33]、[34]、[35]、[36]、[37]、[38]也做了许多改进。例如[26],[30]结合random walk和skip-gram[39]学习节点表示。这些方法通过在网络上随机行走构造节点序列,然后利用基于跳图的模型学习节点嵌入。为了保持节点之间的一阶和二阶邻近性,Tang等人提出了一种大规模信息网络嵌入模型。GraRep[28]和HOPE[40]都被设计用来模拟网络中节点之间的高阶邻近性。[32],[36]进行矩阵分解,找到一个低秩空间来表示一个网络。提出了一些基于深度神经网络的网络嵌入模型,如基于自动编码器的[31]、[37]等。除了网络拓扑外,也有一些研究侧重于利用边信息,如[29]、[35]网络中的节点内容。近年来,图神经网络(GNN)得到了广泛的关注,一些基于GNN的模型被提出来解决各种数据挖掘任务(如分类)[41]、[42]、[43]、[44]。虽然这些方法取得了很好的性能,但它们都只能处理同构网络,不能直接应用于包含多类型节点和边的HINs嵌入。

2.2 HIN嵌入

由于网络的异构性,HIN嵌入侧重于保存网络[1],[3]中的结构和语义信息,为异构数据分析提供了新的视角,使网络嵌入在现实世界中更加实用。与前面提到的同构网络嵌入类似,HIN嵌入方法大致可以分为四种类型。第一个是基于元路径的随机遍历[8],[9],[45]。Dong等人提出基于元路径在HIN上随机行走,然后将不同类型的节点嵌入到相应的潜在空间中。HIN2Vec[8]通过联合进行多个预测训练任务,进行随机游动并学习节点的潜向量。其次,一些方法将HIN分解成简单的网络,然后分别建模[10],[11],[16];例如,EOE[11]将复杂的学术异构网络分解为词共现网络和作者协作网络,并同时对子网络中的节点对进行表示学习。第三,还设计了一些基于神经网络的方法来嵌入HINs[7],[13],[14],[46]。Wang等人使用自动编码器对异构信息进行建模,然后通过聚合多个特征表示获得最终的节点嵌入。最后,提出了一些HIN嵌入方法,用于探索HIN的独特性质(如异构结构)[47]、[48]或执行特定任务(如推荐和链接预测)[15]、[49]。在PME[15]中,Chen等人提出将不同类型的节点映射到相同的关系空间中,进行异构链路预测。以上所有方法都只关注嵌入静态HIN网络,而忽略了网络本身是随时间动态变化的

2.3 动态网络嵌入

近年来,一些研究人员开始关注动态网络嵌入,并做了一些尝试[17],[33],[38],[50],[51],[52]。提出了在动态属性网络中学习节点嵌入的DANE[33]算法,该算法采用离线方法学习节点嵌入,并随着网络和属性的变化更新嵌入。DANE基于广义特征值问题,利用邻接矩阵捕捉结构的变化,利用属性矩阵建模属性的变化,仅考虑一阶邻近性。为了在动态网络中保持节点间的高阶邻近性,Zhu等人[17]设计了一种基于GSVD的方法DHPE,随着网络的演化来学习和更新节点嵌入。DHPE将GSVD问题转化为广义特征值问题,将动态网络的变化与基于Katz指数的矩阵相结合,以保持同质网络的高阶邻近性。在DynamicTriad[38]中,Zhou等人将网络的演化建模为一个三元闭合过程,并在不同的时间步长学习每个网络快照的节点嵌入。DynamicTriad利用三元组(即一组三个顶点)来模拟网络结构的动态变化,并模拟一个封闭三元组如何从一个开放三元组发展而来。Song等人对基于跳跃图的模型进行了扩展,提出了一个动态网络嵌入框架。最近,DHNE[53]被提出用于学习动态异构网络中的节点嵌入。DHNE基于快照子图构建全面的历史当前网络,在子图上执行随机游动,并使用动态异构跳跃图模型学习嵌入。DHNE专注于用动态异构skip-gram模式保持节点的动态特征,这种模式不能在不重新训练模型的情况下增量更新节点嵌入。

综上所述,上述方法要么是针对结构相对简单的同构网络设计的,要么是无法处理动态HIN,随着结构的变化,需要对整个HIN进行重新训练以获得新的嵌入。

4 DyHNE模型

在本节中,我们首先提出静态HIN嵌入模型(StHNE)作为保持一阶和二阶近似元路径的基本模型,该模型通过求解广义特征值问题来学习节点嵌入。然后引入特征值摄动理论推导更新的节点嵌入,使基于元路径邻近性的动态模型(DyHNE)能够有效地学习节点嵌入,同时有效地捕获节点的结构和语义。我们在图2中展示了StHNE和DyHNE的总体示意图。

4.1 基本思想

DyHNE的核心思想是构建一个有效、高效的体系结构,能够捕获动态HIN中结构和语义的变化,并高效地推导出节点嵌入。为了实现这一点,我们首先引入了基于元路径的一阶和二阶近似来保持HINs的结构和语义。
在这里插入图片描述
简而言之,所提出的StHNE能够在基于元路径的一阶和二阶近似的HIN中捕获结构和语义,而DyHNE能够在元路径增广邻接矩阵的扰动下实现网络嵌入的高效更新。

4.2 静态HIN嵌入

当HIN随着时间的推移而发展时,为了实现有效的更新节点嵌入,一个合适的静态HIN嵌入来捕获结构和语义信息是必须的。因此,我们提出了一个静态HIN嵌入模型(StHNE),该模型保留了基于元路径的一阶和二阶近似。

5 结论

本文研究了动态HIN的嵌入问题,提出了一种新的动态HIN表示学习模型(DyHNE)。DyHNE基于设计的静态HIN嵌入模型(StHNE),通过保留基于一阶和二阶近似的元路径来捕获结构和语义。随着动态HIN的发展,DyHNE结合元路径增广邻接矩阵的结构和语义变化,基于摄动理论高效地学习节点的嵌入。实验评估表明,DyHNE不仅显著优于先进技术,而且效率更高。


http://chatgpt.dhexx.cn/article/4g2Wx2yx.shtml

相关文章

AdaptiveAvgPool2D 不支持 onnx 导出,自定义一个类代替 AdaptiveAvgPool2D

AdaptiveAvgPool2D 不支持 onnx 导出,导出过程会告诉你,onnx不支持那个动态操作巴拉巴拉 我用的是 pp_liteseg 导出为 onnx 模型,都一样,paddle和Torch的 Adaptive Pool2D 都是动态的,onnx暂时都不支持,我…

ICLR 2023 | 3D UX-Net:超强的医学图像分割新网络

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>CV微信技术交流群 转载自:CVHub Title: 3D UX-Net: a Large Kernel Volumetric ConvNet Modernizing Hierarchical Transformer for Medical Image Segmentation …

异构信息网络 Heterogeneous information network (HIN)

异构信息网络包含多类节点和多类连接关系,由于此类网络能够灵活的对异构数据及逆行建模,越来越多的被应用于推荐系统,处理复杂的多元异构的数据。 这里给出异构信息网络 Heterogeneous information network (HIN),网络模式 Networ…

[论文阅读] (ASONAM2019) Meta-GNN: 属性异构网络中用于半监督学习的元图神经网络

论文标题:Meta-GNN:Metagraph Neural Network for Semi-supervised learning in Attributed Heterogeneous Information Networks 作者:Aravind Sankar, Xinyang Zhang, Kevin Chen-Chuan Chang 单位:Department of Computer Sc…

【推荐系统】HIN异构信息网络(Hetegeneous Information Network)

异构信息网络 (Hetegeneous Information Network 以下简称 HIN),是由 UIUC 的 Han Jiawei 和 UCLA 的 Sun Yizhou 在 2011 年的 VLDB 论文中首次提出 [1]。 简单地理解,HIN 就是一个有向图,图中的节点和边都可以有不同的类型&…

HIN 异构信息网络(Heterogeneous Information Network)

信息网络(Information Network) 信息网络可以用一个有向图G (V, E) 来表示,其中V代表 Object,E代表 Edge。并且用映射函数 ϕ : V → A 来表示每一个object v ∈ V 属于object类型集合A: ϕ(v) ∈ A,用映射函数ψ : E → R.表示每条边 e ∈ E 属于边的…

HIN应用调研总结

文章目录 1. 代码安全iDev: enhancing social coding security by cross-platform user identification between GitHub and stack overflow【A】 2. API推荐Group preference based API recommendation via heterogeneous information network【A】 3.Andorid恶意软件检测Out-…

附件上传技术分享

开发工具与关键技术:VS,MVC 作者:陈梅 撰写时间:2019年7月12日 图片代码来源于老师教程 附件上传技术,是开发MVC项目中比较常见的一种技术,准确的来说,这是一种必须要用到的技术。现在我们来看一…

上传附件——单页面

上传附件——单页面 效果 代码 index.vue <el-form-itemv-iffileListIsShowlabel上传附件><el-upload:file-listfileList:http-requestuploadFile:limit1:on-exceedexceed:on-removehandleRemoveaccept.pdf, .jpg,.bmp,.png, .doc, .xls, .pptx,.xlsxaction#classu…

Servlet 实现上传附件(支持多附件)

原创作品&#xff0c;允许转载&#xff0c;转载时请务必以超链接形式标明文章 原始出处 、作者信息和本人声明。否则将追究法律责任。 作者&#xff1a; 永恒の_☆ 地址&#xff1a; http://blog.csdn.net/chenghui0317/article/details/9502143 一、简单介绍 使用 Servlet…

odoo 上传附件的几种方式

目录 1、上传图片 2、上传不同附件 3、page页面添加附件看板 4、如何在一个视图里面多个page页面添加文件&#xff1f; 1、上传图片 odoo中有一个product.image模型&#xff0c;继承该模型可以实现多张图片的上传和预览。实现效果如下图所示&#xff1a; python代码&#x…

原生js--封装点击上传附件

在日常开发中&#xff0c;经常会有点击按钮上传附件的功能需求。 在我们平时的开发中&#xff0c;已经习惯把当前项目所用到的UI框架中的上传组件拿来直接使用 例如&#xff1a;antd的上传组件 以及element的上传组件&#xff0c;其实在用法上都大同小异。 这种都是直接引用组…

uniapp 上传附件

附件上传 一、uni附件上传 一、uni附件上传 1、模板部分 <!-- 附件 --><view class""><view class"content-title"><span></span>附件:</view><view class"content-main" style"border: 0;"…

vue上传附件

流程&#xff1a;点击上传到–》文件服务器upload—》调用saveFile–》调用FileLists 文件操作列表&#xff1a; <FormItem label"附件信息"><Upload :action"uploadUrl()" name"multipartFile" multiple :on-remove"handleRemov…

WangEditor添加上传附件功能 vue3

看官方文档要求 WangEditor/editor 版本 >5.1.16 下载上传附件的插件 yarn add wangeditor/plugin-upload-attachment 首先要注册到编辑器&#xff0c;如果把下面的代码写在WangEditor的组件里出现第一次使用编辑没问题&#xff0c;但是第二次编辑会报错的问题&#xff0…

csdn如何上传附件

首先登陆你的csdn博客&#xff0c;看到首页有个下载 点击下载 进去之后点击上传资源 然后就可以上传附件了 不过他会审核两天&#xff0c;不要着急&#xff0c;过两天就发布出来了

java fileupload上传附件到服务器,可携带参数(简单易用)可跨域,看这篇就够了

一个很简单实用的上传附件实例 首先主要用到的包&#xff1a; 先看服务端代码&#xff0c;我这里是用了Servlet&#xff0c;在web.xml配置 <servlet><servlet-class>com.file.FileEntryServlet</servlet-class><servlet-name>FileServlet</servlet…

公众号的附件怎么上传(如Word、Excel、Pdf等)

公众号我们都接触过&#xff0c;有企业的、有单位的、有个人的&#xff0c;公众号主要用来发布文章和消息&#xff0c;可以提供企业单位的对外沟通&#xff0c;提升企业单位的形象。 随着公众号的日益强大&#xff0c;我们也可以利用公众号对外发布招聘、重大消息公示、资料收…

网络安全实验之《VPN》实验报告

一、实验目的 (1)课上实验&#xff1a; 1.在Windows中配置&#xff08;内置或者专有&#xff09;IPSec。 2.通过抓包工具抓取建立IPSec的协商密钥过程&#xff0c;和建立之后的加密通信数据包&#xff0c;并进行分析。 (2)课后实验&#xff1a; 1.配置Cisco Packet Tracer…

课程实验三-bomb实验

实验题目&#xff1a; 程序运行在linux环境中。程序运行中有6个关卡&#xff08;6个phase&#xff09;&#xff0c;每个phase需要用户在终端上输入特定的字符或者数字才能通关&#xff0c;否则会引爆炸弹&#xff01;需要使用gdb工具反汇编出汇编代码&#xff0c;结合c语言文件…