用于推荐的异构信息网络嵌入方法Heterogeneous Information Network Embedding for Recommendation

article/2025/8/28 14:36:56

这是发表在IEEE2019年的论文。

作者:Chuan Shi, Member, IEEE, Binbin Hu, Wayne Xin Zhao Member, IEEE and Philip S. Yu, Fellow, IEEE

Abstract

​ 异构信息网络已经在推荐系统中用于表征复杂、异构的数据。基于HIN的推荐是指抽取、开发HIN中的信息。之前的HIN的推荐大多是基于路径相似,论文提出了HERec模型。首先使用Random walk生成network embedding,之后使用matrix factorization和 fusion函数实现预测评分。如图是HERec的架构图。

HERec Structure
在这里插入图片描述

Index Terms

Heterogeneous information network, Network embedding, Matrix factorization, Recommender system

INTRODUCTION

​ 这里首先介绍了一下推荐任务的现状、HIN等。并说明了HIN推荐基于路径相似所存在的问题,问题包括HIN中信息的提取,以及在推荐领域的应用开发。

​ 为了解决信息抽取的问题,论文在meta-path基础上使用Random walk策略生成节点序列。基于不同的meta-path都会产生一个embedding来表示一个Node,最后融和多个embedding作为HIN embedding。

​ 之后就是将HIN embedding应用于推荐系统。论文使用简单线性聚合、个性化线性聚合函数和非线性聚合三种聚合函数来表示一个Node。以此来转换为适用于推荐的信息。最后通过Matrix factorization和fused embedding做预测任务并评分。

​ 论文的主要贡献:

  • 提出了基于meta-path的HIN embedding的新方法;
  • 提出了将HIN应用于推荐的HREec模型;
  • 验证了模型的有效性,并展示了模型在冷启动下的能力;

RELATED WORK

​ 这里分三部分介绍了推荐系统、异构信息网络和Network embedding。

​ 在推荐系统领域,早期的工作主要围绕协同过滤和历史信息做推荐。矩阵分解在很多应用中也显示出了巨大的效果。由于协同过滤在冷启动方面的缺陷,很多研究都尝试通过附加信息来提升推荐性能,并有了一系列成果,例如randomised SVD、CNN等。

​ HIN是一个新兴的研究方向,HIN能包含复杂的对象和丰富的关系来应用到推荐系统。很多方法都是基于路径相似。后来,基于meta-path的提出,一些新的方法应运而生,meta-path相似、基于meta-path的协同过滤、基于meta-path的矩阵分解。

​ Network embedding在特征提取领域有很大的潜力,在分类、聚类、推荐方面等广泛应用。很多Network embedding都是关注同构网络 ,虽然有一些针对异构网络的embedding,但是node的表示方式对于推荐并不是最适合的。

PRELIMINARY

​ 下面是一些基本定义:

Definition 1. Heterogeneous information network:一个HIN表示为 G = { V , E } ,包含对象集合V和连接集合E。同时,相关的有类型映射函数:f :V–>A 和 连接映射函数 g :E --> R。A和R表示预定义的对象集合和连接集合,同时|A|+|R| > 2。

Definition 2. Network schema:它表示HIN结构的元类型,用来抽象表示整个HIN结构。论文所使用数据集的Network schema如图。

Network schema

Definition 3. Meta-path:一个meta-path表示从节点A到B所经过一系列Node的路径。

Definition 4. HIN based recommendation:推荐系统中往往只关注user、item这两个实体的关系,其中user、item都包含于对象集合A中,用三元组{u,i,ru,i}表示用户u对实体i的评价r,这个关系属于集合R。

THE PROPOSED APPROACH

Heterogeneous Network Embedding

​ 给定一个HIN,我们的目标是为每一个Node学习一个低维embedding,这个embedding高度凝结信息特点,能够应用于推荐方法。Deep walk这个开创性研究使用了random walk生成节点序列,但是并不能区分边的类型。这就需要更细化的方法来转化HIN生成有意义的节点序列。

Meta-path based Random Walk

​ 要实现上面的需求,就需要设计一个有效的walking策略。论文提出来基于meta-path的random walk策略。

Walking strategy

Type Constraint and Filtering

​ 因为是要应用于推荐领域,我们只关注user和item,对于HIN出现的其他对象并没有什么兴趣。因此,论文只选择了那些user类型或item类型作为起点的meta-path。一个节点序列可能会包含不同类型的节点,这就要删除那些跟开始节点不同的节点。这样做的好处在于,将一个HIN转化为了一个同构网络,降低了实现难度。再一个,给定一个定长的窗口,使用同类型的节点来表示一个Node比不同类型的节点表示一个Node更有意义。下图是整个过滤过程。

Filter process

Optimization Objective

​ 根据node2vec,论文使用如下方式作为表示节点的优化目标。

Optimization Objective

Embedding Fusion

​ 根据论文模型,给定一个Node,我们可以获得一系列meta-path的random walk的表示。这就需要我们将这些embedding融和为适合应用与推荐的的一个embedding,一般方法是使用一个线性权重机制来组合权重。论文提出使用一个function g(*)来融和节点信息。

Embedding Fusion

​ 这里并没有指出这个函数g(*)是什么样式的,论文认为针对特定的任务,网络应该学习出特定的function。

​ 这里给出整个HIN embedding部分的算法。

HIN embedding

Integrating Matrix Factorization with Fused HIN Embedding for Recommendation

​ 根据前面的方法,我们已经能够得到User embedding和Item embedding,接下来就是使用这些embedding做推荐。

Rating Predictor

​ 论文基于经典的MF模型构建评分模型。在MF中,用户 u 对物品 i 的定义如下:

Defined

​ 其中Xu和Yi分别是相应的user和item。我们有user和item的表示,则Rating Predictor如下:

Predictor

​ 注意:这里的隐式因子 r 跟user embedding、item embedding有相同的维度。

Setting the Fusion Function

​ 之前,我们假设fusion function是一个给定的形式,这里就来学习如何设置这个function。论文只阐述了user embedding的fusion function的构建过程,item 的类似。一共有三种fusion function。

  • Simple linear fusion:这里假设user对每条meta-path有相同的偏爱度,所以给定每条meta-path相同的权重,并将embedding线性转换到目标空间;

Simple linear fusion

  • Personalized linear fusion:Simple 的方式不能表示user对meta-path的个性化需求,所以这里给每个user分配一个权重矩阵,用来表示user的个性化需求,这在真正应用中显得更为合理;

Personalized linear fusion

  • Personalized non-linear fusion:线性的fusion一定程度限制了对复杂关系数据的拟合能力,这是非线性fusion的形式;

Personalized non-linear fusion

Model Learning

​ 将fusion function整合到MF中如下:

Model Learning

​ 上面的参数会按如下更新:

Update

​ 其中Θ表示fusion function中的所有参数,不同的Θ的导数计算也不相同,其中Personalized non-linear fusion function的导数计算如下:

Non-linear

​ 其中Zs为原函数,Zf为激活部分。整个算法框架如下:

Algorithm2

Complexity Analysis

​ 论文模型主要包含两部分:

  • HIN embedding:其复杂度主要包含User、Item embedding的维度与两者个数、meta-path条数有关。
  • Matrix Factorization:主要是更新一系列参数,SGD在训练中收敛迅速。

EXPERIMENTS

​ 论文使用Douban Movie、Douban Book、Yelp三个数据集来实验。下图是三个数据集中选用的相应的meta-path。

Meta-path

​ 论文使用的评估指标有MAE(mean absolute error)、RMSE(root meansquare error),计算方式如下:

MaeRMse

​ 作为对比的baseline包括:PMF、SoMF、FMHIN、HeteMF、SemRec、DSR、HERecdw、HERecmp,最后结果显示,论文模型几乎全部表现最优。

Selection of Different Fusion Functions

​ 论文还对fusion function进行了对比实验,结果显示非线性最优、线性次之、simple最差。

Fusion

Cold-start Prediction

​ 论文针对冷启动问题作了对比实验,从结果看出HERec依旧表现很好。

Cold-start

Impact of Different Meta-Paths

​ 此外,论文分析了meta-path的条数对推荐效果的影响,并分析了一下其中的原因。并得出结论:少量的优质meta-path能够最大化性能,这也能有效控制模型复杂度。

More

Parameter Tuning

​ 最后,论文还对参数的选择进行了分析,分别分析了隐式因子个数对结果的影响、权重参数α、β对结果的影响,以及迭代次数对结果的影响。

  • 隐式因子个数对结果的影响

Result1

  • 权重参数α、β对结果的影响

Result2

  • 迭代次数对结果的影响

Result3

论文地址

Heterogeneous Information Network Embedding for Recommendation: https://arxiv.org/pdf/1711.10730


http://chatgpt.dhexx.cn/article/37AeskNF.shtml

相关文章

【论文解读|2019】HAHE - Hierarchical Atentive Heterogeneous Information Network Embedding

文章目录 摘要1引言4 模型4.1 路径实例注意力层4.2 元路径注意力层 论文作者:来自浙江大学的同学 论文链接: 来源:arxiv2019 摘要 异构信息网络(HIN)嵌入由于能够有效地处理复杂的异构数据而引起了人们的广泛关注。元路径是连接具有不同语义…

C++ 五子棋双人对战免费源码----鼠标操作(DEV-CPP)

五子棋的规则就不用我说了吧,大家应该都玩过 今天,我来发一个鼠标操作的 函数使用须知 首先最重要的是这个函数: 头文件:windows.h 注意:请先将窗口属性调为插入模式(方便用这个函数): 1.右键点击 2.点击属性 3.只打开插入模式 4.点击…

图解pytorch padding方法 ReflectionPad2d

torch.nn.ReflectionPad2d(padding)这个函数简单来说就是:利用输入边界的反射来填充输入张量。 官方文档里给了该padding的输入输出如下所示: CLASS torch.nn.ReflectionPad2d(padding: Union[T, Tuple[T, T, T, T]])Input: ( N , C , H i n , W i n …

paper—HAWK: Rapid Android Malware Detection Through Heterogeneous Graph Attention Networks

通过异构图形注意网络快速检测Android恶意软件 目录 摘要 一、引言 二、背景和概述 A.动机和问题范围 B.我们的HAWK方法 三、基于HIN的数据建模 A.特征工程 B.构建HIN C.从HIN构建应用程序图​ 四、结点嵌入模型 A.MSGAT: In-Sample Node Embedding B.MSGAT: In…

声呐矩形图像转换为扇形算法

clear;clc;close; %% 读取输入图像数据 imInimread(lion.jpg); imInflip(imIn);% 倒置读入图像数据 [hIn,wIn,~]size(imIn);% 输入图像的宽和高 %% 根据扇形几何关系计算输出图像像素 angle15; % 张开角度的一半 ratio8/11; % 假定Llength/(LlengthLs…

【论文翻译】KDD19 -HeGAN: Adversarial Learning on Heterogeneous Information Networks 异构信息网络中的对抗学习

文章目录 摘要1 引言2 定义3 所提方法:HeGAN3.1 整体框架3.2 HeGAN中的生成器和鉴别器 4 实验4.1 实验设置4.2 实验分析 5 相关工作6 结论 论文链接: Adversarial Learning on Heterogeneous Information Networks 代码链接: https://githu…

【论文解读|IJCAI2021】THINE - Temporal Heterogeneous Information Network Embedding 时域异构信息网络嵌入

文章目录 摘要1 引言2 相关定义3 提出的模型3.1 模型概览3.2 THINE模型 5 相关工作6 结论 最新动态异构网络嵌入模型 动态HIN Hawkes过程 摘要 异构信息网络(HIN)的嵌入,学习多类型节点的低维表示,得到了广泛的应用,并取得了良好的性能。然而…

An Attention-based Graph Neural Network for Heterogeneous Structural Learning

论文链接:https://arxiv.org/abs/1912.10832 代码链接:https://github.com/didi/hetsann Abstract 针对HIN(Heterogeneous Information Network)的表示学习,提出 HetSANN(Heterogeneous Graph Structura…

【论文解读 | IJCAI2020】NSHE - Network Schema Preserving Heterogeneous Information Network Embedding

文章目录 摘要1 引言2 相关工作3 我们的方法3.1 保留成对邻近性3.2 保留网络架构邻近性网络架构实例抽样网络模式实例采样多任务学习保留模式 4 实验5 结论 论文链接: Network Schema Preserving Heterogeneous Information Network Embedding 代码链接&#xff1a…

【火】爆肝1w+字把SQL注入讲的明明白白!

Hello大家好~这里是KOKO师傅 SQL注入是Web渗透测试里hin常用的方法,我用1w字让你入门SQL注入! 一、数据库基础 1.1 数据库概述 • 数据库(DataBase, DB):存储在磁带、磁盘、光盘或其他外存介质上、按一定结构组织在一起的相关数据的集合。 • 数据库…

【论文翻译 | AAAI19】HHNE - Hyperbolic Heterogeneous Information Network Embedding 双曲异构信息网络嵌入

文章目录 摘要1 引言2 相关工作3 相关知识3.1 HIN相关定义3.2 HIN中的关系分布 4 双曲空间中的HIN嵌入4.1 双曲几何 6 结论 双曲空间 异构网络嵌入 参考阅读: HHNE 摘要 异构信息网络(HIN)嵌入是一种将HIN映射到低维空间的技术,引起了广泛的研究。现有…

我用开天平台做了一个字符串检查API,hin 简单~~

摘要:本文使用了工作台的API全生命周期管理和函数管理功能,编写字符串检查的函数,实现了API的快速创建和发布。 本文分享自华为云社区《【我用开天平台做了一个字符串检查API》,作者:人类群星闪耀时。 1 开天集成工作…

DyHNE-Dynamic Heterogeneous Information Network Embedding with Meta-path based Proximity

文章目录 摘要1 引言2 相关工作2.1 网络嵌入2.2 HIN嵌入2.3 动态网络嵌入 4 DyHNE模型4.1 基本思想4.2 静态HIN嵌入 5 结论 来源:IEEE Trans2020 作者:北邮陆元福等人 摘要 异构信息网络(HIN)嵌入的目的是学习节点的低维表示,同时保持HIN中的…

AdaptiveAvgPool2D 不支持 onnx 导出,自定义一个类代替 AdaptiveAvgPool2D

AdaptiveAvgPool2D 不支持 onnx 导出,导出过程会告诉你,onnx不支持那个动态操作巴拉巴拉 我用的是 pp_liteseg 导出为 onnx 模型,都一样,paddle和Torch的 Adaptive Pool2D 都是动态的,onnx暂时都不支持,我…

ICLR 2023 | 3D UX-Net:超强的医学图像分割新网络

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>CV微信技术交流群 转载自:CVHub Title: 3D UX-Net: a Large Kernel Volumetric ConvNet Modernizing Hierarchical Transformer for Medical Image Segmentation …

异构信息网络 Heterogeneous information network (HIN)

异构信息网络包含多类节点和多类连接关系,由于此类网络能够灵活的对异构数据及逆行建模,越来越多的被应用于推荐系统,处理复杂的多元异构的数据。 这里给出异构信息网络 Heterogeneous information network (HIN),网络模式 Networ…

[论文阅读] (ASONAM2019) Meta-GNN: 属性异构网络中用于半监督学习的元图神经网络

论文标题:Meta-GNN:Metagraph Neural Network for Semi-supervised learning in Attributed Heterogeneous Information Networks 作者:Aravind Sankar, Xinyang Zhang, Kevin Chen-Chuan Chang 单位:Department of Computer Sc…

【推荐系统】HIN异构信息网络(Hetegeneous Information Network)

异构信息网络 (Hetegeneous Information Network 以下简称 HIN),是由 UIUC 的 Han Jiawei 和 UCLA 的 Sun Yizhou 在 2011 年的 VLDB 论文中首次提出 [1]。 简单地理解,HIN 就是一个有向图,图中的节点和边都可以有不同的类型&…

HIN 异构信息网络(Heterogeneous Information Network)

信息网络(Information Network) 信息网络可以用一个有向图G (V, E) 来表示,其中V代表 Object,E代表 Edge。并且用映射函数 ϕ : V → A 来表示每一个object v ∈ V 属于object类型集合A: ϕ(v) ∈ A,用映射函数ψ : E → R.表示每条边 e ∈ E 属于边的…

HIN应用调研总结

文章目录 1. 代码安全iDev: enhancing social coding security by cross-platform user identification between GitHub and stack overflow【A】 2. API推荐Group preference based API recommendation via heterogeneous information network【A】 3.Andorid恶意软件检测Out-…