推荐系统中的偏差

article/2025/9/25 10:17:09

推荐系统消偏

  • 推荐系统中的偏差
    • IPW ——逆概率加权
      • DICE ——区分兴趣和偏差建模
      • 因果推断

推荐系统中的偏差

预估问题 我们一般会注重两种误差,偏差和方差,
方差与模型泛化能力有关:通常关注模型的复杂度与是否过拟合;偏差则表现为与真实模型的预估差距的差异,与以即模型的拟合能力有关。
一般来说,简单的模型会有一个较大的偏差和较小的方差,复杂的模型偏差较小方差较大。
除模型的复杂度外,训练数据是否与真实数据分布的差异大小这一点也必须考虑。
我们来看一下数据问题造成的偏差:曝光偏差、选择偏差
数据的真实分布,推荐系统线上预估面临的是真实的分布,模型训练时采用观测到的样本,本身就包括了选择偏差、曝光偏差。这种偏差是系统性的,具备危害。
解决这些偏差有一些方法,在这里写我了解到的3种,IPW (逆概率加权)、DICE(区分兴趣和偏差建模)、因果推断(根据因果关系,使用do算子建模)

IPW ——逆概率加权

因为选择偏差偏差,训练的数据分布 和真实分布存在差异。方法:根据曝光量和曝光量逆向调整权重,简单粗暴,符合逻辑,训练起来不好收敛。
在这里插入图片描述

DICE ——区分兴趣和偏差建模

这个方法挺不错的,是一个框架类的去偏方法,将偏差和用户兴趣分开建模,难点是,用户真正兴趣的训练集要怎么构建的问题。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
用户兴趣的训练集,O2 的负样本要比正样本流行性更高 才行,可用点击数/曝光数或者一个热度分来代替。模型选用pair-wise 模型更好一些。
问题是O2 的构建是有难度的,而且数据量会比较少,

因果推断

DICE或者说是causal embedding 建模的方式 是真的合理的吗?不一定,流行度在系统中一定是不好的吗? 流行度会影响物品的曝光,从而带来偏差,但是人们也是需要看到高流行度的物品的,我们要去除的是流行度因为影响到了曝光而带来的偏差。因果图能帮助我们来进行建模,参考PDA 这篇文章
在这里插入图片描述
这张图看过一点因果推断的人肯定不陌生。c图中间的x 符号是什么,这代表一种干预,干预之后的概率,这其实很令人困惑,你说干预就能干预吗?
我们先来从概念上了解一下因果推断是什么? 因果推断是想通过控制造成估计偏差的变量,计算干预一个变量对结果的影响。
在图中,即是 通过控制z 来计算U,I 对C 的影响? 怎么控制??控制反应在数学公式中是什么?
控制即如果固定z,那么任何I变动的影响对c 的变化就是I 对C的因果效应,反应在数学公式里面我要预估,控制z之后的概率,P(C|u,do(I)) ,传统的预估的是P(c|u,I) 没有割断z,I 之间的连接,因此预估的内容就有了变化
原始的
因果推断的预估
其实我们来看 ,原始的是把流行性 作为两部分影响了P(c|u,i), 而因果推断的do 算子,只预估了两项。理论上看消除了p(I|z) 。
这里我认为只是推导的不同,更重要的是原始P(c|u,i) 没有显示对z 建模,导致这是一个混杂因子。而PDA 通过以下方式对z 做了显示建模:然后利用do算子 就可以计算P(c|do(u,i))
在这里插入图片描述
其实我认为这里不一定是完全对的,控制z, 在模型的训练过程中并没有体现。或者没有显示体现,比如z 学历是性别到录取结果的混杂因子,我们计算性别到录取结果的因果关系的时候是要p(录取|女,高学历)-p(录取|男,高学历) ,这样看来模型并没有显示的表现这一点。(留一个疑问在此,欢迎大佬们给我建议,感谢)
参考文章:
1、 Causal Intervention for Leveraging Popularity Bias in Recommendation
2、 Disentangling User Interest and Conformity for Recommendation with Causal Embedding
3、Learning to Rank with Selection Bias in Personal Search


http://chatgpt.dhexx.cn/article/0lYmmxbp.shtml

相关文章

特征偏度和异常值处理

(一)机器学习基础 - 偏度、正态化以及 Box-Cox 变换 https://my.oschina.net/mathinside/blog/4942126 对于数据挖掘、机器学习中的很多算法,往往会假设变量服从正态分布。例如,在许多统计技术中,假定误差是正态分布…

推荐系统去偏(Debiased Recommendation)研究进展概述

©作者 | 张景森 学校 | 中国人民大学信息学院硕士 文章来源 | RUC AI Box 引言 推荐系统作为解决信息过载的一种重要手段,已经在不同的应用场景下取得了不错的效果。近些年来关于推荐系统的研究主要集中在如何设计更好的模型来适应用户行为数据,进而…

【综述】推荐系统偏差问题 去偏最新研究进展(Bias and Debias in Recommender System)

文章目录 1. 推荐系统的反馈回路1.1 User -> Data1.2 Data -> Model1.3 Model -> User 2. 推荐系统中的Bias2.1 数据偏差(data bias)2.1.1 选择偏差(Selection Bias)2.1.2 曝光偏差(Exposure Bias)2.1.3 一致性偏差(Conformity Bias)2.1.4 位置偏差(Position Bias) 2.…

数据偏度介绍和处理方法

偏度(skewness)是用来衡量概率分布或数据集中不对称程度的统计量。它描述了数据分布的尾部(tail)在平均值的哪一侧更重或更长。偏度可以帮助我们了解数据的偏斜性质,即数据相对于平均值的分布情况。 有时,正…

【期权系列】基于偏度指数的择时分析

【期权衍生指标系列】基于偏度指数的择时分析 本篇文章是基于研究报告的复现作品,旨在记录个人的学习过程和复现过程中的一些思路。 感谢中信期货研究员前辈的宝贵思路。 一、偏度指数 1.偏度指数简介 偏度是描述数据分布形态的统计量,其描述的是统…

对于偏度的理解

偏度公式如下: 现在想解决如何从图像上解决为正为负的问题,如图所示:? 个人理解:偏度中的偏是针对变量相对于中心点(期望值)距离的一种描述;如果厚尾的话,就说明有很多点…

量化策略研究:股票中的偏度效应

2022年4月份以来,加密货币市场的暴跌强调了市场中性策略的重要性;基于此,有部分Quanter提出了基于加密货币的偏度策略:“Skewness/Lottery Trading Strategy in Cryptocurrencies”。 为此,小编不禁好奇:偏…

Maven安装和配置(详细版)

Maven安装和配置 Maven安装1、安装链接:2、配置环境变量: Maven配置1、修改Maven仓库下载镜像及修改仓库位置:2、在Idea上配置Maven: 测试Maven安装能否安装jar包 Maven安装 1、安装链接: Maven – Download Apache …

Maven 安装/学习入门详解!

Maven安装: Maven 软件的下载 为了使用 Maven 管理工具,我们首先要到官网去下载它的安装软件。通过百度搜索“Maven 点击 Download 链接,就可以直接进入到 Maven 软件的下载页面: 我们当时使用的是 apache-maven-3.5.2 版本&a…

Maven安装(超详解)

2.4.1 下载 下载地址:Maven – Download Apache Maven 在提供的资料中,已经提供了下载好的安装包。如下 : 2.4.2 安装步骤 Maven安装配置步骤: 解压安装 配置仓库 配置Maven环境变量 1、解压 apache-maven-3.6.1-bin.zip&a…

Maven安装教程详解

一、准备工作 1、确定电脑上已经成功安装jdk7.0以上版本 2、win10操作系统 3、maven安装包 下载地址:http://maven.apache.org/download.cgi 二、解压Maven安装包 在上述地址中下载最新的Maven版本,解压到指定目录(此处根据自己的…

Maven安装及配置(附带安装包)

Maven安装及配置 目录 Maven安装及配置 一: 安装包准备: 二: 安装配置 三: Maven 依赖地址更改为阿里镜像 四: idea中配置maven 一: 安装包准备: apache-maven-3.6.3-bin 链接&#xff1…

Maven安装和使用(详细版)

目录 演示版本: 安装 1.下载和解压 2.安装配置 IDEA使用Maven 1.IDEA配置Maven环境 2.新建maven项目 演示版本: maven:apache-maven-3.6.1 IEDA:2021.3 Windows:11 安装 1.下载和解压 1.下载去maven官网下载…

Maven安装与环境配置(Windows)

注意:Maven3以上版本要求安装jdk1.7以上版本。1、下载安装包 在Maven官网下载最新版的安装包:http://maven.apache.org/download.cgi 2、解压安装包 3、配置Maven环境变量 配置M2_HOME环境变量,指向maven的安装目录,并将bin目…

maven安装jar包

解决问题 主要解决开发过程中jar包依赖无法通过中央仓库、阿里云仓库等地方直接下载或者说对应的仓库中没有对应的jar包,比如 java-1.0.2.jar 这个jar包,很难从maven中央仓库中下载。这个时候我们就需要把对应的jar包给copy到本地,然后通过m…

Maven安装和配置(超详细+配置idea)

一、Maven安装准备 1、maven下载 1.1、百度网盘链接下载 链接:https://pan.baidu.com/s/1fGDRnWCfN3mrDM9oV5y01g?pwd1234 提取码:1234 1.2、maven官网下载 链接:maven官网下载 二、maven安装步骤 2、解压安装 解压…

Ubuntu下Maven安装和使用

Ubuntu下Maven安装和使用 一、安装Maven 安装Maven之前,必须安装了JDK,另外IDEA可以从https://download.jetbrains.8686c.com/idea/ideaIC-2016.2.5.tar.gz下载,里面有说明如何安装IDEA 1.1 首先下载Maven的压缩包 下载apache-maven-3.8.…

Maven安装

下载地址:http://maven.apache.org/download.cgi 下载后解压到自己想安装的目录 配置环境变量: MAVEN_HOME : D:\ProgramFiles\apache-maven-3.6.1 (压缩所在的路径) PATH: %MAVEN_HOME%\bin 修改setting.xml配置文件(在压缩路径的conf文…

android换机备份,安卓手机备份迁移指南

原标题:安卓手机备份迁移指南 买了新手机,本来是一件非常开心的事情,但是如何将旧手机上的有用信息转移到新手机上,这可是一件让大家很犯愁的事情,今天就跟着小编一起来看看安卓手机的四种转移数据的方法吧。 1、一键换…

360安全备份 android,手机里的数据怎么备份 360安全卫士备份手机数据图解

现在是智能手机时代,手机更新换代快,很多人要把一个手机里的数据转移到另外一个手机。所以手机里数据必需要备份。那么手机里的数据怎么备份?虽然现在备份手机数据有很多工具都可以使用,但每种工具都有自己不同的特点,…