产品关联度分析
关联分析是发现交易数据库中不同商品(项)之间的联系,主要应用于电商网站
推荐、线下零售门店商品摆放等场景中。
关联规则:
1.支持度(support):数据集中包含某几个特定项的概率。比如在1000次的
商品交易中同时出现了A和B的次数是50次,那么此关联的支持度为5%。
2. 置信度(Confidence):在数据集中已经出现A时,B发生的概率,置信度
的计算公式是 :A与B同时出现的概率/A出现的概率。
3.提升度就是在购买A产品这个条件下购买B产品的可能性与没有这个条件下购买B
产品的可能性之比(置信度/无条件概率)。
一般而言,提升度如果小于1,则该推荐规则不应该被使用。
购物篮分析
一般将单个客户一次购买商品的总和称为一个购物篮,购物篮分析就是针对商品的相关性分析。
购物篮分析要点:
- 找到正确的物品组合
- 找到用户对应不同组合的购买时间
- 找到用户对应不同组合的购买顺序
案例:商店的顾客购买的商品清单
步骤一:
计算不同商品的交易频次
步骤二:
根据最低支持度筛选商品
(最低支持度为50%)
步骤三:
计算不同组合的交易频次
步骤四:
根据最低支持度筛选组合
(最低支持度为50%)
步骤五:
计算不同组合的交易频次
(三种商品)
步骤六:
根据最低支持度筛选组合
(最低支持度为50%)
Apriori算法(先验算法)
Apriori是先验算法,假设子集S出现了k次,那么任何包含S的其它子集只会小于或等于k次. 反之如果S
不满足最小的支持度,则任何包含S的子集也不会满足,这时包含S的子集就可以忽略计算了。