[VLDB 2022]Butterfly Counting on Uncertain Bipartite Graphs

article/2025/10/26 7:12:09

总结

非确定二部图上的蝴蝶结构统计，精确算法。在普通的蝴蝶结构统计上，增加了边权重，使得传统算法失效，再在这基础上定义新的统计并优化老方法。

动机

Butterfly的数量直接展示了二部图的密度，是个很重要的属性。相比于certain bipartite graph， uncertain bipartite graph 的边上多了权重，用来表示联系的概率。这种图会比一般的图更有表现能力，但现在少有这种图上的butterfly counting算法。

Butterfly counting使用案例

Host-Parasite Network: 这种网络用来寻找寄生虫寄生于哪些宿主身上。此时二部图上的权重用来表示被感染的机率。通过butterfly counting可以对潜在的感染率和传播造成的影响进行评估。
推荐系统。此时二部图上的权重用来表示用户对某商品的喜好程度/购买可能。通过butterfly counting可以对不同推荐系统得到的推荐结果进行对比，越稠密的越好。

问题定义

和一般的butterfly counting不同，这里因为引入了uncertain属性，所以需要对概率设定一个阈值。
比如：

这张图里，阈值为0.6。而蝴蝶结构 $B (A, B, C, D)$ 的权重是 $\times 1 \times 0.9 \times 0.8 = 0.72$ 是满足的，但 $B (C, D, G, H)$ 则是 $\times 1 \times 0.4 \times 0.5 = 0.2$ 则是不满足的。用下面的定义来表示就是 $Pr(B_t) \geq 1$ 。
计算剩下的可以得到，这张图的count是0.2。
顺便提一句，下面还有个wedge $\angle(u,v,w), Pr(\angle_t)\geq t \in [0,1]$ 。同样的，满足条件的才会被视作图中的wedge。

很明显，已有的工作没法在这定义上实现counting。

其中 $Pr(e_{u,v}) \in (0,1]$

对于每个G的每套权重边（子图），都有一个possible world $W_i=(V, E_{W_i})$ 。以下式子本质就是出现这个概率世界的概率：
$\ E W i ( 1 − P r ( e ) ) Pr(W_i)=\prod_{e \in E_{W_i}} Pr(e) \cdot \prod_{e \in E\backslash E_{W_i}}(1-Pr(e))$
也就是说，当出现了某个具体的概率世界时，其实就是概率的不确定边转变为了实际发生的确定边。
对于每个G，都会有 $2^{|E|}$ 个概率世界。看来是全包和一个都没有都算在内的。 $\mathbb{W}=\{W_1, \dots W_{2^{|E|}}\}$ 。

$E$ 条边可以有 $2^{|E|}$ 种子集的证明，可以认为每条边有在和不在两种情况，自然就是边数个2相乘。

Naive算法

首先有个顶点优先级定义：

if((deg(u) > deg(v)) or (deg(u) == deg(v) and id(u) > id(v))):p(u) > p(v)

利用优先级可以避免一个点被计算多次。

提取出一个概率世界
找出u为起点，优先级都低于u的u邻居v，以及wedge邻居w，把中间节点v存入H(w)
对于至少有2个v的w，判断这个蝴蝶符不符合要求，符合数量+1。

从度小的子图开始往上地毯式搜索。

提升算法

l中存了所有边从小到大的权重，然后对所有边做遍历
两边权重乘积小于t的肯定就出局了，顺便可以确定当前边需要配合的另一条边的最小权重，再去找有没有符合的，没有就直接跳过这条边，有就计数。

最终算法

概率低于t的点肯定不是，可以直接去掉，后面的基本和UBFC保持一致，不过存的是wedge，之后可以直接用wedge去统计数量。

[VLDB 2022]Butterfly Counting on Uncertain Bipartite Graphs

总结

动机

Butterfly counting使用案例

问题定义

Naive算法

提升算法

最终算法

相关文章

二分匹配大总结——Bipartite Graph Matchings[LnJJF]

【一致性仿真】Fixed-time bipartite consensus of multi-agent systems with disturbances

Bipartite Graph多视图学习聚类文章总结

Fast spectral clustering learning with hierarchical bipartite graph for large-scale data

Bipartite Graph Based Multi-View Clustering

BiNE: Bipartite Network Embedding

【Paper】2020_Event-triggered bipartite consensus over cooperation-competition networks under DoS atta

Bipartite graph/network学习

bipartite matching二分图匹配

【嵌入式单元测试】C语言单元测试框架搭建

三年黑盒测试工程师，带你了解嵌入式测试，金三银四升职加薪秘诀

嵌入式软件测试的小结

【测试】嵌入式软件测试VS一般软件测试

嵌入式软件自动化测试介绍

嵌入式软件测试的基本方法

嵌入式测试大赛预选赛

嵌入式软件测试

全国软件测试大赛嵌入式测试步骤及所需工具

嵌入式软件测试（黑盒测试）-----三年嵌入式软件测试的理解

简单聊聊嵌入式软件测试