PageRank算法

article/2025/9/25 23:16:36

一、算法原理:

1、如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高
2、如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页PageRank值也会相应提高。
例子:
如果一个网页有k条出 链,那么跳转任意一个出链上的概率是1/k ;如果用n表示网 页的数目,则转移矩阵M是一个n*n的方阵;如果网页j有k个出链,那么对每一个出链指向的网页i,有M[i][j]=1/k,而其他网页的M[i] [j]=0

这里写图片描述

MM=01313131200121000012120 则 转 移 矩 阵 M 表 示 如 下 : M = [ 0 1 2 1 0 1 3 0 0 1 2 1 3 0 0 1 2 1 3 1 2 0 0 ]

这里写图片描述

假设上网者在每一个网页的概率都是相等的,即1/n,于是初试的概率分布就是一个所有值都为1/n的n维列向量V0,用V0去右乘转移矩阵M,就得到了第一步之后上网者的概率分布向量MV0,(nXn)*(nX1)依然得到一个nX1的矩阵

矩阵M中M[i][j]不为0表示用一个链接从j指向i,M的第一行乘以V0,表示累加所有网页到网页A的概率即得到9/24。得到了V1后,再用V1去右乘M得到V2,一直下去,最终V会收敛,即Vn=MV(n-1),上面的图示例,不断的迭代,最终V=[3/9,2/9,2/9,2/9]

二、注意事项:

如果有些网页不指向其他网页(可能是垃圾网页),如果按照上面的计算,上网者到达这样的网页后便走投无路、四顾茫然,导致前面累计得到的转移概率被清零,这样计算下去得到的概率分布向量所有元素几乎为0

三、算法改进

解决终止点问题和陷阱问题
地址栏输入而跳转到各个网页的概率是1/n;
上网者每一步查看当前网页的概率为a,那么从浏览器地址栏跳转的概率为(1-a)

V=aMV+(1a)e V ′ = a M V + ( 1 − a ) e

[注]采用矩阵相乘, 不断迭代,直到迭代前后概率分布向量的值变化不大,一般迭代到30次以上就收敛了,取e为所有分量都为1/n的列向量。真的web结构的转移矩阵非常大,目前的网页数量已经超过100亿, 转移矩阵是100亿*100亿的矩阵,直接按矩阵乘法的计算方法不可行,需要借助Map-Reduce的计算方式来解决。

四、算法总结:

PageRank算法的缺点
这是一个天才的算法, 原理简单但效果惊人。 然而, PageRank算法还是有一些弊端。
第一, 没有区分站内导航链接。 很多网站的首页都有很多对站内其他页面的链接, 称为站内导航链接。 这些链接与不同网站之间的链接相比,肯定是后者更能体现PageRank值的传递关系。
第二, 没有过滤广告链接和功能链接(例如常见的“分享到微博”)。这些链接通常没有什么实际价值, 前者链接到广告页面, 后者常常链接到某个社交网站首页。
第三, 对新网页不友好。一个新网页的一般入链相对较少,即使它的内容的质量很高,要成为一个高PR值的页面仍需要很长时间的推广。


http://chatgpt.dhexx.cn/article/wlyVIu2N.shtml

相关文章

pagerank算法详解

目录 一、pagerank简介两个重要假设 二、pagerank算法公式定义计算演示矩阵化计算 三、存在的两个问题问题1.Dead Ends问题2.Spider Traps 一、pagerank简介 PageRank算法的基本想法是在有向图上定义一个随机游走模型,即一阶马尔可夫链,描述随机游走者沿…

整车CAN网络拓扑图

什么是智能硬件与ECU ? 何为智能硬件, 就是包含智能控制单元的硬件, 比如发动机, 发动机上有一块儿专门负责控制发动机进气量, 喷油量, 排气量的控制单元, 这块单元相当于发动机的大脑. 他具有信号发送, 信号接收, 参数存储等基本功能, 这个控制单元就是ECU. ECU(Electronic …

如何利用CANoe在两路CAN通道之间创建网关(gateway)

1 目的 利用CANoe在两路CAN通道之间创建一个网关,通过CAPL实现CAN1、CAN2通道间的报文转发,并进行故障注入测试(通过改变某些信号的值)。 (本实例仅用于博主学习记录) 2 步骤 创建一个两路通道&#xf…

CANoe-如何模拟CAN总线网关通信(满满都是细节)

网络上有不少的文章介绍使用canoe工具模拟网关把can1总线上的报文转发到can2上,那我为什么要写这篇文章呢?大家知道,我的文章不可能完全照搬别人的内容,肯定要夹带私货,有自己的理解的。所以我会从网关在can总线中的工作方式到所起的作用进行分析,学习如何在canoe中实现模…

CAN/CANopen转PROFINET网关TCO-151

型号:TCO-151 基本说明:TCO-151可实现 PROFINET网络与CANopen或CAN网络之间的数据通信。网关在PROFINET网络作为从站,CANopen端既可以做主站也可以做从站,CAN端支持CAN2.0A/CAN2.0B协议,支持对CAN帧进行过滤处理。 特…

CAN总线网关设备

南京来可电子科有限公司 CAN总线网关设备

嘴哥有料系列-can教程2:CAN网关及CAN信号转发机制

原文章:https://mp.weixin.qq.com/s/qbUcZngSDClx9Ll5aKvlLg 上节课, 我们讲到了CAN网关, 其实准确的说不能叫CAN网关, 应该叫网关或者汽车网关, 因为网关不仅处理CAN网络, 还处理LIN网络. 主要是为了配合本系列教程及区分于以太网网关, 所以才取名叫CAN网关. CAN…

CAN总线车联网透传云网关简介

车联网透传云网关 CANIOT-222W/G车联网透传云网关 功能说明 透传功能:串口透传、网口透传、CAN口透传 云端功能:设备管理、OTA升级、远程调试、远程监控 云平台 主要通过互联网(2G/3G/4G)将不同区域的车辆或工程机械接入共有…

CAN网关远程OTA升级方案详解(工程机械控制器远程升级)

CAN网关远程OTA升级方案详解 背景; 现今中国基建全面开花,工程车辆的需求量越来越大,工作环境也越来越复杂。工程车辆配置升级需求也越来越多,所需要的的工程师数量也越来越多,导致工程师数量严重不做,影响…

CAN云网关透传CANIOTCAN物联网云网关系列基本介绍

来可电子的CANIOT透传网关可以实现串口,网口和CAN口的远程数据传输。 CANIOT透传网关 实现的原理为网关通过4g或者WiFi连接到服务器,再由服务器将接收到的网关数据转发到网关配套的客户端上,客户端再通过对应的上位机软件将接收到的数据显示出…

【N32G457 】基于RT-Thread和N32G457的CAN网关

本文是RT-Thread用户xiere 原创发布,是用于参加RT-Thread与国民技术联手推出N32G457 RT-Thread设计大赛,原文:https://club.rt-thread.org/ask/article/3422.html 基于RT-Thread系统和N32G457开发板开发的一款CAN网关;硬件部分由…

S32G CAN网关测试

canutils 使用 ./cansend can0 -e 0x11 0x22 0x33 0x44 0x55 0x66 0x77 0x88发送默认ID为0x1的can标准帧,数据为0x11 22 33 44 55 66 77 88, 每次最大8个byte ./cansend can0 -i 0x800 0x11 0x22 0x33 0x44 0x55 0x66 0x77 0x88 -e-e 表示扩展帧,CAN_ID最…

汽车网络安全之——CAN网关测试

测试内容 本部分为网关测试标准整理而来。 1 硬件信息安全测试 网关硬件信息安全测试应按照下列流程及要求依次进行: a) 拆解被测样件设备外壳,取出PCB板,通过5倍率以上的光学放大镜,观察网关PCB板,检查PCB 板硬件是否…

can网关 candtu CANIOT系列车联网透传云网关

can网关 candtu CANIOT系列车联网透传云网关的功能介绍 1,主要功能:云端监控、远程调试及配置、程序上下载4G、WiFi、 以太网联网 CAN口、串口和网口透传 云平台私有化部署服务虚拟CAN口适配广泛。 2,应用介绍 透传网关支持串口/网口/CAN口同…

CAN网关/CAN信号转发机制/案例解析

其实准确的说不能叫CAN网关, 应该叫网关或者汽车网关, 因为网关不仅处理CAN网络, 还处理LIN网络. 主要是为了配合本系列教程及区分于以太网网关, 所以才取名叫CAN网关. CAN网关的外形结构 大概外形如上, 偶有差异, 大小如香烟烟盒, 有60,70多个PIN脚组成. 每个接线pin脚都有严…

can网关 IFM控制器OTA远程升级

远程给IFM控制器升级现场接线图 CAN总线远程升级设备

CAN网关通过4G网关给CAN车载控制器升级程序

CANIOT网关通过4G网关给CAN车载控制器升级程序 CAN总线的优势 CAN(Controller Area Network)为控制器局域网络,CAN总线规范已经被国际标准化组织制订为国际标准ISO11898,并得到众多半导体器件厂商的支持,推出各种集成有CAN协议的产品。CAN属…

使用CANoe搭建CAN网关

Vector公司的CANoe是一款强大的总线仿真工具,通过CANoe搭建出来的总线模型可以模拟真实的汽车总线,并且通过CAPL语言可以对节点上的ECU进行编程。这样不仅能够模拟总线上的报文发送,还可以模拟ECU的内部逻辑,理论上可以完全模拟出…

CAN 4G的远程CAN网关与TBOX的区别

随着市场的发展,智能化一直是车企需要解决的难点。特别是在现有市场中,工程机械、特种车辆、环卫车等车辆管理主要靠工程师带着笔记本跑现场调试,即浪费人力出差成本也高。而且现在疫情频发,出差成本更高,出差风险也大…

PROFINET转CAN网关监测CAN设备在线设置文档

PROFINET 转CAN网关监测CAN设备在线设置文档 1 摘要 采用西门子S7系列PLC,支持PROFINET协议,仪表设备支持CAN自由口通讯协议。 本文档介绍如何在TIA Portal、ECSP-CAN中设置监测CAN设备离线通过S7系列PLC在TIA Portal上查询状态,主要是配置北…