来聊聊马尔可夫过程

article/2025/8/22 1:23:42

相信你对马尔科夫这个词一定不陌生,因为在人工智能机器学习领域,这个词是避不开的,如马尔可夫链(Markov chain),马尔科夫随机场(Markov random field),马尔可夫过程(Markov process),隐马尔可夫模型(Hidden Markov model),怎么这么多马尔科夫。。。这篇文章主要讲的是马尔科夫过程的一些基础的概念和理解。

马尔可夫性质是一种很有效的简化模型的工具,只要你说某过程具有马尔可夫性质,就说明该过程无后效性,什么意思呢?就是说下一刻的状态只和我这一刻的状态有关,和我之前的状态是没有关系的,这就是马尔可夫性。你会说这个太理想了,你说得对,但是就算这个模型很理想,它也足以能够解决很多实际的问题。数学当中也是,有些人总是纠结这个模型好像和现实中不符,太过于简单化,不完美,不精确。但是你要真的用一个很精确的模型去做,你做得出来个鬼,根本得不到结果好嘛,所以不要纠结这个马尔可夫性是不是不完美,它是没问题的。
用数学表达就是:
P{X(m+1)=j|X(1)=i1,X(2)=i2,......X(m)=im}=P{X(m+1)=j|X(m)=im}
好了,比如现在我们知道当前时刻的状态,那么如何才能知道下一个时刻的状态呢?这就引出了一个转移矩阵,注意,这个矩阵是很关键的,因为它是整个状态转移的一个描述,假设有状态空间有n个状态,那么转移矩阵就是一个nxn的方阵,每一行相加为1,代表从一行转移到各个列代表状态的概率。
如果转移矩阵不依赖与初始时刻,那么这个Markov链就叫做齐次马尔可夫链。
马尔可夫链的各个节点的状态可以进行分类:常返态与非常返态,常返态又可以分为:零常返和正常返。其中有一些判定状态的理论,如fjj=1是正常返,fjj<1是零常返。这里面字符很多,关系很杂,可以看看下图。

简而言之呢,常返态就是能形成常返闭集的一些状态,而非常返,就是在一定次数转移之后,再也不会回来的状态。常返态的状态虽然要回来,但是如果平均回转时间有穷,那么是正常返,如果是无穷,则是零常返。
马尔可夫链的极限分布和平稳分布:
马尔可夫链的极限分布,就是马尔可夫链经过无限长时间的转移,达到的最终状态,这个状态之和转移矩阵有关,与初始状态无关。计算极限分布也很简单,因为在无限步转移之后,马尔可夫链再转移一步,它的状态不会改变,所以可以用 a* P =a;其中,a就是极限分布。这里有个条件,就是说对于不可约遍历链,极限分布就是平稳分布,并且还是唯一的平稳分布。而对于不可约非周期的markov链呢,(1)每一状态是正常返,则极限分布是平稳分布且唯一。(2)状态是非常返或零常返的,平稳分布不存在。
对于马尔可夫链的平稳分布有什么用处呢,大家如果听过MCMC算法(马尔可夫链蒙特卡洛算法)就知道,这个算法是通过构造平稳分布符合分布要求(P)的马尔可夫链,然后再从马尔可夫链中进行采样,这个样本应服从于分布P,于是通过得到的样本,可以推断概率图模型,达到近似推断的目的。

文章讲得粗浅,刚考完随机过程,小小总结一下,打公式也麻烦,只能将就看了。
The End。



http://chatgpt.dhexx.cn/article/si1MSnj7.shtml

相关文章

【算法学习】马尔可夫过程及经典例题讲解(含代码实现)

公众号关注 52DATA &#xff0c;获得更多数据分析知识,感谢支持—> 文章目录 马尔可夫过程1. 马尔可夫性2. 马尔可夫链2.1 转移概率矩阵&#xff08;随机矩阵&#xff09;2.2 状态概率2.3 平稳分布 3.一个很经典的例题帮助理解马尔科夫预测方法1.求状态转移概率2.运用状态概…

数学基础(8)-- 马尔可夫链与马尔可夫过程

目录 1. 简介 1.1 定义 1.2 变种 2. 瞬态演变 3. 马尔科夫链性质 3.1 可还原性 3.2 周期性 3.3 重现性 4. 有限状态空间 1. 简介 马尔可夫链&#xff08;英语&#xff1a;Markov chain&#xff09;&#xff0c;又称离散时间马可夫链&#xff08;discrete-time Markov…

部分可观测马尔可夫过程POMDP

POMDP与MDP的一句话区别&#xff1a;POMDP的state具有不确定性&#xff0c;由七元数组定义&#xff0c;多了观测空间、观测函数、初始置信&#xff08;belief&#xff09;&#xff0c;根据观测概率矩阵求出最可能是的状态 利用值迭代法解决POMDP问题 MDP POMDP 状态→动作 信…

马尔可夫 java_马尔可夫过程(以马尔科夫链Markov为例)

马尔可夫过程(以马尔科夫链Markov为例) 马尔可夫过程 马尔可夫过程的大概意思就是未来只与现在有关&#xff0c;与过去无关。 简单理解就是渣男只在乎下一刻会不会爱你只取决于这一时刻对你的新鲜感&#xff0c;而与你之前对这段感情的付出毫无关系。 设有一个随机过程X(t)&…

马尔可夫决策过程

马尔可夫决策过程 一、马尔科夫决策过程&#xff1a;**马尔科夫决策过程****最优决策**值迭代策略迭代MDP中的参数估计 二、代码实战&#xff1a;A、马尔可夫决策过程值迭代B、马尔可夫决策过程策略迭代C、马尔可夫决策过程动态规划版 参考文章 本文介绍了马尔可夫决策过程&…

随机过程第2讲——马尔可夫过程的应用

温习&#xff1a;随机过程第1讲——泊松过程的模拟与检验&#xff1a;https://blog.csdn.net/ChenQihome9/article/details/82871332 去得也突然——不知在什么时候&#xff0c;雨&#xff0c;悄悄地停了。风也屏住了呼吸&#xff0c;山中一下变得非常幽静。远处&#xff0c;一…

强化学习(2): 马尔可夫过程

前言 本文重点介绍MDP&#xff0c;因为MDP是目前最适合表征强化学习问题的模型。 一个具体的赌徒例子&#xff0c;来说明强化学习的算法如何与MDP构建联系&#xff0c;并且求解出最优策略。链接如下&#xff1a;link 一、马尔可夫性 其假设未来的状态仅取决与当前的状态。过…

贝叶斯网络、马尔可夫模型、马尔可夫过程、马尔可夫链、马尔可夫网络基本概念

知识储备与简要概括 可数集【Countable set】&#xff1a; 是指每个元素都能与自然数集N的每个元素之间能建立一一对应的集合。如果将可数集的每个元素标上与它对应的那个自然数记号&#xff0c;那么可数集的元素就可以按自然数的顺序排成一个无穷序列a1&#xff0c;a2&#…

强化学习笔记:马尔可夫过程 马尔可夫奖励过程

1 马尔可夫性质 &#xff08;Markov Property&#xff09; 我们设状态的历史为&#xff08;包含了之前的所有状态&#xff09; 如果一个状态转移是符合马尔可夫性质的&#xff0c;也就是满足如下条件&#xff1a; 也就是说&#xff0c;从当前状态转移到状态的概率&#xff0c;就…

马尔可夫性质、马尔可夫链和马尔可夫过程

关注&#xff1a;灰质&#xff0c;有趣有料的AI技术分享 前言 研究决策问题就一定听说过马尔可夫过程&#xff08;Markov Process&#xff09;&#xff0c;这是一类非常重要的方法。现在非常热门的强化学习都是基于马尔可夫过程方法建立的。马尔可夫决策过程是研究随机序贯决策…

1.3 马尔可夫过程

之前介绍的奖励、智能体、动作、观察和环境可以看成RL的一级概念。以此为基础&#xff0c;我们将探索RL的二级概念&#xff0c;包括状态&#xff08;state&#xff09;、事件&#xff08;episode&#xff09;、历史&#xff08;history&#xff09;、价值&#xff08;value&…

一文看懂马尔科夫过程

1.马尔科夫决策过程(MDPs)简介 马尔科夫决策过程是对强化学习(RL)问题的数学描述。几乎所有的RL问题都能通过MDPs来描述: 最优控制问题可以用MDPs来描述;部分观测环境可以转化成POMDPs;赌博机问题是只有一个状态的MDPs;注:虽然大部分DL问题都能转化为MDPs,但是以下所描述…

马尔可夫Markov决策过程 MDP、马尔可夫奖励过程MRP

引言 在概率论及统计学中&#xff0c;马尔可夫过程&#xff08;英语&#xff1a;Markov process&#xff09;是一个具备了马尔可夫性质的随机过程&#xff0c;因为俄国数学家安德雷马尔可夫得名。马尔可夫过程是不具备记忆特质的&#xff08;memorylessness&#xff09;。换言…

零基础学习python数据分析,需要掌握哪些技能?

对于刚刚入行的小白同学来说&#xff0c;在学习python的过程中&#xff0c;一定会遇到一些疑问。比如说&#xff1a; 学习Python需要多久&#xff1f; 学习Python需要达到什么样的程度&#xff1f; 学Python的书籍有哪些&#xff1f; 为了处理数据集&#xff0c;我需要精通…

Python数据分析期末复习归纳

python数据分析期末复习归纳&#xff08;更新中&#xff09; 文章目录 python数据分析期末复习归纳&#xff08;更新中&#xff09;前言一、python语言基础二、内建数据结构、函数、文件&#xff08;重点&#xff09;元组列表内建序列函数字典函数 三、Numpy基础&#xff08;重…

Python数据分析师特训营84节

刚看完了小破站的一个数据分析的课程&#xff1a; “2020年Python数据分析师特训营全套84节视频完结版&#xff08;就业向/零基础友好)” 趁着热乎劲儿&#xff0c;想记录一下课程讲到的关于python的基础知识&#xff0c;还有numpy、pandas、matplotlib(数据分析三大利器)工具…

Python数据分析:混淆矩阵

【小白从小学Python、C、Java】 【Python全国计算机等级考试】 【Python数据分析考试必会题】 ● 标题与摘要 Python数据分析 混淆矩阵 ● 选择题 以下关于混淆矩阵说法错误的是&#xff1a; A TP是被正确分类的正例个数 B FN是被错误分类的正例个数 C 主对角元素是不同类别样例…

Python数据分析和处理

数据的维度 从一个数据到一组数据:一个数据表达一个含义&#xff0c;一组数据表达一个或多个含义 维度&#xff1a;一组数据的组织形式 一维数据&#xff1a;由对等关系的有序或无序数据构成。采用线性方式组织 二维数据&#xff1a;由多个一维数据组成&#xff0c;是一维数…

Python数据分析之理论知识

文章目录 Python数据分析概述一、数据分析的概念1.广义数据分析2.数据挖掘 二、数据分析流程1. 需求分析&#xff1a;2. 数据获取3.数据预处理4.分析与建模5.模型评价与优化6. 分类模型评价指标7.回归模型8.部署 三、数据分析应用场景四、总思维导图 Python数据分析概述 一、数…

如何用Python进行数据分析,详细流程讲解!

1&#xff1a;为什么选择Python进行数据分析? Python是一门动态的、面向对象的脚本语言&#xff0c;同时也是一门简约&#xff0c;通俗易懂的编程语言。Python入门简单&#xff0c;代码可读性强&#xff0c;一段好的Python代码&#xff0c;阅读起来像是在读一篇外语文章。Pyt…