动态规划法的基本知识

article/2025/9/29 21:20:19

一、动态规划方法相关概念
1、20世纪50年代初美国数学家R.E.Bellman等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优性原理(principle of optimality),同时,把多阶段过程转化为一系列单阶段问题,利用各阶段之间的关系,逐个求解,创立了解决多阶段决策问题的优化方法------动态规划法
比如:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2、问题的求解过程可划分为若干阶段,每一阶段的决策仅依赖于前一阶段的状态,由决策所采取的动作使状态发生转移,成为下一阶段决策的依据。从而,一个决策序列(策略)在不断变化的状态中产生,这个过程称为多阶段决策过程
3、状态转移方程
在这里插入图片描述
4、最优决策序列
在这里插入图片描述
5、最优性原理
在这里插入图片描述
二、动态规划法的设计思想
1、动态规划法适用条件
①满足最优性原理:也称具有最优子结构性质,该问题的最优解中也包含其子问题的最优解
②重叠子问题:可分解为相互关联的若干子问题,子问题之间不独立,子问题的解在下一阶段决策中可能被使用。
无后效性:即某阶段状态一旦确定,就不受这个状态以后决策的影响。也就是说,某状态以后的过程不会影响以前的状态,只与当前状态有关

2、动态规划方法设计思想
利用最优子结构性质,把整个问题划分成一系列子问题,求各子问题的最优解,然后以自底向上的方式递归地从子问题的最优解构造出整个问题的最优解。
"填表”----构建数据结构,保存各子问题的最优解,以便求整个问题最优解
在这里插入图片描述
3、动态规划与分治法异同
●相同之处:
都是将待求解问题分解成若干个子问题,先求子问题的解,然后通过这些子问题的解获得整个问题的解。
●不同之处:
①分治法:子问题相互独立,否则重复求解,效率低。
②动态规划:各个子问题之间一般具有关联性,为了避免重复计算,动态规划方法对每个子问题仅求解一次,并将其结果"填表”,以后用到时直接存取。
比如:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
动态规划法求解斐波那契数列:

①为此避免重复设计,设计一个dp数组,dp[i]存放Fib(i)的值,首先设置dp[1]和dp[2]均为1,再让i从3到n循环以计算dp[3]到dp[n]的值,最后返回dp[n]即Fib1(n)。②其执行过程改变为自底向上,即先求出子问题解,将计算结果存放在一张表中,而且相同的子问题只计算一次,在后面需要时只需要简单查表,以避免大量的重复计算。
③算法的时间复杂度为O(n),空间复杂度为O(n)
④上述求斐波那契数列的算法属于动态规划法,其中数组dp(表)称为动态规划数组
4、空间优化方法——滚动数组

  • 在动态规划算法中,常用动态规划数组存放子问题的解,由于一般是存放连续的解,有时可以对数组的下标进行特殊处理,使每一次操作仅保留若干有用信息,新的元素不断循环刷新,看上去数组的空间被滚动地利用,这样的数组称为滚动数组(Scroll array)。
  • 采用滚动数组的主要目的是压缩存储空间的作用。
    在这里插入图片描述

三、动态规划法的设计步骤
(1)划分子问题(分段) :将整个问题分解为若干子问题,找到问题状态,子问题之间具有重叠(关联)关系;
(2)构建状态转移方程(分析) :关联的状态和状态之间相互转换关系。—动态规划法的关键;
(3)存储状态的值求解(填表): 设计表格(即数据结构),以自底向上的方式计算各个子问题的解并填表保存,实现动态规划过程。
动态规划过程一般求得问题的最优值(即目标函数的极值),如果要求最优解,通常在动态规划过程中记录必要信息,再根据依据这些信息构造最优解。
四、动态规划问题的俩种解法
对于有k个阶段的动态规划问题:

  • 逆序解法:从第k阶段到第1阶段的求解过程
  • 顺序解法:从第1阶段到第k阶段的求解过程

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
五、动态规划小结

  • 适用条件:满足最优性原理(即具有最优子结构性质)且子问题一般具有重叠性;
  • 设计思想:利用最优性原理,把原问题划分成一系列子问题,每个子问题属于决策过程的一个阶段,然后以自底向上的方式递归地从子问题的最优解构造出原问题的最优解。
  • 求解步骤:①划分子问题;②构建状态转移方程;③存储状态的值求解(填表)。
  • 两种解法:顺序解法和逆序解法
    在这里插入图片描述

http://chatgpt.dhexx.cn/article/lUVxaXV4.shtml

相关文章

动态规划法及其优化

在很多问题中,动态规划算法是我们的最优选择,比起递归算法,动态规划算法的时间复杂度和空间复杂度都更加优越,可以处理的数据规模更大。但是,动态优化算法的时间复杂度为O(N*V),也就…

算法设计与分析之动态规划法

文章目录 前言一、动态规划法概述二、动态规划法设计思想三、动态规划法的基本要素四、动态规划算法的设计步骤五、动态规划法与分治法六、动态规划法与贪心法七、动态规划法示例总结 前言 大家好,我是一只勤勤恳恳的程序猿。本篇文章小猿将跟您分享算法设计与分析中…

算法-动态规划法

动态规划是在20世纪50年代由美国数学家贝尔曼为研究最优控制问题而提出的,当该方法在应用数学中的价值被大家认同以后,在计算机学界,动态规划法成为一种通用的算法设计技术用来求解多阶段决策最优化问题。 所以,同学们&#xff0…

动态规划算法

一 动态规划算法 动态规划(Dynamic Programming)算法的核心思想是:将大问题划分为小问题进行解决,从而一步步获取最优解的处理算法。 动态规划算法与分治算法类似。其基本思想也是将待求解问题分解成若干个子问题,先求解子问题,…

经典中的经典算法:动态规划(详细解释,从入门到实践,逐步讲解)

动态规划的重要性就不多说,直接进入正题 首先,我们看一下官方定义:定义: 动态规划算法是通过拆分问题,定义问题状态和状态之间的关系,使得问题能够以递推(或者说分治)的方式去解决。 动态规划算法的基本思想与分治法类似&#xf…

目标检测中的多尺度特征结合方式

目录 简述 解构物体检测各个阶段 FPN的演进 1)无融合 2)自上而下单向融合 a)Faster/Master/Cascade RCNN中的FPN b)RetinaNet中的FPN c)Yolov3中的FPN 3)简单双向融合 4)复杂的双向融…

总结-CNN中的目标多尺度处理

Fly-AI竞赛服务平台 flyai.com 在开始学习之前推荐大家可以多在 FlyAI竞赛服务平台多参加训练和竞赛,以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,支持算法能力变现以及快…

【MFEN:轻量级多尺度特征提取:SR网络】

MFEN: Lightweight multi-scale feature extraction super-resolution network in embedded system (MFEN:嵌入式轻量级多尺度特征提取超分辨率网络) 深度卷积神经网络(CNN)在超分辨率(SR)方面…

深度学习笔记---多尺度网络结构归类总结

目录 1.什么是图像金字塔 1.1 高斯金字塔 ( Gaussian pyramid): 1.2 拉普拉斯金字塔(Laplacian pyramid) 1.3 DOG金字塔 2. 多尺度网络(MTCNN) 2.1 多尺度输入网络 2.2 多尺度特征融合网络 2.2.1 并行多分支网络 2.2.2 串行…

【边缘注意:深度多尺度特征】

Learning a Deep Multi-Scale Feature Ensemble and an Edge-Attention Guidance for Image Fusion (学习深度多尺度特征集成和图像融合的边缘注意指南) 在本文中,我们提出了一种用于红外和可见光图像融合的深度网络,该网络将具…

多尺度特征的提取

1、图像金字塔 将图片进行不同尺度的缩放,得到图像金字塔,然后对每层图片提取不同尺度的特征,得到特征图。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得&…

MSRN(多尺度超分辨率重建)

目前的研究倾向于使用更深层次的卷积神经网络来提高性能。然而,盲目增加网络深度不能有效改善网络。更糟糕的是,随着网络深度的增加,训练过程中出现了更多的问题,需要更多的训练技巧。在本文中,我们提出了一种新颖的多尺度残差网络 (MSRN) 来充分利用图像特征,该网络优于…

【multi_scale】多尺度训练——目标检测训练trick

文章目录 1 多尺度训练的介绍2 代码解析3 感谢链接 1 多尺度训练的介绍 多尺度训练对全卷积网络有效,在训练时,每隔一定的 iterations,在一定尺寸范围内,随机选取一种 img_size 进行训练。通过对不同尺度的图像进行训练&#xff…

“多尺度”目标检测问题

一、“多尺度”目标检测问题简介 在目标检测任务中,被测目标的大小经常是不固定的,自动驾驶相关检测任务可能要同时检测大卡车与小狗;工业质检相关检测任务可能要同时检测布料的大面积撕裂与小穿孔;医疗病灶检测任务可能要同时检测大小不一的病灶。在被测物体尺度相差极大…

图像多尺度技术

1197 多尺度图像技术也叫做多分辨率技术(MRA),指对图像采用多尺度的表达,并且在不同尺度下分别进行处理。这样做的理由是很多情况下在一种尺度中不容易看清的或者获取的特性在另外的某种尺度下就很容易发现或者是提取。所以多尺度…

目标检测中多尺度:特征金字塔FPN_Feature Pyramid Networks for Object Detection

原始内容来源于: https://blog.csdn.net/cdknight_happy/article/details/100528127 https://blog.csdn.net/WZZ18191171661/article/details/79494534 包含理解! 参考文献:https://arxiv.org/abs/1612.03144 代码实现:http://ww…

MViTv2 多尺度视觉Transformer

虽然VIT(vision transformer)模型提出后,Transformer在CV领域一路攻城拔寨,不断刷新由自己创下的记录,但VIT文章中所说明的视觉领域transformer很大程度上受transformer模型平方复杂度的限制而在大尺度图像上表现不佳的…

综述:目标检测中的多尺度检测方法

传统卷积网络通常采用从上到下的单行结构。对于大物体而言,其语义信息将出现在较深的特征图中;而对于小物体,其语义信息出现在较浅的特征图中,随着网络的加深,其细节信息可能会完全消失。 多尺度检测也是当今物体检测领…

【笔记】多尺度方法

1.定义 2.常用架构 2.1多尺度输入网络 2.2 多尺度特征融合网络 (1) 并行多分支结构 (2) 串行多分支结构 2.3 多尺度特征预测融合 2.4 多尺度特征和预测融合 3.具体方法 3.1 SNIP 3.2 SNIPER(SNIP的改进) 3.3 SSD 3.4 TridentNet(…

多尺度多目标检测之金字塔

在日常学习工作中,经常会碰到一个概念,那就是金字塔(pyramid),本文就该概念进行一定的阐述,具体如下: (1)图像金字塔 图像金字塔结构,即对图像进行一定比例…