凸优化学习(一)凸集与凸函数、凸优化问题

article/2025/9/12 2:52:28

4.1 凸集 convex sets

仿射集(Affine Sets):如果一个集合 C ∈ R n C\in\mathbb{R}^n CRn 是仿射的,则在C中两点的直线也在C中,若 x 1 ∈ C , x 2 ∈ C , 则 x = θ x 1 + ( 1 − θ ) x 2 ∈ C , θ ∈ R x_1\in C,x_2\in C,则x=\theta x_1+(1-\theta)x_2\ \in C,\theta \in R x1C,x2C,x=θx1+(1θ)x2 C,θR ,例如Ax=b的解集就是一个仿射集。

凸集:如果集合 C ∈ R n C\in\mathbb{R}^n CRn 是凸集,如果C中两点间的线段也在C中,即 x = θ x 1 + ( 1 − θ ) x 2 ∈ C , θ ∈ [ 0 , 1 ] x=\theta x_1+(1-\theta)x_2\ \in C,\theta \in [0,1] x=θx1+(1θ)x2 C,θ[0,1] 。注意 θ \theta θ 取值范围的不同。

常见的凸集:

  • 所有 R n \mathbb{R}^n Rn

  • 所有 R + n \mathbb{R}_+^n R+n

  • 超平面(Hyperplane): C = { x ∣ a T x = b } C=\{x|a^Tx=b\} C={xaTx=b} 既是仿射集又是凸集

  • 半空间(Halfspace) C = { x ∣ a T x ≥ b } 或 C = { x ∣ a T x ≤ b } C=\{x|a^Tx\ge b\}或C=\{x|a^Tx\le b\} C={xaTxb}C={xaTxb} 只是凸集

  • 范数球:满足 ∥ x ∥ p ≤ 1 , p ≥ 1 \|x\|_p \le 1,\quad p\ge1 xp1,p1的集合称为范数球。(依据范数的三角不等式可证)

    但是 ∥ x ∥ p = 1 , p ≥ 1 \|x\|_p = 1,\quad p\ge1 xp=1,p1 不是凸集。当 0 < p < 1 0<p<1 0<p<1 时, ∥ x ∥ p ≤ 1 \|x\|_p \le 1 xp1 也不是凸集。

  • 多面体(polyhedron):有限个半空间和超平面的交集。(凸集的交集是凸集)

    P = { x ∣ A x ≤ b , C x = d } , A ∈ R m × n , b ∈ R m , C ∈ R p ∗ n , d ∈ R p P=\{x|Ax\le b, Cx=d\},A\in R^{m\times n},b\in R^m, C \in R^{p*n}, d \in R^p P={xAxb,Cx=d},ARm×n,bRm,CRpn,dRp , 由于A,C都是矩阵,因此对应了有限个半空间和超平面。

凸集的性质:

凸集的交集是凸集。

凸集的并集不一定是凸集。

4.2 凸函数

一个函数 f : R n → R f:R^n \to R f:RnR 被称为凸函数,如果:

  1. f的定义域 d o m ( f ) dom(f) dom(f) 是凸集
  2. 对于任何 x , y ∈ d o m ( f ) , 0 ≤ θ ≤ 1 , 有 f ( θ x + ( 1 − θ ) y ) ≤ θ f ( x ) + ( 1 − θ ) f ( y ) x,y \in dom(f), 0\le \theta \le 1, 有f(\theta x+(1-\theta)y)\le \theta f(x)+(1-\theta)f(y) x,ydom(f),0θ1,f(θx+(1θ)y)θf(x)+(1θ)f(y)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9jtMZpXJ-1588902997776)(http://ovra6ykmb.bkt.clouddn.com/2018-06-27-17-11-42.png)]

几何解释:函数值小于连接函数值的线段的值。

凸函数的充要条件

一阶充要条件:$f(x_1)\ge f(x)+\nabla^Tf(x)(x_1-x) $ 对于所有 x 1 , x x_1,x x1,x 均成立。

二阶充要条件:如果函数f二阶可导,则凸函数的充要条件为: H ( x ) ⪰ 0 H(x) \succeq 0 H(x)0 即Hessian矩阵半正定。(如果是正定的,则是严格凸函数。半负定,则是凹函数)

在实际使用中,使用二阶充要条件比较好用。

证明:凸函数的局部最优解就是全局最优解

假定 x ∗ x^* x 是局部最优解,则在 x ∗ x^* x 的邻域内的点z有 f ( x ∗ ) ≤ f ( z ) f(x^*) \le f(z) f(x)f(z) 。假设y点为可行域内的任意一点,则 z = ( 1 − t ) x ∗ + t ) y , t ∈ [ 0 , 1 ] z=(1-t)x^*+t)y,\quad t\in [0,1] z=(1t)x+t)y,t[0,1] ,通过调整t的值,可以使得z保持在 x ∗ x^* x 的邻域内。根据凸函数定义:

f ( x ∗ ) ≤ f ( z ) = f ( t x ∗ + ( 1 − t ) y ) ≤ t f ( x ∗ ) + ( 1 − t ) f ( y ) f(x^*)\le f(z)=f(tx^*+(1-t)y)\le tf(x^*)+(1-t)f(y) f(x)f(z)=f(tx+(1t)y)tf(x)+(1t)f(y)

化简上面的不等式有: f ( x ∗ ) ≤ f ( y ) f(x^*) \le f(y) f(x)f(y)

由于y为任意一点,因此 x ∗ x^* x 也是全局最优解。

常见凸函数

  • ax+b: 既是凸函数,也是凹函数
  • x 2 x^2 x2 凸函数
  • e α x e^{\alpha x} eαx 凸函数
  • -log(x) 凸函数,x>0
  • − x l o g x , x ≥ 0 -xlogx,x\ge 0 xlogxx0 凸函数
  • f ( x ) = a T x + b f(x)=a^Tx+b f(x)=aTx+b 凸函数、凹函数
  • f ( x ) = x T P x + 2 q T x = r , 当 且 仅 当 P ⪰ 0 时 是 凸 函 数 f(x)=x^TPx+2q^Tx=r, 当且仅当P \succeq 0时是凸函数 f(x)=xTPx+2qTx=r,P0, 特别地 f ( x ) = x T x f(x)=x^Tx f(x)=xTx 是凸函数(2范数是凸函数)

凸函数的性质

  • f(x)是凸函数,则f(Ax+b)也是凸函数。例如 ∥ y − A x ∥ 2 \|y-Ax\|_2 yAx2

  • 如果g(x),h(x)是凸函数,h函数是非递减函数,则 f ( x ) = h ( g ( x ) ) f(x)=h(g(x)) f(x)=h(g(x)) 是凸函数。例如: g ( x ) = ∥ y − A x ∥ 2 , h ( x ) = x 2 在 x ≥ 0 上 非 递 减 g(x)=\|y-Ax\|_2,h(x)=x^2\quad在x\ge 0上非递减 g(x)=yAx2,h(x)=x2x0, 则 f ( x ) = ∥ y − A x ∥ 2 2 f(x)=\|y-Ax\|^2_2 f(x)=yAx22 是凸函数。

  • f 1 , . . . , f m f_1,...,f_m f1,...,fm 是凸函数, w 1 , . . . , w m ≥ 0 w_1,...,w_m\ge 0 w1,...,wm0 ,则$\sum_{i=1}^{m}w_if_i $ 是凸函数,例如:

    f ( x ) = ∥ y − A x ∥ 2 2 + λ ∥ x ∥ 2 2 f(x)=\|y-Ax\|^2_2+\lambda \|x\|^2_2 f(x)=yAx22+λx22 是凸函数。(L2正则化项)

  • 逐点最大: f 1 , . . . , f m f_1,...,f_m f1,...,fm 是凸函数,则 f ( x ) = m a x { f 1 ( x ) , . . . , f m ( x ) } f(x)=max\{f_1(x),...,f_m(x)\} f(x)=max{f1(x),...,fm(x)} 是凸函数。例如, f ( x , y ) f(x,y) f(x,y) 对于每个 y ∈ A y \in A yA 都是凸函数,则 s u p y ∈ A f ( x , y ) sup_{y\in A}f(x,y) supyAf(x,y) 是凸函数(f(x,y)的上确界,可以类比最大值)。

凸函数和凸集的关系

α \alpha α 水平集或下水平集

一元函数f的 α \alpha α 水平集为: S α = { x ∣ f ( x ) ≤ α } S_{\alpha}=\{x|f(x)\le \alpha\} Sα={xf(x)α}

如果f为凸函数,则 对每个 α {\alpha} α S α S_{\alpha} Sα都是凸集。反之则不成立。

4.3 凸优化问题

对于一般优化问题:
m i n i m i z e f 0 ( x ) s u b j e c t t o f i ( x ) ≤ 0 f o r i = 1 , 2 , . . . , m h i ( x ) = 0 f o r i = 1 , 2 , . . . , p \begin{array}{l}minimize & f_0(x)\\subject to & f_i(x)\le 0 \quad for i=1,2,...,m\\&h_i(x)=0 \quad for i=1,2,...,p\end{array} minimizesubjecttof0(x)fi(x)0fori=1,2,...,mhi(x)=0fori=1,2,...,p
如果 f 0 ( x ) f_0(x) f0(x) 是凸函数,且可行域是凸集,则上述优化问题是凸优化问题。因此,凸优化问题是在凸集上极小化一个凸的目标函数

凸优化问题要求(可行域是凸集):

  • 不等式约束函数必须是凸的。(若 f i ( x ) f_i(x) fi(x) 是凸函数,则不等式约束为下水平集,是凸集。)
  • 等式约束函数必须是仿射的。

凸优化问题的最优值写为: p ∗ = m i n { f 0 ( x ) : f i ( x ) ≤ 0 , h i ( x ) = 0 } p^*=min\{f_0(x):f_i(x) \le 0,h_i(x)=0\} p=min{f0(x):fi(x)0,hi(x)=0} ,可能的取值为:

  • p ∗ = + ∞ p^*=+\infty p=+ 不可行(可行域为空集)
  • p ∗ = − ∞ p^*=-\infty p= 称为unbounded below (存在可行点使得 f 0 ( x ) → ∞ f_0(x) \to \infty f0(x) )
  • f 0 ( x ∗ ) = p ∗ f_0(x^*)=p^* f0(x)=p

凸优化问题的重要结论

凸优化问题局部最优就是全局最优

局部最优点x指:存在 R > 0 R>0 R>0 ,对于所有可行点z,且有 ∥ x − z ∥ 2 ≤ R \|x-z\|_2 \le R xz2R ,满足 f 0 ( x ) ≤ f 0 ( z ) f_0(x) \le f_0(z) f0(x)f0(z)

全局最优点x指,对于所有可行点,满足 f 0 ( x ) ≤ f 0 ( z ) f_0(x) \le f_0(z) f0(x)f0(z)

反证法证明

x ∗ x^* x 是凸优化问题的局部最优点,假设存在一点 x ′ x' x 使得 f 0 ( x ∗ ) > f 0 ( x ′ ) f_0(x^*) \gt f_0(x') f0(x)>f0(x) ,则由于 f 0 f_0 f0 是凸函数:

f 0 ( t x ∗ + ( 1 − t ) x ′ ) ≤ t f ( x ∗ ) + ( 1 − t ) f ( x ′ ) f_0(tx^*+(1-t)x')\le tf(x^*)+(1-t)f(x') f0(tx+(1t)x)tf(x)+(1t)f(x)

当(1-t)很小时, ∥ x − ( t x ∗ + ( 1 − t ) x ′ ) ∥ 2 ≤ R \|x-(tx^*+(1-t)x')\|_2\le R x(tx+(1t)x)2R ,则$f_0(x^)\le f_0(tx^+(1-t)x’) $

可以得到 f 0 ( x ∗ ) ≤ f 0 ( x ′ ) f_0(x^*)\le f_0(x') f0(x)f0(x) ,这与假设条件相违背,因此,不存在一点 x ′ x' x 使得 f 0 ( x ∗ ) > f 0 ( x ′ ) f_0(x^*) \gt f_0(x') f0(x)>f0(x),即 x ∗ x^* x 是全局最优点。

典型凸优化问题

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-W4vgZlac-1588902997779)(http://ovra6ykmb.bkt.clouddn.com/2018-06-27-18-23-58.png)]

实例

形式转换成凸优化问题

将本质是凸优化问题的问题,从形式上转换为凸优化问题。

对于以下问题,通过定义矩阵和向量的方式,转换为标准的凸优化问题,便于利用软件包进行求解。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fhQjfYdO-1588902997781)(http://ovra6ykmb.bkt.clouddn.com/2018-06-27-18-54-10.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gLLklZ5P-1588902997783)(http://ovra6ykmb.bkt.clouddn.com/2018-06-27-18-54-27.png)]

CVX软件包


欢迎关注
奇而思


http://chatgpt.dhexx.cn/article/5iHJIUqu.shtml

相关文章

【凸优化笔记二】凸函数基本性质和例子

【凸优化笔记二】凸函数基本性质和例子 凸函数的四个定义定义一定义二定义三定义四 一些栗子 凸函数的四个定义 定义一 其中 dom f f f 是函数 f f f 的 定义域&#xff08;前域&#xff09;&#xff0c;为凸集——这个很重要&#xff0c;后面的一些定义中也会用到&#xff…

凸函数

凸函数有一个很好的性质&#xff0c;即只要能证明我们求解的问题是凸函数&#xff0c;最终得到的解一定是全局最优解 首先得注意一下&#xff1a; 中国大陆数学界某些机构关于函数凹凸性定义和国外的定义是相反的。Convex Function在中国大陆某些的数学书中&#xff0c;比如说…

最优化理论基础与方法学习笔记——凸集与凸函数以及手写定理证明

文章目录 凸集的定义凸集的几何意义有关凸集的定理 定理1.4.2内点、边界点和闭包的定义定义1.4.3 超平面的定义定理1.4.3 投影定理定理1.4.4 点与凸集的分离定理定理1.4.5 支撑超平面定理定义1.4.4 凸函数的定义定义1.4.5 水平集定理1.4.6 凸函数的水平集还是凸集定理1.4.7 函数…

凸优化 - 2 - 凸集和凸函数

本总结是是个人为防止遗忘而作&#xff0c;不得转载和商用。 前提说明&#xff1a;为了方便查阅&#xff0c;我将整个凸优化的内容分成了很多部分&#xff0c;因为后面的部分用到了前面的知识&#xff0c;所以&#xff0c;如果你的目的是查看后面的内容但对前面的某个知识点不甚…

凸和非凸的理解

目录 一句话概括一、凸和非凸的区别二、凸函数和非凸函数三、凸优化和非凸优化凸优化&#xff1a;常见的凸优化方法&#xff1a;凸优化的一般求解过程非凸优化&#xff1a; 一句话概括 凸&#xff08;Convex&#xff09;&#xff1a;在该区间函数图象上的任意两点所连成的线段…

凸集与非凸集,凸函数与凹函数,凸优化

关于凸集与非凸集&#xff0c;凸函数与凹函数&#xff0c;凸优化的概念一直混淆&#xff0c;在此整理下相关定义和概念&#xff0c;希望给有需要的人。 凸集&#xff1a;集合中的任意两点连线的点都在该集合中&#xff0c;则称该集合为凸集&#xff1b;凹集为非凸集。 函数的…

最优化——凸集

引言 这是中科大最优化理论的笔记&#xff0c;中科大凌青老师的凸优化课程&#xff0c;详尽易懂&#xff0c;基础扎实。不论是初学者还是从业多年的人&#xff0c;都值得系统地好好学一遍。 本文介绍什么是凸集、凸包与凸锥包。 仿射集 我们先来看最简单的凸集——仿射集(A…

凸集

本文参考自清华大学研究生公共课教材——数学系列《最优化理论与算法》&#xff08;第二版&#xff09; 一&#xff1a;凸集 定义&#xff1a;设S为n维欧式空间中中的一个集合&#xff0c;若对S中任意两点&#xff0c;联结它们的线段仍属于S&#xff0c;称这样的集合S是一个凸…

凸集(Convex sets)

凸集&#xff08;Convex sets&#xff09; 1.仿射集和凸集 仿射集(Affine set)&#xff1a; 定义&#xff1a;如果通过C中任意两个不同点的线位于C中&#xff0c;则集合C⊆Rn就是仿射 其中&#xff0c; 凸集(Convex set)&#xff1a; 定义&#xff1a;如果C中的任意两点之间的…

【深度学习】logistic回归模型

目录 神经网络 数据、符号准备&#xff1a; logistic回归&#xff1a; 损失函数和代价函数&#xff1a; 梯度下降法&#xff1a; 向量化&#xff1a; 神经网络 我们学习深度学习的目的就是用于去训练神经网络&#xff0c;而神经网络是什么呢&#xff1f;我们先来看下面一…

十分钟理解logistic回归原理

关于逻辑回归的分类算法&#xff0c;很多书籍都有介绍&#xff0c;比较来看&#xff0c;还是**李航老师的书《统计学习方法》**里介绍的更清楚&#xff0c;若大家有时间&#xff0c;请不要偷懒&#xff0c;还是建议从头开始看李航老师的书&#xff0c;这本书简洁明了&#xff0…

python数据挖掘学习笔记——logistic逻辑回归实现

Logistic逻辑回归分析 logistic模型的基本介绍python中实现logistic回归模型的评价混淆矩阵ROC曲线&#xff0c;AUC值 Logistic模型是经典的用于分类问题的模型&#xff0c;通常用于判断一件事物的好坏或将其分类。本文着重介绍logistic模型的在二分类上的应用&#xff0c;对于…

logistic回归分类与softmax回归

目录 Logistic回归 逻辑回归的定义式&#xff1a; 损失函数 梯度下降 Logistic回归防止过拟合&#xff1a; Softmax回归&#xff1a; loss函数 逻辑回归与Softmax回归的联系 与神经网络的关系 logistic回归&#xff08;多分类&#xff09;和softmax的关系&#xff1a…

spss-logistic回归

logistic回归的因变量可以是二分类的&#xff0c;也可以是多分类的&#xff0c;但是二分类的更为常用&#xff0c;也更加容易解释&#xff0c;多类可以使用softmax方法进行处理。 Logistic回归分析也用于研究影响关系&#xff0c;即X对于Y的影响情况。Y为定类数据&#xff0c;…

logistic回归——PYTHON实现

logistic回归——PYTHON实现 概述&#xff1a; ​ logistic回归又称logistic回归分析&#xff0c;是一种线性回归模型。logistic回归应用最广泛的是处理二分类问题。比如&#xff0c;探讨引发疾病的危险因素&#xff0c;判断该病人是否患有该病&#xff1b;探讨房价的涨跌&am…

二项logistic回归案例分析(附操作数据)

当因变量数据类型为分类变量时&#xff0c;线性回归不再适用&#xff0c;应当做logistic回归。根据因变量分类水平的不同&#xff0c;具体包括二项logistic回归、多项logistic回归和有序logistic回归。 1.案例背景与分析策略 1.1 案例背景介绍 现收集到银行贷款客户的个人、…

Logistic回归--实例

逻辑回归 Logistic回归一种二分类算法&#xff0c;它利用的是Sigmoid函数阈值在[0,1]这个特性。Logistic回归进行分类的主要思想是&#xff1a;根据现有数据对分类边界线建立回归公式&#xff0c;以此进行分类。其实&#xff0c;Logistic本质上是一个基于条件概率的判别模型(D…

SPSS(八)logistic回归(图文+数据集)

SPSS&#xff08;八&#xff09;logistic回归 我们之前的线性回归也好、线性回归衍生方法也好、非线性回归也好&#xff0c;因变量的类型都是连续性的&#xff0c;假如因变量的类型是分类的呢&#xff1f;logistic回归针对的是二分类的因变量 logistic回归 基于线性回归模型…

2.2、logistic回归

一、什么是logistics回归 首先我们先要了解回归的概念&#xff0c;现有一些数据点&#xff0c;我们用 一条直线对这些点进行拟合&#xff0c;该线称为最佳拟合直线&#xff0c;这个拟合过程就称作回归。logistic回归虽然说是回归&#xff0c;但确是为了解决分类问题&#xff0…

Logistic Regression(逻辑回归)详细讲解

Logistic Regression(逻辑回归) 以前在学校学到Logistic Regression的时候&#xff0c;虽然最后会使用&#xff0c;但是对于许多地方有很多的疑惑&#xff0c;今天在这里详细梳理一下Logistic Regression的过程&#xff1a; Logistic Regression逻辑回归 回归的思想Logistic R…