凸集、凸函数及其充分必要条件

article/2025/9/12 0:35:49

凸集的定义:

设集合 DRn D ⊂ R n ,若对于任意点 x,yD x , y ∈ D 及实数 α[0,1] α ∈ [ 0 , 1 ] ,都有 αx+(1α)yD α x + ( 1 − α ) y ∈ D
则称集合 D D 为凸集。
由凸集的定义可以看出凸集的几何意义,对于非空集合D,连接 D D 中任意两点x,y的线段仍属于该集合,则该集合 D D 是凸集。
图1所示的图形是凸集,图2显示的图形是非凸集。
这里写图片描述
这里写图片描述

凸函数定义:

设函数f(x)定义在凸集 DRn D ⊂ R n 上,若对于任意的 x,yD x , y ∈ D 及任意实数 α[0,1] α ∈ [ 0 , 1 ] ,都有 f[αx+(1α)y]αf(x)+(1α)f(y) f [ α x + ( 1 − α ) y ] ≤ α f ( x ) + ( 1 − α ) f ( y ) ,则称 f(x) f ( x ) 为凸集 D D 上的凸函数。

凸函数的充分必要条件:

(一阶条件)

设在凸集DRn f(x) f ( x ) 可微,则 f(x) f ( x ) D D 上为凸函数的充分必要条件是对任意的x,yD都有 f(y)f(x)+f(x)T(yx) f ( y ) ≥ f ( x ) + ∇ f ( x ) T ( y − x )
证明:
必要性。 设 f(x) f ( x ) D D 上的凸函数。任取x,yD α[0,1] α ∈ [ 0 , 1 ] ,有

f[αy+(1α)x]αf(y)+(1α)f(x) f [ α y + ( 1 − α ) x ] ≤ α f ( y ) + ( 1 − α ) f ( x )

f[x+α(yx)]f(x)+α[f(y)f(x)] f [ x + α ( y − x ) ] ≤ f ( x ) + α [ f ( y ) − f ( x ) ]

由泰勒公式有
f[x+α(yx)]=f(x)+αf(x)T(yx)+o(α(yx)) f [ x + α ( y − x ) ] = f ( x ) + α ∇ f ( x ) T ( y − x ) + o ( ‖ α ( y − x ) ‖ )

代入上式得

f(y)f(x)f(x)T(yx)+o(α(yx))α f ( y ) − f ( x ) ≥ ∇ f ( x ) T ( y − x ) + o ( ‖ α ( y − x ) ‖ ) α

上式两端取极限,令 α0 α → 0

f(y)f(x)+f(x)T(yx) f ( y ) ≥ f ( x ) + ∇ f ( x ) T ( y − x )

充分性。因为 D D 为凸集,所以设任意的x,yD α[0,1] α ∈ [ 0 , 1 ] ,则 αx+(1α)yD α x + ( 1 − α ) y ∈ D

αx+(1α)y=z α x + ( 1 − α ) y = z ,有

f(x)f(z)f(z)T(xz)f(y)f(z)f(z)T(yz) f ( x ) − f ( z ) ≥ ∇ f ( z ) T ( x − z ) f ( y ) − f ( z ) ≥ ∇ f ( z ) T ( y − z )

α,1α α , 1 − α 分别乘上面两式得

α[f(x)f(z)]αf(z)T(xz)(1α)[f(y)f(z)](1α)f(z)T(yz) α [ f ( x ) − f ( z ) ] ≥ α ∇ f ( z ) T ( x − z ) ( 1 − α ) [ f ( y ) − f ( z ) ] ≥ ( 1 − α ) ∇ f ( z ) T ( y − z )

相加并整理得

α[f(x)f(z)]+(1α)[f(y)f(z)]αf(z)T(xz)+(1α)f(z)T(yz)αf(x)αf(z)+f(y)f(z)αf(y)+αf(z)f(z)T[αxαz+yzαy+αz]αf(x)+(1α)f(y)f(z)f(z)T[αx+(1α)yz]=0αf(x)+(1α)f(y)f(z) α [ f ( x ) − f ( z ) ] + ( 1 − α ) [ f ( y ) − f ( z ) ] ≥ α ∇ f ( z ) T ( x − z ) + ( 1 − α ) ∇ f ( z ) T ( y − z ) α f ( x ) − α f ( z ) + f ( y ) − f ( z ) − α f ( y ) + α f ( z ) ≥ ∇ f ( z ) T [ α x − α z + y − z − α y + α z ] α f ( x ) + ( 1 − α ) f ( y ) − f ( z ) ≥ ∇ f ( z ) T [ α x + ( 1 − α ) y − z ] = 0 α f ( x ) + ( 1 − α ) f ( y ) ≥ f ( z )

αf(x)+(1α)f(y)f[αx+(1α)y] α f ( x ) + ( 1 − α ) f ( y ) ≥ f [ α x + ( 1 − α ) y ]
f(x) f ( x ) D D 上是凸函数。

(二阶条件)

设在开凸集DRn f(x) f ( x ) 二阶可微,则 f(x) f ( x ) D D 内的凸函数的充分必要条件为在D内任意一点 x x 处,f(x)的海色(Hesse)矩阵 G(x) G ( x ) 半正定,其中

G(x)=2f(x)=2fx122fx1x22fx1xn2fx2x12fx222fx2xn2fxnx12fxnx22fxn2 G ( x ) = ∇ 2 f ( x ) = [ ∂ 2 f ∂ x 1 2 ∂ 2 f ∂ x 1 ∂ x 2 ⋯ ∂ 2 f ∂ x 1 ∂ x n ∂ 2 f ∂ x 2 ∂ x 1 ∂ 2 f ∂ x 2 2 ⋯ ∂ 2 f ∂ x 2 ∂ x n ⋮ ⋮ ⋮ ∂ 2 f ∂ x n ∂ x 1 ∂ 2 f ∂ x n ∂ x 2 ⋯ ∂ 2 f ∂ x n 2 ]

证明:
必要性。任取 xD x ∈ D yRn(y0) y ∈ R n ( y ≠ 0 ) ,因为 D D 为开集,所以存在ε>0,当 α[ε,ε] α ∈ [ − ε , ε ] 时, x+αyD x + α y ∈ D ,由一阶条件可得

f(x+αy)f(x)+αf(x)Ty f ( x + α y ) ≥ f ( x ) + α ∇ f ( x ) T y

由泰勒公式有

f(x+αy)=f(x)+αf(x)Ty+12α2yTG(x)y+o(α2) f ( x + α y ) = f ( x ) + α ∇ f ( x ) T y + 1 2 α 2 y T G ( x ) y + o ( α 2 )

由此可得

12α2yTG(x)y+o(α2)0 1 2 α 2 y T G ( x ) y + o ( α 2 ) ≥ 0

所以

yTG(x)y+o(α2)α20 y T G ( x ) y + o ( α 2 ) α 2 ≥ 0

α0 α → 0 ,取极限得

yTG(x)y0 y T G ( x ) y ≥ 0

G(x) G ( x ) 半正定。

充分性。任取 x,yD x , y ∈ D ,因为 G(x) G ( x ) 半正定,由泰勒公式可得

f(y)=f(x)+f(x)T(yx)+12(yx)TG(ξ)(yx)f(x)+f(x)T(yx) f ( y ) = f ( x ) + ∇ f ( x ) T ( y − x ) + 1 2 ( y − x ) T G ( ξ ) ( y − x ) ≥ f ( x ) + ∇ f ( x ) T ( y − x )

其中 ξ=x+α(yx),α(0,1) ξ = x + α ( y − x ) , α ∈ ( 0 , 1 )
由一阶条件可得 f(x) f ( x ) 为凸函数。


http://chatgpt.dhexx.cn/article/VhsRuyLa.shtml

相关文章

凸函数与凸集

文章目录 1、凸集2、凸函数 对于《欠定线性系统与正则化》一节中的优化问题: ( P J ) : min ⁡ x J ( x ) s . t . b A x (P_J):\min \limits_{\bf x} J({\bf x})\quad {\rm s.t.} \quad{\bf bAx} (PJ​):xmin​J(x)s.t.bAx 只要 J ( ⋅ ) J(\cdot) J(⋅)为严格凸的…

凸集与凸函数

凸集的定义为: 其几何意义表示为:如果集合C中任意2个元素连线上的点也在集合C中,则C为凸集。其示意图如下所示: 常见的凸集有: n维实数空间;一些范数约束形式的集合;仿射子空间;凸集…

凸组合和凸集

前言 对无人机进行轨迹规划时,需要对可行空间进行数学表示,可行空间通常被表示为凸组合的形式。 结论 在 R n R^n Rn中的m个向量 a 1 , a 2 , a 3 , . . . . . , a m a_1,a_2,a_3,.....,a_m a1​,a2​,a3​,.....,am​的凸组合是它们在n维空间的最小凸…

凸集、凸函数与凸规划

文章目录 1 凸集2 凸函数2.1 凸函数性质2.2 一阶判别公式2.3 二阶判别公式 3 凸规划 1 凸集 设集合 S ⊂ R n S\subset \R^n S⊂Rn,若 S S S中任意两点连线仍属于 S S S,则 S S S称为凸集,即 x 1 λ ( x 2 − x 1 ) ∈ S \bm x_1 \lambda…

凸优化学习(二)——凸集

注意,本文内容来自于吴恩达老师cs229课堂笔记的中文翻译项目:https://github.com/Kivy-CN/Stanford-CS-229-CN 中的凸优化部分的内容进行翻译学习。 2. 凸集 我们从凸集的概念开始研究凸优化问题。 定义2.1 我们定义一个集合是凸的,当且仅当任意 x , y…

凸优化第一【凸集与凸优化简介】

【本文仅供学习记录,概无其他用处,一些图片资源来自网络,侵删】 凸优化是一个简单的优化问题,优化-数学规划概念相同,本课程主要学习的内容包括:凸集、凸函数、凸优化和有关凸优化的一些算法。 优化&…

凸优化笔记(一):仿射集,凸集与锥

一.直线和线段 设为空间中的两个点。 直线: 线段: 二.仿射集(Affine Set)凸集(Convex Set)和锥(Cones) 仿射集 仿射集:通过集合中任意两个不同点的直线仍然在集合C中…

【机器学习】凸集、凸函数、凸优化、凸优化问题、非凸优化问题概念详解

目录 1 基本概念2 凸优化问题3 非凸优化问题4 总结 1 基本概念 (1)凸集和非凸集 凸集是一个点集, 这个点集有一个性质, 就是在这个集合中任取不同的两个点x和y, 他们之间的线段(包括端点)上的点…

凸优化学习(一)凸集与凸函数、凸优化问题

4.1 凸集 convex sets 仿射集(Affine Sets):如果一个集合 C ∈ R n C\in\mathbb{R}^n C∈Rn 是仿射的,则在C中两点的直线也在C中,若 x 1 ∈ C , x 2 ∈ C , 则 x θ x 1 ( 1 − θ ) x 2 ∈ C , θ ∈ R x_1\in C,x…

【凸优化笔记二】凸函数基本性质和例子

【凸优化笔记二】凸函数基本性质和例子 凸函数的四个定义定义一定义二定义三定义四 一些栗子 凸函数的四个定义 定义一 其中 dom f f f 是函数 f f f 的 定义域(前域),为凸集——这个很重要,后面的一些定义中也会用到&#xff…

凸函数

凸函数有一个很好的性质,即只要能证明我们求解的问题是凸函数,最终得到的解一定是全局最优解 首先得注意一下: 中国大陆数学界某些机构关于函数凹凸性定义和国外的定义是相反的。Convex Function在中国大陆某些的数学书中,比如说…

最优化理论基础与方法学习笔记——凸集与凸函数以及手写定理证明

文章目录 凸集的定义凸集的几何意义有关凸集的定理 定理1.4.2内点、边界点和闭包的定义定义1.4.3 超平面的定义定理1.4.3 投影定理定理1.4.4 点与凸集的分离定理定理1.4.5 支撑超平面定理定义1.4.4 凸函数的定义定义1.4.5 水平集定理1.4.6 凸函数的水平集还是凸集定理1.4.7 函数…

凸优化 - 2 - 凸集和凸函数

本总结是是个人为防止遗忘而作,不得转载和商用。 前提说明:为了方便查阅,我将整个凸优化的内容分成了很多部分,因为后面的部分用到了前面的知识,所以,如果你的目的是查看后面的内容但对前面的某个知识点不甚…

凸和非凸的理解

目录 一句话概括一、凸和非凸的区别二、凸函数和非凸函数三、凸优化和非凸优化凸优化:常见的凸优化方法:凸优化的一般求解过程非凸优化: 一句话概括 凸(Convex):在该区间函数图象上的任意两点所连成的线段…

凸集与非凸集,凸函数与凹函数,凸优化

关于凸集与非凸集,凸函数与凹函数,凸优化的概念一直混淆,在此整理下相关定义和概念,希望给有需要的人。 凸集:集合中的任意两点连线的点都在该集合中,则称该集合为凸集;凹集为非凸集。 函数的…

最优化——凸集

引言 这是中科大最优化理论的笔记,中科大凌青老师的凸优化课程,详尽易懂,基础扎实。不论是初学者还是从业多年的人,都值得系统地好好学一遍。 本文介绍什么是凸集、凸包与凸锥包。 仿射集 我们先来看最简单的凸集——仿射集(A…

凸集

本文参考自清华大学研究生公共课教材——数学系列《最优化理论与算法》(第二版) 一:凸集 定义:设S为n维欧式空间中中的一个集合,若对S中任意两点,联结它们的线段仍属于S,称这样的集合S是一个凸…

凸集(Convex sets)

凸集(Convex sets) 1.仿射集和凸集 仿射集(Affine set): 定义:如果通过C中任意两个不同点的线位于C中,则集合C⊆Rn就是仿射 其中, 凸集(Convex set): 定义:如果C中的任意两点之间的…

【深度学习】logistic回归模型

目录 神经网络 数据、符号准备: logistic回归: 损失函数和代价函数: 梯度下降法: 向量化: 神经网络 我们学习深度学习的目的就是用于去训练神经网络,而神经网络是什么呢?我们先来看下面一…

十分钟理解logistic回归原理

关于逻辑回归的分类算法,很多书籍都有介绍,比较来看,还是**李航老师的书《统计学习方法》**里介绍的更清楚,若大家有时间,请不要偷懒,还是建议从头开始看李航老师的书,这本书简洁明了&#xff0…