【第1章】凸集——几种重要的凸集

article/2025/9/12 0:38:15

凸集——几种重要的凸集

  • 2.几种重要的凸集
    • 2.1 超平面与半空间
    • 2.2 球和椭球
    • 2.3 多面体(关注单纯形)
    • 2.4 半正定锥
    • 2.5参考


Date: 2020/04/11
Editor:萧潇子(Jesse)
Contact: 1223167600@qq.com


2.几种重要的凸集

本节讲述一些重要凸集的概念,首先介绍一些简单的例子,我们不妨先来看一些特例:

  • C = { x } C=\{x \} C={x} 单点
  • 点是仿射集,凸集,原点是凸锥
  • 空集是仿射集,凸集,凸锥

下面再来看几种重要的凸集:

  • R n R^n Rn 仿射集、凸集、凸锥
  • R n R^n Rn空间的子空间 仿射集、凸集、凸锥
  • 任意直线 仿射集、凸集、凸锥(过原点)
  • 任意线段 仿射集(点)、凸集、凸锥(原点)
  • { x 0 + θ v ∣ θ ≥ 0 } \{x_0+\theta v|\theta\ge0\} {x0+θvθ0} x 0 ∈ R n x_0\in R^n x0Rn θ ∈ R \theta \in R θR - v ∈ R n v\in R^n vRn 射线 仿射集(v=0缩减为一个点) 、凸集、凸锥(过原点)

2.1 超平面与半空间

超平面
定义: { x ∣ a T x = b } \{x|a^Tx=b\} {xaTx=b} x , a ∈ R n x,a\in R^n x,aRn, b ∈ R b\in R bR, a ≠ 0 a\neq0 a=0
性质: 仿射集、凸集、凸锥(过原点)

半空间
定义: a T x ≤ b , a T x ≥ b a^Tx\le b,\quad a^Tx\ge b aTxb,aTxb
性质: 凸集、凸锥(过原点b=0)

从上述对超平面和半空间集合表达式定义形式很难直观的感受定义与性质,下面我们通过在二维平面中的例子来理解一下超平面与半空间的几何意义,如下图所示:

  • 红色直线(不过原点)称之为一个二维平面上的超平面,具有直线集合所有的性质,属于仿射集、凸集;
  • 蓝色直线(过原点)为红色直线的特例,除了是仿射集/凸集之外,还是个凸锥;
  • 红色直线把二维平面分成了1和2两个空间,这两个空间称为半空间,并且满足凸集的定义,因此是半空间是凸集;
  • 与超平面一样,当超平面过原点时,半空间也满足凸锥的定义,此时半空间也是个凸锥;

在这里插入图片描述

2.2 球和椭球

同样以二维平面上的圆和椭圆去理解比较容易理解,这里就不做赘述,只给出简单定义:

定义:
B ( x c , r ) = { x ∣ ∥ x − x c ∥ 2 ≤ r } = { x ∣ ( x − x c ) T ( x − x c ) ≤ r } B(x_c,r)=\{x\:|\parallel x-x_c \parallel _2 \:\le r\}=\{x\:|\sqrt{(x-x_c)^T(x-x_c)}\le r\} B(xc,r)={xxxc2r}={x(xxc)T(xxc) r}
性质: 凸集 仿射集(r=0) 凸锥(r=0 & 原点)
椭球:
定义: (对称正定矩阵几何)
ξ ( x c , P ) = { x ∣ ( x − x c T ) P − 1 ( x − x c ) ≤ 1 } x c ∈ R n P ∈ S + + n \xi(x_c,P)=\{x\:| (x-x_c^T)P^{-1}(x-x_c) \:\le 1\} \: x_c\in R^n \: P\in S_{++}^{n} ξ(xc,P)={x(xxcT)P1(xxc)1}xcRnPS++n
性质: 凸集

假设: P = r 2 I n P=r^2I_n P=r2In, r ≠ 0 r\neq0 r=0 奇异值大于0

A矩阵 A T A A^TA ATA 特征值: e i g ( A T A ) ≥ 0 eig(A^TA) \ge0 eig(ATA)0 奇异值: e i g ( A T A ) \sqrt{eig(A^TA)} eig(ATA)

P P P 奇异值对应椭球半轴长

例子:
ξ = { x ∣ x T ( 4 0 0 1 ) − 1 x ≤ 1 } = { ( x 1 , x 2 ) ∣ 1 4 x 1 2 + x 2 2 ≤ 1 } \begin{aligned} \xi &=\{x\:| x^T\begin{pmatrix} 4 & 0\\ 0 & 1 \end{pmatrix}^{-1}x \:\le 1\}\\ &=\{(x_1,x_2)|\frac{1}{4}x_1^2+x_2^2 \le 1\} \end{aligned} ξ={xxT(4001)1x1}={(x1,x2)41x12+x221}

2.3 多面体(关注单纯形)

多面体:可以简单的理解为超平面与半空间的交集,数学表达式如下:
P = { x ∣ a j T x ≤ b j i = 1 ⋯ m c j T x = d j i = 1 ⋯ m } P=\Bigg\{x\:\mid \begin{aligned} a_j^Tx \le b_j\qquad i=1\cdots m\\ c_j^Tx = d_j \qquad i=1\cdots m\\ \end{aligned}\Bigg\} P={xajTxbji=1mcjTx=dji=1m}
其中有界多面体为凸集 ,如下图中集合P(阴影部分:由五条直线与其分割形成的相应半空间的交集)所示:

在这里插入图片描述

单纯形定义:

R n R^n Rn空间中选择 v 0 ⋯ v k v_0\cdots v_k v0vk k + 1 k+1 k+1个点, v 1 − v 0 , ⋯ , v k − v 0 v_1-v_0,\cdots,v_k-v_0 v1v0,,vkv0线性无关,则与上述点相关的单纯形为:

C = C o n v { v 0 ⋯ v k } = { θ 0 v 0 + θ 1 v 1 + θ 2 v 2 + ⋯ + θ k v k ∣ θ 0 ⋯ θ k ≥ 0 , θ 0 + ⋯ + θ k = 1 } C=Conv\{v_0\cdots v_k\}=\{\theta_0v_0+\theta_1v_1 + \theta_2v_2 + \cdots + \theta_kv_k \:|\: \theta_0 \cdots \theta_k \ge 0,\:\theta_0 +\cdots +\theta_k = 1 \} C=Conv{v0vk}={θ0v0+θ1v1+θ2v2++θkvkθ0θk0,θ0++θk=1}

例子:

  • R R R 一维空间, 两个点单纯形为两点连接线段,
  • R 2 R^2 R2 二维空间, 两个点单纯形为两点连接线段, 三个点为两个向量围成的三角形, 四个点无法满足线性无关的三个向量
  • R 3 R^3 R3 三维空间,四个点单纯形为一个四面体

证明:单纯形是多面体的一种

x ∈ C ∈ R n x\in C \in R^n xCRn C C C为单纯形 x x x ⇔ \Leftrightarrow θ 0 v 0 + θ 1 v 1 + θ 2 v 2 + ⋯ + θ k v k \theta_0v_0 + \theta_1v_1 + \theta_2v_2 + \cdots + \theta_kv_k θ0v0+θ1v1+θ2v2++θkvk

θ 0 ⋯ θ k ≥ 0 , θ 0 + ⋯ + θ k = 1 \theta_0 \cdots \theta_k \ge 0,\:\theta_0 +\cdots +\theta_k = 1 θ0θk0,θ0++θk=1. v 1 − v 0 , ⋯ , v k − v 0 v_1-v_0,\cdots,v_k-v_0 v1v0,,vkv0线性无关

首先定义下面两个向量:

[ θ 1 ⋯ θ k ] T = y [\theta_1 \cdots \theta_k]^T=y [θ1θk]T=y, y ≥ 0 y\ge0 y0, 1 T y ≤ 1 1^Ty\le1 1Ty1,

[ v 1 − v 0 , ⋯ , v k − v 0 ] = B ∈ R n × k [v_1-v_0, \cdots, v_k-v_0]=B\in R^{n\times k} [v1v0,,vkv0]=BRn×k

因此:

X ∈ C ⇔ X = θ 0 v 0 + θ 1 v 1 + θ 2 v 2 + ⋯ + θ k v k = v 0 + θ 1 ( v 1 − v 0 ) + ⋯ + θ k ( v k − v 0 ) = v 0 + B y \begin{aligned} X \in C \Leftrightarrow X &=\theta_0v_0 + \theta_1v_1 + \theta_2v_2 + \cdots + \theta_kv_k\\ &= v_0 + \theta_1(v_1-v_0)+ \cdots + \theta_k(v_k-v_0) \\ &= v_0 +By\\ \end{aligned} XCX=θ0v0+θ1v1+θ2v2++θkvk=v0+θ1(v1v0)++θk(vkv0)=v0+By

B包含k个线性无关的向量,因此: r a n k ( B ) = k ( k ≤ n ) rank(B)=k \quad (k \le n) rank(B)=k(kn)

B是列满秩矩阵,可以转换成: [ I k 0 ] \begin{bmatrix} I_k \\[0.3em] 0\end{bmatrix} [Ik0]

存在一个非奇异矩阵 A = [ A 1 A 2 ] ∈ R n × n A=\begin{bmatrix}A_1 \\[0.3em] A_2\end{bmatrix} \in R^{n \times n} A=[A1A2]Rn×n使得 A B = [ A 1 A 2 ] B = [ I k 0 ] AB=\begin{bmatrix}A_1 \\[0.3em] A_2\end{bmatrix}B =\begin{bmatrix} I_k \\[0.3em] 0\end{bmatrix} AB=[A1A2]B=[Ik0]

X = v 0 + B y X=v_0+By X=v0+By 左右两边同乘以 A A A 的:

A X = A v 0 + A B y AX =Av_0+ABy AX=Av0+ABy ⇔ \Leftrightarrow [ A 1 A 2 ] X = [ A 1 A 2 ] v 0 + [ A 1 B A 2 B ] y \begin{bmatrix}A_1 \\[0.3em] A_2\end{bmatrix}X=\begin{bmatrix}A_1 \\[0.3em] A_2\end{bmatrix}v_0+\begin{bmatrix}A_1B \\[0.3em] A_2B \end{bmatrix}y [A1A2]X=[A1A2]v0+[A1BA2B]y ⇔ \Leftrightarrow { A 1 X = A 1 v 0 + y A 2 X = A 2 v 0 \begin{cases} A_1X=A_1v_0+y \\ A_2X=A_2v_0 \\ \end{cases} {A1X=A1v0+yA2X=A2v0

⇔ \Leftrightarrow { A 1 X ≥ A 1 v 0 1 T A 1 X ≤ 1 + 1 T A 1 v 0 A 2 X = A 2 v 0 \begin{cases} A_1X &\ge A_1v_0 \\ 1^TA_1X &\le 1+ 1^TA_1v_0 \\ A_2X &=A_2v_0 \\ \end{cases} A1X1TA1XA2XA1v01+1TA1v0=A2v0

两个线性不等式和一个线性等式=多面体

2.4 半正定锥

对称矩阵集合 S n = { X ∈ R n × n ∣ X = X T } S^n=\{X\in R^{n\times n}|X=X^T\} Sn={XRn×nX=XT} 凸集 凸锥

对称半正定矩阵集合 S + n = { X ∈ R n × n ∣ X = X T , X ⪰ 0 } S_{+}^n=\{X\in R^{n\times n}|X=X^T,\: X \succeq 0\} S+n={XRn×nX=XT,X0} 其中 X ⪰ 0 X \succeq 0 X0表示特征值大于等于0 凸集 凸锥

对称正定矩阵集合 S + + n = { X ∈ R n × n ∣ X = X T , X ≻ 0 } S_{++}^n=\{X\in R^{n\times n}|X=X^T,\: X \succ 0\} S++n={XRn×nX=XT,X0} 其中 X ≻ 0 X \succ 0 X0表示 X X X是正定矩阵 凸集 非凸锥

证明 S + n S_{+}^n S+n 是凸集、凸锥

∀ θ 1 , θ 2 ≥ 0 \forall \theta_1, \: \theta_2 \: \ge 0 θ1,θ20 ∀ A , B ∈ S + n \forall \: A, \: B \in S_{+}^n A,BS+n 证明 θ 1 A + θ 2 B ∈ S + n \theta_1A+\theta_2B \in S_+^n θ1A+θ2BS+n 即证明 θ 1 A + θ 2 B \theta_1A+\theta_2B θ1A+θ2B 对称半正定

如果 A , B A, B A,B是半正定矩阵,则对于 ∀ X ∈ R n \forall X\in R^n XRn, X T A X ≥ 0 X T B X ≥ 0 \begin{aligned} X^TAX &\ge 0 \\ X^TBX &\ge 0 \\ \end{aligned} XTAXXTBX00

由上可知证明半正定即证明 X T ( θ 1 A + θ 2 B ) X ≥ 0 = X T θ 1 A X + X T θ 2 B X ≥ 0 X^T(\theta_1A+\theta_2B)X \ge 0=X^T \theta_1AX+X^T \theta_2BX \ge 0 XT(θ1A+θ2B)X0=XTθ1AX+XTθ2BX0

因此得证

考虑简单情况:

n = 1 n=1 n=1 时, S + n = R + S_+^n=R_+ S+n=R+ S + + n = R + + S_{++}^n=R_{++} S++n=R++ S n = R S^n=R Sn=R 可知对称正定矩阵 S + + n S_{++}^n S++n不包含原点,因此非凸锥


S + n S_+^n S+n n = 2 n=2 n=2 S + n = { [ x y y z ] ∣ x ≥ 0 , z ≥ 0 , x z ≥ y 2 } S_+^n=\Bigg\{\begin{bmatrix} x&y \\[0.3em] y&z\end{bmatrix} | x \ge 0,\:z\ge0,\: xz\ge y^2 \Bigg\} S+n={[xyyz]x0,z0,xzy2} 二维矩阵空间与xyz 三维空间可以对应起来, 如下图所示:

交集

S 1 , S 2 S_1,S_2 S1,S2为凸集,则 S 1 ⋂ S 2 S_1 \bigcap S_2 S1S2为凸

S a S_a Sa为凸集, ∀ a ∈ A \forall a\in A aA ⋂ a ∈ A S a \mathop{\bigcap} \limits_{a\in A} S_a aASa为凸集

在这里插入图片描述

2.5参考

1、Stephen Boyd 、Lieven Vandenberghe——《Convex Optimization》)
2、中科大凌青凸优化 (https://www.bilibili.com/video/BV1Jt411p7jE?)


http://chatgpt.dhexx.cn/article/einW3RJY.shtml

相关文章

凸集、凸函数及其充分必要条件

凸集的定义: 设集合 D⊂Rn D ⊂ R n ,若对于任意点 x,y∈D x , y ∈ D 及实数 α∈[0,1] α ∈ [ 0 , 1 ] ,都有 αx(1−α)y∈D α x ( 1 − α ) y ∈ D 则称集合 D D 为凸集。 由凸集的定义可以看出凸集的几何意义,对于非空集合D"…

凸函数与凸集

文章目录 1、凸集2、凸函数 对于《欠定线性系统与正则化》一节中的优化问题: ( P J ) : min ⁡ x J ( x ) s . t . b A x (P_J):\min \limits_{\bf x} J({\bf x})\quad {\rm s.t.} \quad{\bf bAx} (PJ​):xmin​J(x)s.t.bAx 只要 J ( ⋅ ) J(\cdot) J(⋅)为严格凸的…

凸集与凸函数

凸集的定义为: 其几何意义表示为:如果集合C中任意2个元素连线上的点也在集合C中,则C为凸集。其示意图如下所示: 常见的凸集有: n维实数空间;一些范数约束形式的集合;仿射子空间;凸集…

凸组合和凸集

前言 对无人机进行轨迹规划时,需要对可行空间进行数学表示,可行空间通常被表示为凸组合的形式。 结论 在 R n R^n Rn中的m个向量 a 1 , a 2 , a 3 , . . . . . , a m a_1,a_2,a_3,.....,a_m a1​,a2​,a3​,.....,am​的凸组合是它们在n维空间的最小凸…

凸集、凸函数与凸规划

文章目录 1 凸集2 凸函数2.1 凸函数性质2.2 一阶判别公式2.3 二阶判别公式 3 凸规划 1 凸集 设集合 S ⊂ R n S\subset \R^n S⊂Rn,若 S S S中任意两点连线仍属于 S S S,则 S S S称为凸集,即 x 1 λ ( x 2 − x 1 ) ∈ S \bm x_1 \lambda…

凸优化学习(二)——凸集

注意,本文内容来自于吴恩达老师cs229课堂笔记的中文翻译项目:https://github.com/Kivy-CN/Stanford-CS-229-CN 中的凸优化部分的内容进行翻译学习。 2. 凸集 我们从凸集的概念开始研究凸优化问题。 定义2.1 我们定义一个集合是凸的,当且仅当任意 x , y…

凸优化第一【凸集与凸优化简介】

【本文仅供学习记录,概无其他用处,一些图片资源来自网络,侵删】 凸优化是一个简单的优化问题,优化-数学规划概念相同,本课程主要学习的内容包括:凸集、凸函数、凸优化和有关凸优化的一些算法。 优化&…

凸优化笔记(一):仿射集,凸集与锥

一.直线和线段 设为空间中的两个点。 直线: 线段: 二.仿射集(Affine Set)凸集(Convex Set)和锥(Cones) 仿射集 仿射集:通过集合中任意两个不同点的直线仍然在集合C中…

【机器学习】凸集、凸函数、凸优化、凸优化问题、非凸优化问题概念详解

目录 1 基本概念2 凸优化问题3 非凸优化问题4 总结 1 基本概念 (1)凸集和非凸集 凸集是一个点集, 这个点集有一个性质, 就是在这个集合中任取不同的两个点x和y, 他们之间的线段(包括端点)上的点…

凸优化学习(一)凸集与凸函数、凸优化问题

4.1 凸集 convex sets 仿射集(Affine Sets):如果一个集合 C ∈ R n C\in\mathbb{R}^n C∈Rn 是仿射的,则在C中两点的直线也在C中,若 x 1 ∈ C , x 2 ∈ C , 则 x θ x 1 ( 1 − θ ) x 2 ∈ C , θ ∈ R x_1\in C,x…

【凸优化笔记二】凸函数基本性质和例子

【凸优化笔记二】凸函数基本性质和例子 凸函数的四个定义定义一定义二定义三定义四 一些栗子 凸函数的四个定义 定义一 其中 dom f f f 是函数 f f f 的 定义域(前域),为凸集——这个很重要,后面的一些定义中也会用到&#xff…

凸函数

凸函数有一个很好的性质,即只要能证明我们求解的问题是凸函数,最终得到的解一定是全局最优解 首先得注意一下: 中国大陆数学界某些机构关于函数凹凸性定义和国外的定义是相反的。Convex Function在中国大陆某些的数学书中,比如说…

最优化理论基础与方法学习笔记——凸集与凸函数以及手写定理证明

文章目录 凸集的定义凸集的几何意义有关凸集的定理 定理1.4.2内点、边界点和闭包的定义定义1.4.3 超平面的定义定理1.4.3 投影定理定理1.4.4 点与凸集的分离定理定理1.4.5 支撑超平面定理定义1.4.4 凸函数的定义定义1.4.5 水平集定理1.4.6 凸函数的水平集还是凸集定理1.4.7 函数…

凸优化 - 2 - 凸集和凸函数

本总结是是个人为防止遗忘而作,不得转载和商用。 前提说明:为了方便查阅,我将整个凸优化的内容分成了很多部分,因为后面的部分用到了前面的知识,所以,如果你的目的是查看后面的内容但对前面的某个知识点不甚…

凸和非凸的理解

目录 一句话概括一、凸和非凸的区别二、凸函数和非凸函数三、凸优化和非凸优化凸优化:常见的凸优化方法:凸优化的一般求解过程非凸优化: 一句话概括 凸(Convex):在该区间函数图象上的任意两点所连成的线段…

凸集与非凸集,凸函数与凹函数,凸优化

关于凸集与非凸集,凸函数与凹函数,凸优化的概念一直混淆,在此整理下相关定义和概念,希望给有需要的人。 凸集:集合中的任意两点连线的点都在该集合中,则称该集合为凸集;凹集为非凸集。 函数的…

最优化——凸集

引言 这是中科大最优化理论的笔记,中科大凌青老师的凸优化课程,详尽易懂,基础扎实。不论是初学者还是从业多年的人,都值得系统地好好学一遍。 本文介绍什么是凸集、凸包与凸锥包。 仿射集 我们先来看最简单的凸集——仿射集(A…

凸集

本文参考自清华大学研究生公共课教材——数学系列《最优化理论与算法》(第二版) 一:凸集 定义:设S为n维欧式空间中中的一个集合,若对S中任意两点,联结它们的线段仍属于S,称这样的集合S是一个凸…

凸集(Convex sets)

凸集(Convex sets) 1.仿射集和凸集 仿射集(Affine set): 定义:如果通过C中任意两个不同点的线位于C中,则集合C⊆Rn就是仿射 其中, 凸集(Convex set): 定义:如果C中的任意两点之间的…

【深度学习】logistic回归模型

目录 神经网络 数据、符号准备: logistic回归: 损失函数和代价函数: 梯度下降法: 向量化: 神经网络 我们学习深度学习的目的就是用于去训练神经网络,而神经网络是什么呢?我们先来看下面一…