凸函数

article/2025/9/12 2:43:55

凸函数有一个很好的性质,即只要能证明我们求解的问题是凸函数,最终得到的解一定是全局最优解

首先得注意一下:
中国大陆数学界某些机构关于函数凹凸性定义和国外的定义是相反的。Convex Function在中国大陆某些的数学书中,比如说我上大学那会同济版的高等数学就是指凹函数。Concave Function指凸函数。
如在讲到函数凹凸性的时候,概念是这么给出的:
设f(x)在[a,b]上连续,在(a,b)内具有一阶和二阶导数,那么,
(1)若在(a,b)内f”(x)>0,则f(x)在[a,b]上的图形是凹的;
(2)若在(a,b)内f”(x)<0,则f(x)在[a,b]上的图形是凸的。
个人觉得中国人所说的凸函数可能和凹凸这两个字象形体有关。
关于这一点,我觉得知乎上有些朋友解释的特别好,如
Cave代表洞穴
Concave 凹 Convex 凸

这里写图片描述

歪果仁是这么认识凹凸函数的
这里写图片描述

这里写图片描述

怎么样,是不是看到这个,突然就觉得好理解多了呢,我也是从知乎上看到的,狂戳链接
为什么数学概念中,将凸起的函数称为凹函数?


泰勒展开公式

泰勒公式是将一个在x=x_0处具有n阶导数的函数f(x)利用关于(x-x0)的n次多项式来逼近函数的方法。
若函数f(x)在包含x0的某个闭区间[a,b]上具有n阶导数,且在开区间(a,b)上具有(n+1)阶导数,则对闭区间[a,b]上任意一点x,成立下式:

f(x)=f(x0)0+f(x)1!(xx0)+f′′(x)2!(xx0)2++f(n)(x)n!(xx0)n

当然也可以写成:
f(x)=i=0nf(n)(x)(xx0)nn!

or
f(x)=i=0nf(n)(x)1n!(xx0)n

泰勒级数展开(标量)

我们知道,二阶泰勒展开公式为:

f(xk+δ)f(xk)+f(xk)δ+12f′′(xk)δ2

此时,
1.若 f(xk)=0 ,如果有
f′′(xk)>0 ,则 xk 为局部极小点(反之,局部极大点),这个在高数书上有,不懂的同学可以回头翻书看看。用几何方法特别好理解,二阶导数大于0说明,一阶导数的曲线呈现严格递增状态,就抛物线而言,斜率代表一阶导数,斜率在逐渐增大,说明抛物线开口向上。
2.如果 f′′(x"k)=0 ,有可能是一个鞍点,也就是拐点。比如说, f(x)=x3 ,一阶导数和二阶倒数在(0,0)这点处均为0。
总结一下
判断函数极大值以及极小值。
结合一阶、二阶导数可以求函数的极值。当一阶导数等于0,而二阶导数大于0时,为极小值点。当一阶导数等于0,而二阶导数小于0时,为极大值点;当一阶导数和二阶导数都等于0时,为驻点。

凸集(Convex Sets)

定义:一个集合 CRN 是凸的,则对于任意的 xiC ,有:

θx1+(1θ)x2C

0θ1i=1nθi=1

简单理解为:
在实数R上(或复数C上)的向量空间中,如果集合S中任两点的连线上的点都在S内,则称集合S为凸集。例如球体是凸集,但是任何中空的或具有凹痕的例如月牙形都不是凸集。

这里写图片描述

就不是凸集。

常见的凸集

1.超平面

C=x|aTx=b

2.半空间
类似于一个分隔超平面将空间切成两半的感觉
这个图来自于七月学习算法
3.多面体
这个应该比较好理解,比如说,三面体,四面体。。。
4.还有类似于平常见到的一些,比如说,圆、椭圆啊,椭球,球体都是凸集
注意
凸集的交集也是凸集,比如说,圆和椭圆相交,正方体和五面体相交都是凸集。
证明也特别简单:
不妨设两个凸集为P,Q,对于任意两个点x,y∈P∩Q,由于P凸,故线段xy在P中,同理线段xy在Q中,故线段xy在P∩Q中。于是P∩Q凸

凸函数

如果函数f的定义域domf为凸集,且满足
x,ydomf,0θ1
f(θx+(1θ)y)θf(x)+(1θ)f(y) 则称f为定义域上的凸函数

判定方法可利用定义法、已知结论法以及函数的二阶导数
对于实数集上的凸函数,一般的判别方法是求它的二阶导数,如果其二阶导数在区间上非负,就称为凸函数。(向下凸)
如果其二阶导数在区间上恒大于0,就称为严格凸函数。

常见的凸函数

  1. 指数函数 eax
  2. 幂函数 xa,xR+,1aa0
  3. 负对数函数 - log x
  4. 负熵函数 x log x
  5. 范数函数 ||x||p
    f(x)=max(x1,,xn)

    f(x)=x2/y,y>0

    f(x)=log(ex1+,,+exn)

凸优化问题的基本形式

minimizef0(x),xRn

subjecttofi(x)0,i=1,,m

hj(x)=0,j=1,,p

其中 fi(x) 为凸函数, hj(x) 为仿射函数
注:仿射函数即由1阶多项式构成的函数,一般形式为 f (x) = A x + b,这里,A 是一个 m×k 矩阵,x 是一个 k 向量,b是一个m向量,实际上反映了一种从 k 维到 m 维的空间映射关系。

凸优化问题的性质

  1. 凸优化问题的可行域为凸集
  2. 凸优化问题的局部最优解即为全局最优解
    其中第2点非常重要。

【更多关于仿射函数请参考】
[1]https://www.zhihu.com/question/20666664/answer/15790507


Edited by Eshter
Email:fang_yuu1992@126.com
版权归Eshter所有,撰于 2017/3/8


http://chatgpt.dhexx.cn/article/ukMc3oHk.shtml

相关文章

最优化理论基础与方法学习笔记——凸集与凸函数以及手写定理证明

文章目录 凸集的定义凸集的几何意义有关凸集的定理 定理1.4.2内点、边界点和闭包的定义定义1.4.3 超平面的定义定理1.4.3 投影定理定理1.4.4 点与凸集的分离定理定理1.4.5 支撑超平面定理定义1.4.4 凸函数的定义定义1.4.5 水平集定理1.4.6 凸函数的水平集还是凸集定理1.4.7 函数…

凸优化 - 2 - 凸集和凸函数

本总结是是个人为防止遗忘而作&#xff0c;不得转载和商用。 前提说明&#xff1a;为了方便查阅&#xff0c;我将整个凸优化的内容分成了很多部分&#xff0c;因为后面的部分用到了前面的知识&#xff0c;所以&#xff0c;如果你的目的是查看后面的内容但对前面的某个知识点不甚…

凸和非凸的理解

目录 一句话概括一、凸和非凸的区别二、凸函数和非凸函数三、凸优化和非凸优化凸优化&#xff1a;常见的凸优化方法&#xff1a;凸优化的一般求解过程非凸优化&#xff1a; 一句话概括 凸&#xff08;Convex&#xff09;&#xff1a;在该区间函数图象上的任意两点所连成的线段…

凸集与非凸集,凸函数与凹函数,凸优化

关于凸集与非凸集&#xff0c;凸函数与凹函数&#xff0c;凸优化的概念一直混淆&#xff0c;在此整理下相关定义和概念&#xff0c;希望给有需要的人。 凸集&#xff1a;集合中的任意两点连线的点都在该集合中&#xff0c;则称该集合为凸集&#xff1b;凹集为非凸集。 函数的…

最优化——凸集

引言 这是中科大最优化理论的笔记&#xff0c;中科大凌青老师的凸优化课程&#xff0c;详尽易懂&#xff0c;基础扎实。不论是初学者还是从业多年的人&#xff0c;都值得系统地好好学一遍。 本文介绍什么是凸集、凸包与凸锥包。 仿射集 我们先来看最简单的凸集——仿射集(A…

凸集

本文参考自清华大学研究生公共课教材——数学系列《最优化理论与算法》&#xff08;第二版&#xff09; 一&#xff1a;凸集 定义&#xff1a;设S为n维欧式空间中中的一个集合&#xff0c;若对S中任意两点&#xff0c;联结它们的线段仍属于S&#xff0c;称这样的集合S是一个凸…

凸集(Convex sets)

凸集&#xff08;Convex sets&#xff09; 1.仿射集和凸集 仿射集(Affine set)&#xff1a; 定义&#xff1a;如果通过C中任意两个不同点的线位于C中&#xff0c;则集合C⊆Rn就是仿射 其中&#xff0c; 凸集(Convex set)&#xff1a; 定义&#xff1a;如果C中的任意两点之间的…

【深度学习】logistic回归模型

目录 神经网络 数据、符号准备&#xff1a; logistic回归&#xff1a; 损失函数和代价函数&#xff1a; 梯度下降法&#xff1a; 向量化&#xff1a; 神经网络 我们学习深度学习的目的就是用于去训练神经网络&#xff0c;而神经网络是什么呢&#xff1f;我们先来看下面一…

十分钟理解logistic回归原理

关于逻辑回归的分类算法&#xff0c;很多书籍都有介绍&#xff0c;比较来看&#xff0c;还是**李航老师的书《统计学习方法》**里介绍的更清楚&#xff0c;若大家有时间&#xff0c;请不要偷懒&#xff0c;还是建议从头开始看李航老师的书&#xff0c;这本书简洁明了&#xff0…

python数据挖掘学习笔记——logistic逻辑回归实现

Logistic逻辑回归分析 logistic模型的基本介绍python中实现logistic回归模型的评价混淆矩阵ROC曲线&#xff0c;AUC值 Logistic模型是经典的用于分类问题的模型&#xff0c;通常用于判断一件事物的好坏或将其分类。本文着重介绍logistic模型的在二分类上的应用&#xff0c;对于…

logistic回归分类与softmax回归

目录 Logistic回归 逻辑回归的定义式&#xff1a; 损失函数 梯度下降 Logistic回归防止过拟合&#xff1a; Softmax回归&#xff1a; loss函数 逻辑回归与Softmax回归的联系 与神经网络的关系 logistic回归&#xff08;多分类&#xff09;和softmax的关系&#xff1a…

spss-logistic回归

logistic回归的因变量可以是二分类的&#xff0c;也可以是多分类的&#xff0c;但是二分类的更为常用&#xff0c;也更加容易解释&#xff0c;多类可以使用softmax方法进行处理。 Logistic回归分析也用于研究影响关系&#xff0c;即X对于Y的影响情况。Y为定类数据&#xff0c;…

logistic回归——PYTHON实现

logistic回归——PYTHON实现 概述&#xff1a; ​ logistic回归又称logistic回归分析&#xff0c;是一种线性回归模型。logistic回归应用最广泛的是处理二分类问题。比如&#xff0c;探讨引发疾病的危险因素&#xff0c;判断该病人是否患有该病&#xff1b;探讨房价的涨跌&am…

二项logistic回归案例分析(附操作数据)

当因变量数据类型为分类变量时&#xff0c;线性回归不再适用&#xff0c;应当做logistic回归。根据因变量分类水平的不同&#xff0c;具体包括二项logistic回归、多项logistic回归和有序logistic回归。 1.案例背景与分析策略 1.1 案例背景介绍 现收集到银行贷款客户的个人、…

Logistic回归--实例

逻辑回归 Logistic回归一种二分类算法&#xff0c;它利用的是Sigmoid函数阈值在[0,1]这个特性。Logistic回归进行分类的主要思想是&#xff1a;根据现有数据对分类边界线建立回归公式&#xff0c;以此进行分类。其实&#xff0c;Logistic本质上是一个基于条件概率的判别模型(D…

SPSS(八)logistic回归(图文+数据集)

SPSS&#xff08;八&#xff09;logistic回归 我们之前的线性回归也好、线性回归衍生方法也好、非线性回归也好&#xff0c;因变量的类型都是连续性的&#xff0c;假如因变量的类型是分类的呢&#xff1f;logistic回归针对的是二分类的因变量 logistic回归 基于线性回归模型…

2.2、logistic回归

一、什么是logistics回归 首先我们先要了解回归的概念&#xff0c;现有一些数据点&#xff0c;我们用 一条直线对这些点进行拟合&#xff0c;该线称为最佳拟合直线&#xff0c;这个拟合过程就称作回归。logistic回归虽然说是回归&#xff0c;但确是为了解决分类问题&#xff0…

Logistic Regression(逻辑回归)详细讲解

Logistic Regression(逻辑回归) 以前在学校学到Logistic Regression的时候&#xff0c;虽然最后会使用&#xff0c;但是对于许多地方有很多的疑惑&#xff0c;今天在这里详细梳理一下Logistic Regression的过程&#xff1a; Logistic Regression逻辑回归 回归的思想Logistic R…

第13章Stata Logistic回归分析

目录 13.1二元Logistic回归分析 案例延伸 延伸1&#xff1a;设定模型预测概率得具体值 延伸2&#xff1a;使用Probit模型对二分类因变量进行拟合 13.2多元Logistic回归分析 案例延伸 延伸&#xff1a;根据模型预测每个样本视力低下程度的可能性 13.3有序Logistic回归 …

机器学习笔记-Logistic回归

0 - 回顾 l i n e a r r e g r e s s i o n linear\ regression linear regression如果使用平方错误的话&#xff0c;我们可以很方便的解析出最好的 w w w是什么。即 w b e s t X † y w_{ best}X^{\dagger} y wbest​X†y 1 - 逻辑斯蒂回归问题 1.1 - 问题的提出 从一个人…