KKT条件（卡罗需-库恩-塔克条件）

article/2025/9/13 19:54:06

1，定义

KKT是啥？
它是Karush、Kuhn和Tucker三个人。这三个人单独提出了在非线性规划中获得最优解的必要条件。
看着很复杂呀？
还好啦。。。只是将拉格朗日乘数法中的等式约束条件泛化到了不等式。

2，先来几个简单例子

为什么要搞这个看似复杂的东东？当然是为了解决一些问题。下面的问题如果你能解出来，你就可以不用学这个了。

2.1 $求f(x_1,x_2)=x_1^2+x_2^2的最小值，约束条件为x_1+x_2=1和 x_2<=\alpha$ 。
易得 $f(x_1,x_2)=(1-x_2)^2+x_2^2=2(x_2-0.5)^2+0.5,$
则当 $\alpha>=0.5时，f(x_1,x_2)在x_2=0.5处有最小值，为0.5$ ；
当 $\alpha<0.5，f(x_1,x_2)在x_2=\alpha处有最小值，为2\alpha^2-2\alpha+1$ 。
尴尬了。。。解出来了。。。

好吧。。用KKT的思路来玩一下吧。
先构造拉格朗日函数：
$\mathcal{L}(x_1,x_2,\lambda,\mu)=x_1^2+x_2^2+\lambda(x_1+x_2-1)+\mu(x_2-\alpha)$ （似曾相识）
跟拉格朗日法一样对原始变量和等式约束部分求偏导数，并令其等于0：
$\frac{\partial\mathcal{L}}{x_1}=2x_1+\lambda=0$
$\frac{\partial\mathcal{L}}{x_2}=2x_2+\lambda+\mu=0$
$\frac{\partial\mathcal{L}}{\lambda}=x_1+x_2-1=0$
对于不等式部分，要用下列条件去约束：
$x_2-\alpha<=0$
$\mu>=0$
$\mu(x_2-\alpha)=0$
容易解出：
$x_1=1/2+\mu/4，x_2=1/2-\mu/4，\lambda=-1-\mu/2.$
将约束条件转化成只有 $\mu和\alpha的式子$ ：
$\mu>=2-4\alpha$
$\mu>=0$
$\mu(1/2-\mu/4-\alpha)=0$
1)，当 $\alpha>=1/2时，必须要使\mu=0才能满足要求，此时x_1=x_2=1/2;$
2)，当 $\alpha<1/2时，易得\mu>0，则\mu=2-4\alpha，此时x_1=1-\alpha，x_2=\alpha.$

perfect，，，两种方法解出来的结果完全一样。

2.2 升级一下问题：求 $f(x_1,x_2,x_2,x_4)=x_1^2+x_2^2+x_3^2+x_4^2的最小值，约束条件为x_1+x_2+x_3+x_4=1和x_4<=A$ 。
思考：四个变量，这下传统的方法不好使了。。。
构造拉格朗日函数：
$\mathcal{L}(x_1,x_2,\lambda,\mu)=x_1^2+x_2^2+x_3^2+x_4^2+\lambda(x_1+x_2+x_3+x_4-1)+\mu(x_4-A)$
约束条件为
$2x_1+\lambda=0$
$2x_2+\lambda=0$
$2x_3+\lambda=0$
$2x_4+\lambda+\mu=0$
$x_1+x_2+x_3+x_4=1$
$x_4<=A$
$\mu>=0$
$\mu(x_4-A)=0$
解得 $x_1=x_2=x_3=1/4+\mu/8，x_4=1/4-3/8\mu，\lambda=-1/2-\mu/4$
1)，当 $A>=1/4时，必须要使\mu=0才能满足要求，此时x_1=x_2=x_3=x_4=1/4;$
2)，当 $\alpha<1/4时易得\mu>0，则\mu=(2-8A)/3，此时x_1=x_2=x_3=1/3-A/3，x_4=A.$

3，稍微抽象一下上述的例子

假设要求f(x)的最小值，约束条件是g(x)<=0.
用 $x^*$ 表示上述解出现时的x值。
分下面两种情况讨论上述问题：
1）假如 $x^*$ 出现在g(x)<0的范围内，则只需要满足下列条件：
$\frac{d J(x^*)}{dx}=0$
此时相当于已经解除了不等式的约束。
2）假如 $x^*$ 出现在g(x)=0处，设 $x=x^*+\delta x，则\delta x=0应该是下面这种情况的解：$
$\min_{\delta x} J(x^*+\delta x)，约束条件为g(x^*+\delta x)<=0$ 。
用泰勒公式将上述式子改写：
$\min_{\delta x} [J(x^*)+\frac{d J(x^*)\delta x}{dx}]$ ，
约束条件为 $g(x^*)+\frac{d g(x^*)\delta x}{dx}<=0$

由于 $J(x^*)是个固定值且跟\delta x无关，且g(x^*)=0，所以上述条件可以进一步简化为$ ：
$\min_{\delta x} \frac{d J(x^*)\delta x}{dx}$ ，
约束条件为 $\frac{d g(x^*)\delta x}{dx}<=0$ 。

上述问题可以看成是关于 $\delta x$ 的线性规划问题。分下列几种情况：
在这里插入图片描述
我们需要使 $\delta x=0$ 成为上述情况的解，因此case 2和case 3满足条件，即需要一个正数 $\mu$ 使得：
$\frac{d J(x^*)}{dx}+\mu\frac{d g(x^*)}{dx}$ 成立。

4，正式给出KKT条件

假设要优化f(x)，即求最大值或最小值，约束条件为：
1）不等式约束： $g_i(x)<=0，i=1,2,...,m$
2）等式约束： $h_j(x)=0，j=1,2,...,\ell$
假设f(x)、g(x)和h(x)在点 $x^*$ 都是可以连续微分的，则存在常量 $\mu_i(i=1,2,...,m)和\lambda_j(j=1,2,...,\ell)$ 满足下面四个条件：
1，定常方程式
在这里插入图片描述
2，原始可行性

3，对偶可行性

4，互补松弛性

当m=0，即不存在不等方程时，KKT条件变成了拉格朗日条件，KKT乘子变成了拉格朗日乘子。