证明这个结论可以分为两个部分:首先证明凸函数在凸集上的局部极小点是全局极小点,其次证明凸函数的极小点集合是凸集。
第一部分:局部极小点是全局极小点
假设函数 ( f: S \rightarrow \mathbb{R} ) 是定义在非空凸集 ( S \subseteq \mathbb{R}^n ) 上的凸函数,并且 ( x_0 ) 是 ( f ) 在 ( S ) 上的局部极小点。那么根据局部极小点的定义,存在一个 ( x_0 ) 的邻域 ( N(x_0) ) 使得对于所有 ( x \in N(x_0) \cap S ),都有 ( f(x) \geq f(x_0) )。
现在要证明 ( x_0 ) 同时也是全局极小点。假设存在另一个点 ( x_1 \in S ) 使得 ( f(x_1) < f(x_0) )。因为 ( S ) 是凸集,所以连接 ( x_0 ) 和 ( x_1 ) 的线段 ( [x_0, x_1] ) 完全包含在 ( S ) 内。考虑线段上的点 ( x(\theta) = \theta x_1 + (1 - \theta)x_0 ),其中 ( 0 < \theta < 1 )。
由于 ( f ) 是凸函数,我们有:
[ f(x(\theta)) \leq \theta f(x_1) + (1 - \theta)f(x_0) < \theta f(x_0) + (1 - \theta)f(x_0) = f(x_0) ]
这表明当 ( \theta ) 足够小的时候,( x(\theta) ) 将在 ( x_0 ) 的邻域内,并且 ( f(x(\theta)) < f(x_0) ),这与 ( x_0 ) 是局部极小点的假设矛盾。因此,不存在这样的 ( x_1 ) 使得 ( f(x_1) < f(x_0) ),这意味着 ( x_0 ) 实际上是全局极小点。
第二部分:极小点集合是凸集
假设 ( x_1 ) 和 ( x_2 ) 是 ( f ) 在 ( S ) 上的两个极小点,并且 ( \lambda ) 是介于 0 和 1 之间的任意实数。我们需要证明 ( x(\lambda) = \lambda x_2 + (1 - \lambda)x_1 ) 也是 ( f ) 的极小点。
由于 ( f ) 是凸函数,我们有:
[ f(x(\lambda)) \leq \lambda f(x_2) + (1 - \lambda)f(x_1) ]
由于 ( x_1 ) 和 ( x2 ) 都是极小点,它们在 ( S ) 上的函数值相等,记为 ( f{\text{min}} )。因此:
[ f(x(\lambda)) \leq \lambda f{\text{min}} + (1 - \lambda)f{\text{min}} = f_{\text{min}} ]
这说明 ( x(\lambda) ) 的函数值不会超过 ( f_{\text{min}} ),也就是说 ( x(\lambda) ) 也是 ( f ) 的一个极小点。这证明了极小点的集合是凸集。
综上所述,我们证明了凸函数在凸集上的局部极小点是全局极小点,并且凸函数的极小点集合是凸集。