迭代算法的收敛性

迭代算法必须收敛，所产生的极小化序列Xk具有这样的性质：或者序列中的某一点就是极小点X∗；或者序列收敛于极小点X∗,即满足\quad迭代算法必须收敛，所产生的极小化序列{X_k}具有这样的性质：或者序列中\\的某一点就是极小点X^*；或者序列收敛于极小点X^*,即满足 limk→∞∥Xk−X∗∥=0\lim_{k\rightarrow \infty}\|X_k-X^*\|=0但求解非线性最优化问

qyL

32021人浏览 · 2016-07-07 09:08:18

q__y__L · 2016-07-07 09:08:18 发布

迭代算法必须收敛，所产生的极小化序列Xk具有这样的性质：或者序列中的某一点就是极小点X∗；或者序列收敛于极小点X∗,即满足<script type="math/tex" id="MathJax-Element-53">\quad迭代算法必须收敛，所产生的极小化序列{X_k}具有这样的性质：或者序列中\\的某一点就是极小点X^*；或者序列收敛于极小点X^*,即满足</script>

lim k \to \infty ∥ X k - X * ∥ = 0

但求解非线性最优化问题时，通常迭代序点序列收敛于全局最优解相当困难，如，求解函数f(x)=|x|的极小值，显然x=0是唯一极小点，构造极小化序列：<script type="math/tex" id="MathJax-Element-55">\quad 但求解非线性最优化问题时，通常迭代序点序列收敛于全局最优解相当困\\难，如，求解函数f(x)=|x|的极小值，显然x=0是唯一极小点，构造极小化序列：</script>

x k + 1 = {1 2 (x k - 1) + 1, x k > 1, 1 2 x k, x k \leq 1 .

容易证明这是一个下降序列。若取初始点x0>1,则所有xk>1,因此迭代序列不可能收敛到极小点；但若取初始点x0≤1,则极小化序列会收敛到极小点0.<script type="math/tex" id="MathJax-Element-57">\quad容易证明这是一个下降序列。若取初始点x_0>1,则所有x_k>1,因此迭代序列\\不可能收敛到极小点；但若取初始点x_0\le1,则极小化序列会收敛到极小点0.</script>

若当初始点充分靠近极小点产生的迭代序列才能收敛到X∗的算法，称为局部收敛算法；如果任意初始点产生的迭代序列都能收敛到X∗，则称为全局收敛算法。<script type="math/tex" id="MathJax-Element-58">\quad 若当初始点充分靠近极小点产生的迭代序列才能收敛到X^*的算法，称为\\局部收敛算法；如果任意初始点产生的迭代序列都能收敛到X^*，则称为全局收敛算法。</script>

因为利用迭代优化问题时，其最优解X∗是未知的，所知道的只有每次计算的迭代点Xk，因此，只能从已知迭代点所提供的信息来判断是否应该迭代结束，常用的终止条件有:<script type="math/tex" id="MathJax-Element-59">\quad 因为利用迭代优化问题时，其最优解X^*是未知的，所知道的只有每次计\\算的迭代点{X_k}，因此，只能从已知迭代点所提供的信息来判断是否应该迭代\\结束，常用的终止条件有:</script>

两次迭代绝对误差
可行域内：∥Xk+1−Xk∥≤ϵ1;<script type="math/tex" id="MathJax-Element-60">\quad 可行域内：\|X_{k+1}-X_k\|\le\epsilon_1;</script>
函数阈值：∥f(Xk+1−f(Xk)∥≤ϵ2.<script type="math/tex" id="MathJax-Element-61">\quad 函数阈值：\|f(X_{k+1}-f(X_k)\|\le\epsilon_2.</script>
两次迭代相对误差
可行域内：∥Xk+1−Xk∥∥Xk∥≤ϵ1<script type="math/tex" id="MathJax-Element-62">\quad 可行域内：\frac{\|X_{k+1}-X_k\|}{\|X_k\|}\le\epsilon_1</script>
函数阈值：∥f(Xk+1−f(Xk)∥f(Xk)≤ϵ2.<script type="math/tex" id="MathJax-Element-63">\quad 函数阈值：\frac{\|f(X_{k+1}-f(X_k)\|}{f(X_k)}\le\epsilon_2.</script>
梯度模足够小
$∥ Δ f (X k + 1) ∥ \leq ϵ$ <script type="math/tex; mode=display" id="MathJax-Element-64">\|\Delta f(X_{k+1})\|\le\epsilon</script>
注：以上ϵi为预先给定的充分小正数，对于定义域上的凸函数，梯度模足够小的终止条件是完全正确的，但是如果是非凸函数，则可能导致误把驻点当作最优点。<script type="math/tex" id="MathJax-Element-65">\quad 注：以上\epsilon_i为预先给定的充分小正数，对于定义域上的凸函数，\\梯度模足够小的终止条件是完全正确的，但是如果是非凸函数，则可能导\\致误把驻点当作最优点。</script>

2.收敛速度

<script type="math/tex" id="MathJax-Element-3716">\quad</script>满足前面迭代终止条件的算法，称为实用收敛性算法，与之对应的还有一类理论收敛性算法。此外，判断算法的好坏，一看是否收敛，而看收敛速度。如果算法产生的迭代序列虽然收敛到最优解，但收敛速度太慢，以致在允许的时间内得不到满意结果，那么这类算法也谈不上好算法。能以较快速度收敛于最优解的算法，才是好算法。

lim k \to \infty ∥ X k + 1 - X * ∥ ∥ X k - X * ∥ = β

存在，则：<script type="math/tex" id="MathJax-Element-3720">存在，则：</script>

当β=0时，称{XK}具体超线性收敛速度或算法A为超线性收敛；<script type="math/tex" id="MathJax-Element-3721">\beta=0时，称\{X_K\}具体超线性收敛速度或算法A为超线性收敛；</script>
当0<β<1时，称{Xk}具有线性收敛速度，或算法A为线性收敛；<script type="math/tex" id="MathJax-Element-3722">0<\beta<1时，称\{X_k\}具有线性收敛速度，或算法A为线性收敛；</script>
当β=1时，称{Xk}具有次线性收敛速度或算法A为次线性收敛。<script type="math/tex" id="MathJax-Element-3723">\beta=1时，称\{X_k\}具有次线性收敛速度或算法A为次线性收敛。</script>

lim k \to \infty ∥ X k + 1 - X * ∥ ∥ X k - X * ∥ α = β

则称算法是α收敛的，或称算法A所产生的迭代序列{Xk}具有α阶收敛速度。α=1,称算法A为一阶收敛，α=2时为二阶收敛，一般α>1时都称为好算法。<script type="math/tex" id="MathJax-Element-3727">则称算法是\alpha收敛的，或称算法A所产生的迭代序列\{X_k\}具有\alpha阶\\收敛速度。\alpha=1,称算法A为一阶收敛，\alpha=2时为二阶收敛，一般\alpha>1时都称为好算法。</script>
需要说明的是，说一个算法是线性收敛的，是指算法产生的跌打序列在最坏的情况下是线性收敛的，收敛性和收敛速度的理论结果并不一定保证在实际运用时一定有好的计算过程和结果，原因是，一方面，理论分析忽略了计算过程中一些环节的影响，比如数值舍入精度；另一方面，理论分析通常要对函数加一些不容易验证的特殊限定，而这些限定在实际中不一定能得到满足。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2026年最新AI大模型学习路线，零基础入门到精通（非常详细）收藏这一篇就够了！

2048 AI社区

国产麒麟系统安装部署OpenClaw完整指南（适配V10/VSP）国产操作系统的AI智能体部署

2048 AI社区

第七节：双层状态管理 —— 进程状态 vs React 状态

上一节我们解决了"Agent 能持续工作多久"的问题——四级压缩策略让 Agent 在 200K 上下文窗口中游刃有余，Agent 运行时还有大量其他状态需要管理——当前权限模式是什么？MCP 服务器连接了几个？用户偏好设置是什么？费用累积了多少？Claude Code 的巧妙之处在于它用两层状态分别管理不同类型的信息：底层是纯 TypeScript 的进程全局单例，上层是 React 响应式 S

2048 AI社区

所有评论(0)

查看更多评论

qyL

@q__y__L

已为社区贡献5条内容