算法学习笔记渐进时间复杂度和求解递归式（代入法、递归树、主方法）

参考算法导论：第3章函数的增长 3.1节渐近记号；第4章分治策略：4.3节用代入法求解递归式；4.4节用递归树方法求解递归式；4.5节用主方法求解递归式；4.6节证明主定理文章目录1. 渐近时间复杂度1.1 渐近记号渐近记号、函数与运行时间Θ\ThetaΘ 记号OOO 记号Ω\OmegaΩ 记号等式和不等式中的渐近记号ooo 记号ω\omegaω 记号比较各种函数常用数学函数单调性向下取

memcpy0

1278人浏览 · 2022-06-13 18:14:22

memcpy0 · 2022-06-13 18:14:22 发布

参考算法导论：

第3章函数的增长 3.1节渐近记号；3.2节标准记号与常用函数

第4章分治策略：4.3节用代入法求解递归式；4.4节用递归树方法求解递归式；4.5节用主方法求解递归式；4.6节证明主定理

第17章摊还分析

1. 渐近时间复杂度

算导第2章定义的「算法运行时间的增长量级」简单地刻画了算法效率，还允许比较可选算法的相对性能。一旦输入规模 $n$ 变得足够大，最坏情况运行时间为 $\Theta(n\log n)$ 的归并排序，将战胜最坏情况运行时间为 $\Theta(n^2)$ 的插入排序。正如算导第2章对插入排序所做的，虽然有时能够确定一个算法的精确运行时间，但是通常并不值得花力气来计算它、以获得多余的精度。对于足够大的输入，精确运行时间中的倍增常量和低阶项、被增长规模本身的影响所支配。

当输入规模足够大、大到运行时间的增长量级只与其有关时 input sizes large enough to make only the order of growth of the running time relevant ，我们要研究算法的渐近效率 asymptotic efficiency 。也就是说，我们关心当输入规模无限增加时，在极限中算法的运行时间如何随着输入规模的变大而增加 how the running time of an algorithm increases with the size of the input in the limit, as the size of the input increases without bound 。通常，渐近地更有效的某个算法、对除很小的输入外的所有情况，将是更好的选择。

下面给出几种标准方法、定义几类“渐近符号”来简化算法的渐近分析。用来描述算法渐近运行时间的记号，根据「定义域为自然数集 $\N = \{ 0, 1, 2, \dots \}$ 的函数」来定义。这样的记号，对描述最坏情况运行时间的函数 $T (n)$ 是方便的，因为该函数通常只定义在整数输入规模上。然而，我们发现有时按各种方式活用 abuse 渐近记号是方便的。例如，可以扩展该记号到实数域、或选择性地限制其到自然数的一个子集。然而，我们应该确保能理解该记号的精确含义，以便在活用时不会误用它 We should make sure, however, to understand the precise meaning of the notation so that when we abuse, we do not misuse it 。因此本节还介绍了一些常用的活用法。

1.1 渐近记号、函数与运行时间

正如插入排序的最坏情况运行时间为 $\Theta(n^2)$ 一样，我们将主要使用渐近记号来描述算法的运行时间。然而，渐近记号实际上应用于函数。算法导论第2章中把插入排序的最坏情况运行时间刻画为 $an^2 + bn+ c$ ，其中 $a, b, c$ 是常量，而通过把插入排序的运行时间写成 $\Theta(n^2)$ ，我们除去了该函数的某些细节。因为渐近记号适用于函数，我们所写成的 $\Theta(n^2)$ 就是函数 $an^2 + bn+c$ ，所以上述情况碰巧刻画了插入排序的最坏情况运行时间。

自然地，「对其使用渐近记号的函数」通常用于刻画算法的运行时间，但是渐近记号也可以适用于刻画算法的某个其他方面（例如，算法使用的空间大小）的函数，甚至可以适用于和算法没有任何关系的函数。

即使我们使用渐近记号来刻画算法的运行时间，我们也需要了解意指哪个运行时间。有时候对最坏情况运行时间感兴趣，然而我们常常希望刻画任何输入的运行时间。即做出一种综合性地、覆盖所有输入、而不仅仅是最坏情况的陈诉。我们将看到「完全适合刻画任何输入的运行时间的渐近记号」。

1.2 $\Theta$ 记号

算导第2章中，插入排序的最坏情况运行时间为 $\Theta(n^2)$ 。让我们来定义这个记号意指什么。对一个给定的函数 $g (n)$ ，用 $\Theta(g(n))$ 来表示以下函数的集合：
$\Theta(g(n)) = \{ f(n) \mid 存在正常量c_1, c_2和n_0,\\ 使得对所有n\ge n_0,有0\le c_1 g(n) \le f(n) \le c_2 g(n) \}$

若存在正常量 $c_1, c_2$ ，使得对于足够大的 $n$ ，函数 $f (n)$ 能“夹入” $c_1 g(n)$ 与 $c_2 g(n)$ 之间，则 $f (n)$ 属于集合 $\Theta(g(n))$ 。因为 $\Theta(g(n))$ 是一个集合，所以可以记 $\in \Theta(g(n))$ ，以指出 $f (n)$ 是 $\Theta(g(n))$ 的成员。作为替代，我们通常记 $\Theta(g(n))$ 以表达相同的概念。因为我们按这种方式活用了等式，所以可能感到困惑，但是在本节的后面将看到这样做有其好处。

图3-1(a)给出了函数 $f (n)$ 与 $g (n)$ 的一幅直观画面，其中 $\Theta(g(n))$ 。对在 $n_0$ 及其右边 $n$ 的所有值， $f (n)$ 的值位于或高于 $c_1 g(n)$ 且位于或低于 $c_2 g(n)$ 。即对所有 $\ge n_0$ ，函数 $f (n)$ 在一个常量因子内等于 $g (n)$ 。我们称 $g (n)$ 是 $f (n)$ 的一个渐近紧确界 asymptotically tight bound 。
在这里插入图片描述

$\Theta(g(n))$ 的定义，要求每个成员 $\in \Theta(g(n))$ 均渐近非负 asymptotically nonnegative ，即当 $n$ 足够大时， $f (n)$ 非负（渐近正函数 asymptotically positive 就是对所有足够大的 $n$ 均为正的函数）。因此，函数 $g (n)$ 本身必为渐近非负，否则集合 $\Theta(g(n))$ 为空。所以，我们假设用在 $\Theta$ 记号中的每个函数均渐近非负。这个假设对定义的其他渐近记号也成立。

在算导第2章中，介绍了 $\Theta$ 记号的一种非形式化的概念，相当于扔掉低阶项、并忽略最高阶项前的系数。让我们通过形式化定义证明 $\dfrac{1}{2} n^2 - 3n = \Theta(n^2)$ 来简要地证实这种直觉。为此，我们必须确定正常量 $c_1, c_2, n_0$ ，使得对所有 $\ge n_0$ ，有： $c_1 n^2 \le \dfrac{1}{2} n^2 - 3n \le c_2 n^2$

用 $n^2$ 除上式得： $c_1 \le \dfrac{1}{2} - \dfrac{3}{n} \le c_2$ 通过选择任何正常量 $c_2 \ge 1/2$ ，可以使左边的不等式对任何 $\ge 7$ 的值成立。因此，通过选择 $c_1 = 1/14, c_2 = 1/2$ 且 $n_0 = 7$ ，可以证明 $\dfrac{1}{2} n^2 - 3n = \Theta(n^2)$ 。当然，还存在对这些正常量的其他选择，但是重要的是存在某个选择。要注意的是，这些常量依赖于函数 $\dfrac{1}{2} n^2 - 3n$ ；属于 $\Theta(n^2)$ 的不同函数通常需要不同的常量。

我们还可以使用形式化定义来证明 $6n^3 \ne \Theta(n^2)$ 。采用反证法，假设存在 $c_2$ 和 $n_0$ ，使得对所有 $\ge n_0$ ，有 $6n^3 \le c_2 n^2$ 。然而用 $n^2$ 除该式，得 $\le c_2 / 6$ ，因为 $c_2$ 为正常量，所以对任意大的 $n$ ，该不等式不可能成立。

直觉上，一个渐近正函数的低阶项在确定渐近确界时可以被忽略，因为对大的 $n$ ，它们是无足轻重的。当 $n$ 较大时，即使最高阶项的一个很小的部分，都足以支配所有低阶项。因此，将 $c_1$ 置为稍小于最高阶项系数的值、并将 $c_2$ 置为稍大于最高阶项系数的值，能使 $\Theta$ 记号定义中的不等式得到满足。最高阶项系数同样可以被忽略，因为它仅仅根据一个等于该系数的常量因子来改变 $c_1, c_2$ 。

作为一个例子，考虑任意二次函数 $f(n) = an^2 + bn+c$ ，其中 $a, b, c$ 均为常量、且 $a > 0$ 。扔掉低阶项、并忽略常量后得 $\Theta(n^2)$ 。为了形式化地证明相同的结论，我们取常量 $c_1 = a/4,\ c_2 = 7a/4,\ n_0 = 2 \times \max( | b| / a, \sqrt{ |c| /a })$ ，可以证明对所有 $n\ge n_0$ ，有 $\le c_1 n^2 \le an^2+ bn+c \le c_2 n^2$ 。

一般来说，对任意多项式 $=\displaystyle \sum^d_{i=0} a_in^i$ ，其中 $a_i$ 为常量且 $a_d > 0$ ，我们有 $\Theta(n^d)$ （参见算导思考题3-1）。因为任意常量是一个 $0$ 阶多项式，所以可以把任意常量函数表示成 $\Theta(n^0)$ 或 $\Theta(1)$ 。然而，后一种记号是一种轻微的活用，因为该表达式并未指出什么变量趋于无穷，真正的问题在于通常的函数记号没有区分函数和函数值。我们将经常使用记号 $\Theta(1)$ 来表示一个常量或者关于某个变量的一个常量函数。

1.3 $O$ 记号

$\Theta$ 记号渐近地给出一个函数的上界和下界。当只有一个渐近上界 asymptotic upper bound 时，使用 $O$ 记号，对于给定的函数 $g (n)$ ，用 $O (g (n))$ （英语发音 big-oh of g of n ）来表示以下函数的集合：
$\{ f(n) \mid 存在正常量c和n_0, 使得对所有n\ge n_0,有0\le f(n) \le cg(n) \}$

我们使用 $O$ 记号来给出「函数的一个在常量因子内的上界」。图3-1(b)展示了 $O$ 记号背后的直觉知识。对在 $n_0$ 及其右边的所有值 $n$ ，函数 $f (n)$ 的值总小于或等于 $c g (n)$ 。

我们记 $f (n) = O (g (n))$ 以指出函数 $f (n)$ 是集合 $O (g (n))$ 的成员。注意， $\Theta(g(n))$ 蕴含着 $f (n) = O (g (n))$ ，因为 $\Theta$ 记号是一个比 $O$ 记号更强的概念。按集合论中的写法，我们有 $\Theta(g(n)) \subseteq O(g(n))$ 。因此，关于任意二次函数 $an^2 + bn+c\ (a > 0)$ 在 $\Theta(n^2)$ 中的证明，也说明了任意这样的二次函数在 $O(n^2)$ 中。更令人惊奇的是，当 $a > 0$ 时，任意线性函数 $a n + b$ 也在 $O(n^2)$ 中，通过取 $c = a + ∣ b ∣$ 和 $n_0 = \max (1,\ -b/ a)$ ，可以很容易地证明这个结论。

有时在文献中，也会发现 $O$ 记号非形式化地描述渐近确界，即已经使用 $\Theta$ 记号定义的东西。然而在算导中，当书写 $f (n) = O (g (n))$ 时，仅仅要求 $g (n)$ 的某个常量倍数是 $f (n)$ 的渐近上界、而不要求它是一个多么紧确的上界。在算法论文中，标准的做法是区分渐近上界和渐近确界。

使用 $O$ 记号，我们常常可以仅通过检查算法的总体结构、以描述算法的运行时间。例如，算导第2章中插入排序算法的双重嵌套循环结构、对最坏情况运行时间立即产生一个 $O(n^2)$ 的上界：内层循环每次迭代的代价以 $O (1)$ （常量）为上界（？），下标 $i, j$ 均最多为 $n$ ，对于 $n^2$ 个 $i$ 和 $j$ 值对的每一对，内循环最多执行一次。

既然 $O$ 记号描述上界，那么当我们用它来限定一个算法的最坏情况运行时间时，我们就有一个「该算法在每个输入上的运行时间」的界 Since O-notation describes an upper bound, when we use it to bound the worst-case running time of an algorithm, we have a bound on the running time of the algorithm on every input ，这就是前面讨论的综合性陈诉。因此，对插入排序的最坏情况运行时间的界 $O(n^2)$ 也适用于该算法对每个输入的运行时间。然而，对插入排序的最坏情况运行时间的界 $\Theta(n^2)$ 并未暗示插入排序对每个输入的运行时间的界也是 $\Theta(n^2)$ ，例如在算导第2章曾看到，当输入已排好序时，插入排序的运行时间为 $\Theta(n)$ 。从技术上看，称插入排序的运行时间为 $O(n^2)$ is an abuse ，因为对于给定的 $n$ ，实际的运行时间是变化的，依赖于规模为 $n$ 的特定输入。当我们说“运行时间为 $O(n^2)$ 时”，意指存在一个是 $O(n^2)$ 的函数 $f (n)$ ，使得对 $n$ 的任意值，不管选择什么特定的规模为 $n$ 的输入，其运行时间的上界都是 $f (n)$ 。等价地，我们是在说其最坏情况运行时间为 $O(n^2)$ 。

1.4 $\Omega$ 记号

正如 $O$ 记号提供了一个函数的渐近上界， $\Omega$ 记号提供了渐近下界 asymptotic lower bound 。对于给定的函数 $g (n)$ ，用 $\Omega(g(n))$ （英语发音为 “big-omega of g of n ）来表示以下函数的集合：
$\Omega(g(n)) = \{ f(n) \mid 存在正常量c和n_0,使得对所有n\ge n_0,有0\le cg(n) \le f(n) \}$

图3-1©给出了 $\Omega$ 记号的直观解释。对在 $n_0$ 及其右边的所有值 $n$ ， $f (n)$ 的值总是大于或等于 $c g (n)$ 。

根据目前所看到的这些渐近记号的定义，容易证明以下重要定理（参见算导练习3.1-5）。

定理3.1 对任意两个函数 $f (n)$ 和 $g (n)$ ，我们有 $\Theta(g(n))$ ，当且仅当 $f (n) = O (g (n))$ 且 $\Omega(g(n))$ 。

作为应用本定理的一个例子，关于对任意常量 $a, b, c$ ，其中 $a > 0$ ，有 $an^2 + bn+c = \Theta(n^2)$ 的证明，直接蕴含 $an^2 + bn+c = \Omega(n^2)$ 和 $an^2+bn+c= O(n^2)$ 。实际上不是像该例子中所做的，应用定理3.1从渐近确界获得渐近上界和下界，而是通常用它从渐近上界和下界来证明渐近确界。

当称一个算法的运行时间（无修饰语）为 $\Omega(g(n))$ 时，我们意指对每个 $n$ 值，不管选择什么特定的规模为 $n$ 的输入，只要 $n$ 足够大，对那个输入的运行时间至少是 $g (n)$ 的常量倍。等价地，我们在对一个算法的最好情况运行时间给出一个下界。

例如，插入排序的最好情况运行时间为 $\Omega(n)$ ，这蕴含着插入排序的运行时间为 $\Omega(n)$ 。所以插入排序的运行时间介于 $\Omega(n)$ 和 $O(n^2)$ ，因为它落入 $n$ 的线性函数与 $n$ 的二次函数之间的任何地方，而且这两个界是尽可能渐近地紧确的：例如，插入排序的运行时间不是 $\Omega(n^2)$ ，因为存在一个输入（例如当输入已排好序时），对该输入、插入排序在 $\Theta(n)$ 时间内运行。然而，这与称插入排序的最坏情况运行时间为 $\Omega(n^2)$ 并不矛盾，因为存在一个输入，使得该算法需要 $\Omega(n^2)$ 的时间。

1.5 等式和不等式中的渐近记号

我们已经看到，渐近记号可以如何用于数学公式中。例如，在介绍 $O$ 记号时，记 $n = O(n^2)$ 。还写过 $2n^2 +3n+1 = 2n^2 + \Theta(n)$ 。如何解释这样的公式呢？

当渐近记号独立存在于等式（或不等式）的右边（即不在一个更大的公式内）时 When the asymptotic notation stands alone on the right-hand side of an equation (or inequality) ，如在 $n = O(n^2)$ 中，已经定义等号意指集合的成员关系： $\in O(n^2)$ 。

然而，一般来说，当渐近记号出现在某个公式中时，我们将其解释为代表某个我们不关注名称的匿名函数，例如公式 $2n^2 + 3n + 1 = 2n^2 + \Theta(n)$ 意指 $2n^2 + 3n+1 = 2n^2 + f(n)$ ，其中 $f (n)$ 是集合 $\Theta(n)$ 中的某个函数。在这个例子中，假设 $f (n) = 3 n + 1$ ，该函数确实在 $\Theta(n)$ 中。按这种方式使用渐近记号，可以帮助消除一个等式中无关紧要的细节与混乱。例如，算导第2章中把归并排序的最坏情况运行时间表示为递归式： $\Theta(n)$ 。如果只对 $T (n)$ 的渐近行为感兴趣，那么没有必要准确说明所有低阶项，它们都被理解为包含在由项 $\Theta(n)$ 表示的匿名函数中。

一个表达式中匿名函数的数目，可以理解为等同于渐近记号出现的次数 The number of anonymous functions in an expression is understood to be equal to the number of times the asymptotic notation appears 。例如，在表达式 $\displaystyle \sum^n_{i=1} O(i)$ 中，只有一个匿名函数（一个 $i$ 的函数）。因此，这个表达式不同于 $\dots + O(n)$ ，实际上后者没有一个清晰的解释（？）。

在某些例子中，渐近记号出现在等式的左边，例如： $2n^2 + \Theta(n) =\Theta(n^2)$ 。我们使用以下规则来解释这种等式：无论怎样选择等号左边的匿名函数，总有一种办法来选择等号右边的匿名函数使等式成立。因此，我们的例子意指：对任意函数 $\in \Theta(n)$ ，存在某个函数 $\in \Theta(n^2)$ ，使得对所有的 $n$ ，有 $2n^2+f(n) = g(n)$ 。换句话说，等式右边比左边提供的细节更粗糙。

我们可以将许多这样的关系链在一起，例如： $2n^2+3n+1 = 2n^2 + \Theta(n) = \Theta(n^2)$ 可以用上述规则分别解释每个等式。第一个等式表明，存在某个函数 $\in \Theta(n)$ ，使得对所有的 $n$ ，有 $2n^2 + 3n+1 = 2n^2 + f(n)$ 。第二个等式表明，对任意函数 $\in \Theta(n)$ （如刚刚提到的 $f (n)$ ），存在某个函数 $\in \Theta(n^2)$ ，使得对所有的 $n$ ，有 $2n^2 + g(n) = h(n)$ 。注意，这种解释蕴含着 $2n^ 2+3n+1 = \Theta(n^2)$ ，这就是等式链直观上提供给我们的东西。

1.6 $o$ 记号

由 $O$ 记号提供的渐近上界，可能是、也可能不是渐近紧确的。界 $2n^2 = O(n^2)$ 是渐近紧确的，但是界 $2n = O(n^2)$ 却不是。我们使用 $o$ 记号来表述一个非渐近紧确的上界。形式化地定义 $o (g (n))$ （英语发音为 little-oh of g of n ）为以下集合：
$\{ f(n) \mid 对任意正常量 c>0,存在正常量n_0 > 0,\\ 使得对所有n\ge n_0, 有0\le f(n) < cg(n) \}$

$O$ 记号与 $o$ 记号的定义类似。主要的区别是在 $f (n) = O (g (n))$ 中，界 $\le f(n) \le cg(n)$ 对某个常量 $c > 0$ 成立，但在 $f (n) = o (g (n))$ 中，界 $\le f(n) < cg(n)$ 对所有常量 $c > 0$ 成立。直观上，在 $o$ 记号中，当 $n$ 趋于无穷时，函数 $f (n)$ 相对于 $g (n)$ 来说变得微不足道了，即： $\tag{3.1} \begin{aligned} \lim _{n \to \infin} \dfrac{f(n)} {g(n)} = 0\end{aligned}$

有些学者使用这个极限作为 $o$ 记号的定义。算导中的定义还限定匿名函数是渐近非负的 restricts the anonymous functions to be asymptotically nonnegative 。

1.7 $\omega$ 记号

$\omega$ 记号与 $\Omega$ 记号的关系，类似于 $o$ 记号与 $O$ 记号的关系。我们使用 $\omega$ 记号来表示一个非渐近紧确的下界。定义它的一种方式是： $\in \omega(g(n)) \ 当且仅当\ g(n) \in o(f(n))$ 然而，我们形式化地定义 $\omega(g(n))$ （英语发音 little-omega of g of n ）为以下集合：
$\omega(g(n)) = \{ f(n) \mid 对任意正常量c > 0,存在常量n_0 > 0,\\ 使得对所有n\ge n_0, 有0\le cg(n) < f(n) \}$ 例如， $n^2 / 2 = \omega(n)$ ，但是 $n^2/ 2 \ne \omega(n^2)$ 。关系 $\omega(g(n))$ 蕴含着： $\lim_{n \to \infin} \dfrac{f(n)}{g(n)} = \infin$

也就是说，如果这个极限存在，那么当 $n$ 趋于无穷时， $f (n)$ 相对于 $g (n)$ 来说变得任意大了。

1.8 比较各种函数

（实数的）许多关系性质也适用于渐近比较。下面假定 $f (n), g (n)$ 渐近为正。

传递性：
$\begin{aligned} &f(n) = \Theta(g(n)) 且g(n) = \Theta(h(n)) &\implies f(n) = \Theta(h(n)) \\ &f(n) = O(g(n)) 且 g(n) = O(h(n)) &\implies f(n) = O(h(n)) \\ &f(n) = \Omega(g(n)) 且 g(n) = \Omega(h(n)) &\implies f(n) = \Omega(h(n)) \\ &f(n) = o(g(n)) 且 g(n) = o(h(n)) &\implies f(n) = o(h(n)) \\ &f(n) = \omega(g(n)) 且 g(n) = \omega(h(n)) &\implies f(n) = \omega(h(n)) \end{aligned}$
自反性： $\begin{aligned} &f(n) = \Theta(f(n)) \\ &f(n) = O(f(n)) \\ &f(n) = \Omega(f(n)) \end{aligned}$
对称性： $\Theta(g(n)) \Lrarr g(n) = \Theta(f(n))$
转置对称性： $\begin{aligned} &f(n) = O(g(n)) \Lrarr g(n) = \Omega(f(n)) \\ &f(n) = o(g(n)) \Lrarr g(n) = \omega(f(n)) \end{aligned}$

因为这些性质对渐近记号成立，所以可以在两个函数 $f, g$ 的渐近比较与两个实数 $a, b$ 的比较之间、做一种类比。
$\begin{aligned} &f(n) = O(g(n))\ 类似于\ a\le b \\ &f(n) = \Omega(g(n))\ 类似于\ a\ge b \\ &f(n) = \Theta(g(n))\ 类似于\ a= b \\ &f(n) = o(g(n))\ 类似于\ a\lt b \\ &f(n) = \omega(g(n))\ 类似于\ a\gt b \\ \end{aligned}$ 则若 $f (n) = o (g (n))$ ，则称 $f (n)$ 渐近小于 asymptotically smaller $g (n)$ ；若 $\omega(g(n))$ ，则称 $f (n)$ 渐近大于 asymptotically larger $g (n)$ 。然而，实数的下列性质，不能携带到渐近记号：

三分性：对任意两个实数 $a, b$ ，下列三种情况恰有一种必须成立： $a < b, a = b, a > b$ （【离散数学】集合论第四章函数与集合(6) 三歧性定理、两集合基数判等定理（基数的比较）、Cantor定理）。
虽然任意两个实数都可以进行比较，但不是所有函数都可渐近比较。也就是说对两个函数 $f (n), g (n)$ ，也许 $O(g(n)),\ f(n) = \Omega(g(n))$ 都不成立。例如，我们不能使用渐近记号来比较函数 $n$ 和 $n^{1 + \sin n}$ ，因为 $n^{1+\sin n}$ 中的幂值在 $0$ 与 $2$ 之间摆动，取介于两者之间的所有值。

2. 常用数学函数

本节将回顾一些「在算法分析中常见的标准的数学函数」的行为，还将阐明渐近记号的使用。

2.1 单调性

若 $m\le n$ 蕴含 $\le f(n)$ ，则函数 $f (n)$ 是单调递增 monotonically increasing 的。类似的，若 $\le n$ 蕴含 $\ge f(n)$ ，则函数 $f (n)$ 是单调递减 monotonically decreasing 的。若 $m < n$ 蕴含 $f (m) < f (n)$ ，则函数 $f (n)$ 是严格递增 strictly increasing 的。若 $m < n$ 蕴含 $f (m) > f (n)$ ，则函数 $f (n)$ 是严格递减 strictly decreasing 的。

2.2 向下取整与向上取整

对任意实数 $x$ ，我们用 $\lfloor x \rfloor$ 表示小于或等于 $x$ 的最大整数（读作 the floor of x ），并用 $\lceil x \rceil$ 表示大于或等于 $x$ 的最小整数（读作 the ceiling of x ）。对所有实数 $x$ ： $\tag{3.3} x - 1 < \lfloor x \rfloor \le x \le \lceil x \rceil < x+1$

对任意整数 $n$ ： $\lceil n/ 2\rceil + \lfloor n / 2\rfloor = n$ 对任意实数 $\ge 0$ 和整数 $a, b > 0$ ： $\begin{aligned} \lceil \dfrac{ \lceil x / a \rceil}{b} \rceil = \lceil \dfrac{x} {ab} \rceil \\ \lfloor \dfrac{ \lfloor x / a \rfloor}{b} \rfloor = \lfloor \dfrac{x} {ab} \rfloor \\ \lceil \dfrac{a}{b} \rceil \le \dfrac{a+(b-1) } {b} \\ \lfloor \dfrac{a}{b} \rfloor \ge \dfrac{a - (b-1) } {b} \end{aligned}$

向下取整函数 $\lfloor x \rfloor$ 是单调递增的，向上取整函数 $\lceil x \rceil$ 也是单调递增的。

2.3 模运算

对任意整数 $a$ 和任意正整数 $n$ ， $\bmod n$ 的值就是商 quotient $a / n$ 的余数 remainder, or residue ： $\tag{3.8} a \bmod n = a - n \lfloor a / n \rfloor$ 结果有 $\tag{3.9} 0 \le a \bmod n < n$ 给定一个整数除以另一个整数的余数的良定义后，可以方便地引入表示余数相等（即同余）的特殊记号 it is convenient to provide special notation to indicate equality of remainders ——若 $\bmod n) = (b \bmod n)$ ，则记 $\equiv b\ (\bmod\ n)$ ，并称模 $n$ 时 $a$ 等价于 $b$ a is equivalent to b, modulo n 。即， $\equiv b\ (\bmod n)$ 当且仅当 $a$ 和 $b$ 除以正整数 $n$ 的余数相同。等价地， $a\equiv b\ (\bmod\ n)$ 当且仅当 $n$ 是 $b - a$ 的一个因子（或写成 $\mid (b - a)$ ）。若模 $n$ 时 $a$ 不等价于 $b$ ，则记 $\cancel{\equiv} b\ (\bmod\ n)$ 。

2.4 多项式

给定一个非负整数 $d$ ， $n$ 的 $d$ 次多项式 a polynomial in n of degree d 为「具有以下形式的一个函数 $p (n)$ 」： $\sum^d_{i = 0} a_i n^i$ 其中常量 $a_0, a_1, \dots, a_d$ 是多项式的系数且 $a_d \ne 0$ 。一个多项式为渐近正的、当且仅当 $a_d > 0$ 。对于一个 $d$ 次渐近正的多项式 $p (n)$ ，有 $\Theta(n^d)$ 。

对任意实常量 $\ge 0$ ，函数 $n^a$ 单调递增；对任意实常量 $\le 0$ ，函数 $n^a$ 单调递减。若对某个常量 $k$ ，有 $f(n)= O(n^k)$ ，则称函数 $f (n)$ 是多项式有界 polynomially bounded 的。

2.5 指数

对所有实数 $0,\ m, n$ ，有以下恒等式：
$\begin{aligned} &a^0 = 1 \\ &a^1 = a\\ &a^{-1} = \dfrac{1}{a} \\ &(a^m)^n = a^{mn} \\ &(a^m)^n = (a^n)^m \\ &a^ma^n = a^{m+n} \end{aligned}$ 对所有 $n$ 和 $a\ge 1$ ，函数 $a^n$ 关于 $n$ 单调递增。方便时，我们假定 $0^0 = 1$ 。

可以通过以下事实，使多项式与指数的增长率互相关联。对所有实常量 $a\ (a > 1), b$ ，有： $\lim_{n \to \infin} \dfrac{n^b} {a^n} = 0 \tag{3.10}$

据此可得： $n^b = o(a^n)$

因此，任意底大于 $1$ 的指数函数比任意多项式函数增长得快。

使用 $e$ 来表示自然对数函数的底 $2.71828\dots$ ，对所有实数 $x$ ，我们有： $e^x = 1 + x + \dfrac{x^2}{2!} + \dfrac{x^3}{3!} +\dots = \sum^{\infin}_{i = 0} \dfrac{x^i}{i!} \tag{3.11}$ 对所有实数 $x$ ，我们有不等式： $e^x \ge 1 + x \tag{3.12}$

其中只有当 $x = 0$ 时等号才成立。当 $\le 1$ 时，我们有近似估计： $\le e^x \le 1 + x +x^2 \tag{3.13}$ 当 $\to 0$ 时，用 $1 + x$ 作为 $e^x$ 的近似是相当好的： $e^x = 1+ x+ \Theta(x^2)$

在这里插入图片描述

2. 递归式

递归式与递归方法（如分治等）是紧密相关的，因为使用递归式可以很自然地刻画这些算法（如分治算法）的运行时间。一个递归式 recurrence 就是一个等式或不等式，它通过「在更小的输入上的函数值」来描述一个函数 A recurrence is an equation or inequality that describes a function in terms of its value on smaller inputs 。例如，在算导2.3.2节中，我们用递归式描述了 MERGE-SORT 过程的最坏情况运行时间 $T (n)$ ：
$\begin{cases} \Theta(1) \quad &若n=1 \\ 2T(n/2) + \Theta(n) \quad &若n>1 \end{cases}$ 求解可得 $\Theta(n\log n)$ 。

递归式可以有很多形式。例如，一个递归算法可能将问题划分为规模不等的子问题，如 $2 / 3$ 对 $1 / 3$ 的划分。如果分解和合并步骤都是线性时间的，这样的算法会产生递归式 $\Theta(n)$ 。

子问题的规模不必是原问题规模的一个固定比例。例如，线性查找的递归版本（练习2.1-3）仅生成一个子问题，其规模仅比原问题的规模少一个元素。每次递归调用将花费常量时间、再加上「下一层递归调用的时间」，因此递归式为 $\Theta(1)$ 。

我们主要需要掌握三种求解递归式的方法，即得出算法的 $\Theta$ 或 $O$ 渐近界的方法：

代入法。我们猜测一个界，然后用数学归纳法证明这个界是正确的。
递归树法。将递归式转换为一棵树，其结点表示不同层次的递归调用产生的代价。然后采用边界和技术来求解递归式。
主方法。可求解「形如以下公式的递归式」的界。 $\tag{4.2}$ 其中 $\ge 1, b > 1$ ， $f (n)$ 是一个给定的函数。这种形式的递归式很常见，它刻画了这样一个分治算法：生成 $a$ 个子问题，每个子问题的规模是原问题规模的 $1 / b$ ，分解和合并步骤总共花费时间为 $f (n)$ 。
为了使用主方法，必须要熟记三种情况，但是一旦掌握了这种方法，确定很多简单递归式的渐近界就变得很容易。在算导第四章分治策略中，就使用主方法来确定最大子数组问题和矩阵相乘问题的分治算法的运行时间，其他使用分治策略的算法也将用主方法进行分析。

我们偶尔会遇到不是等式、而是不等式的递归式，例如：

$\le 2 T(n/2) + \Theta(n)$ 。因为这样一种递归式仅描述了 $T (n)$ 的一个上界，因此可以用大 $O$ 符号、而非 $\Theta$ 符号来描述其解。
类似地，如果不等式为 $\ge 2T(n/2) + \Theta(n)$ ，则由于递归式只给出了 $T (n)$ 的一个下界，我们应使用 $\Omega$ 符号来描述其解。

递归式技术细节

在实际应用中，我们会忽略递归式声明和求解的一些技术细节。例如，如果对 $n$ 个元素调用 MERGE-SORT ，当 $n$ 为奇数时，两个子问题的规模分别为 $\lfloor n / 2\rfloor$ 和 $\lceil n / 2\rceil$ ，准确来说都不是 $n / 2$ ，因为当 $n$ 是奇数时， $n / 2$ 不是一个整数。技术上，描述 MERGE-SORT 最坏情况运行时间的准确的递归式为：
$\begin{cases} \Theta(1) \quad &若n=1 \\ T( \lceil n / 2\rceil ) + T( \lfloor n / 2\rfloor ) + \Theta(n) \quad &若n>1 \end{cases} \tag{4.3}$

边界条件是另一类我们通常忽略的细节。由于对于一个常量规模的输入，算法的运行时间为常量，因此对于足够小的 $n$ ，表示算法运行时间的递归式一般为 $\Theta(1)$ 。因此，出于方便，我们一般忽略递归式的边界条件，假设对很小的 $n$ ， $T (n)$ 为常量。例如，递归式 $(4.1)$ 常被表示为： $\Theta(n) \tag{4.4}$

去掉了 $n$ 很小时函数值的显式描述。原因在于，虽然改变 $T (1)$ 的值会改变递归式的精确解，但改变幅度不会超过一个常数因子，因而函数的增长阶不会变化。

当声明、求解递归式时，我们常常忽略向下取整、向上取整及边界条件。我们先忽略这些细节，稍后再确定这些细节对结果是否有较大影响。通常影响不大，但我们需要知道什么时候会影响不大。这一方面可以依靠经验来判断，另一方面，一些定理也表明，对于很多刻画分治算法的递归式，这些细节不会影响其渐近界（参见算导定理4.1）。但是这里会讨论某些细节，展示递归式求解方法的要点。

3. 用代入法求解递归式

在渐近时间复杂度分析中，常常用递归式 recurrences 刻画算法的运行时间。下面学习如何求解递归式，并从代入法 substitution method 开始。

代入法求解递归式分为两步：

猜测解的形式 Guess the form of the solution ；
用数学归纳法求出解中的常数，并证明解是正确的 Use mathematical induction to find the constants and show that the solution works 。

当将归纳假设应用于较小的值时，我们将猜测的解代入函数 We substitute the guessed solution for the function when applying the inductive hypothesis to smaller values（就是在一个归纳假设下进行归纳证明！），因此得名为“代入法”。这种方法很强大，但我们必须能猜出解的形式，以便将其代入。

我们可以用代入法为递归式建立上界或下界。例如，我们确定下面递归式的上界：
$\lfloor n / 2 \rfloor ) + n\tag{4.19}$

该递归式与递归式 $(4.3), (4.4)$ 相似。我们猜测其解为 $O(n\log n)$ 。代入法要求证明：恰当选择正常数 $c > 0$ ，可有 $\le c n \log n$ 。首先假定此上界对所有正数 $m < n$ 都成立，特别是对于 $\lfloor n / 2\rfloor$ ，有 $T(\lfloor n / 2\rfloor) \le c \lfloor n /2 \rfloor \log( \lfloor n / 2\rfloor)$ 。将其代入递归式，得到：
$\le 2 ( c\ \lfloor n / 2\rfloor \log ( \lfloor n / 2\rfloor )) +n \le cn \log (n / 2) + n\\ = cn\log n - cn\log 2 + n \\ = cn\log n - cn + n \le cn \log n$ 其中，只要 $\ge 1$ ，最后一步都会成立。

处理边界

数学归纳法要求我们证明解在边界条件下也成立。为证明这一点，我们通常证明对于归纳证明，边界条件适合作为基本情况。对递归式 $(4.19)$ 我们必须证明，通过选择足够大的常数 $c$ ，可以使得上界 $\le cn \log n$ 对边界条件也成立。这一要求有时可能引起问题。例如，为了方便讨论，假设 $T (1) = 1$ 是递归式唯一的边界条件。对 $n = 1$ ，边界条件 $\le cn\log n$ 推导出 $\le c \times 1 \log 1 = 0$ ，与 $T (1) = 1$ 矛盾。因此，我们的归纳证明的基本情况不成立。

我们稍微多付出一点努力，就可以克服这个障碍，对特定的边界条件证明归纳假设成立。例如，在递归式 $(4.19)$ 中，渐近符号仅要求我们对 $\ge n_0$ 证明 $\le cn \log n$ ，其中 $n_0$ 是我们可以自己选择 we get to choose 的常数，我们可以充分利用这一点。我们保留麻烦的边界条件 $T (1)$ ，但将其从归纳证明中移除。为了做到这一点，首先观察到对于 $n > 3$ ，递归式并不直接依赖 $T (1)$ 。因此，将归纳证明中的基本情况 $T (1)$ 替换为 $T (2), T (3)$ ，并令 $n_0 = 2$ 。注意，我们将递归式的基本情况 $(n = 1)$ 和归纳证明的基本情况 $=2\ \textrm{and}\ n=3)$ 区分开来了。由于 $T (1) = 1$ ，从递归式推导出 $T (2) = 4, T (3) = 5$ 。现在可以完成归纳证明：对某个常数 $\ge 1$ ， $\le c n \log n$ ，方法是选择足够大的 $c$ ，满足 $\le c 2 \log 2$ 和 $\le c 3 \log 3$ 。事实上，任何 $\ge 2$ 都能保证 $n = 2, n = 3$ 的基本情况成立。对于我们所要讨论的大多数递归式来说，扩展边界条件使归纳假设对较小的 $n$ 成立，是一种简单直接的方法，我们将不再总是显式说明这方面的细节。

做出好的猜测

遗憾的是，并不存在通用的方法来猜测递归式的正确解。猜测解要靠经验，偶尔还需要创造力。幸运的是，我们可以使用一些启发式方法、帮助自己成为一个好的猜测者。也可以使用递归树来做出好的猜测，在算法导论4.4节看到这一方法。

如果要求解的递归式与曾见到的递归式相似，那么猜测一个类似的解是合理的。例如，考虑如下递归式： $\lfloor n / 2\rfloor + 17) + n$ 看起来很困难，因为在等式右边 $T$ 的参数中增加了 $17$ 。但直观上，增加的这一项不会显著影响递归式的解。当 $n$ 较大时， $\lfloor n / 2\rfloor$ 和 $\lfloor n / 2 \rfloor + 17$ 的差距不大：都是接近 $n$ 的一半。因此，我们猜测 $O(n\log n)$ ，可以使用代入法验证这个猜测是正确的（见算导练习4.3-6）。

另一种做出好的猜测的方法是，先证明递归式较松的上界和下界，然后缩小不确定的范围。例如，对递归式 $(4.19)$ ，我们可以从下界 $\Omega(n)$ 开始，因为递归式中包含 $n$ 这一项，还可以证明一个初始上界 $T(n) = O(n^2)$ 。然后，我们可以逐渐降低上界、提升下界，直到收敛到渐近紧确界 $\Theta(n\log n)$ 。

微妙的细节

有时我们可能正确猜出了递归式解的渐近界，但莫名其妙地在归纳证明时失败了。问题常常出在归纳假设不够强，无法证出准确的界。当遇到这种障碍时，如果修改猜测，将它减去一个低阶的项，数学证明常常能顺利进行。

考虑如下递归式： $\lfloor n / 2 \rfloor) + T( \lceil n / 2\rceil ) + 1$ 我们猜测 $T (n) = O (n)$ ，并尝试证明对某个恰当选出的常数 $c$ ， $\le cn$ 成立。将我们的猜测代入递归式，得到： $\le c\lfloor n / 2 \rfloor + c \lceil n / 2\rceil + 1 = cn + 1$

这并不意味着，对任意 $c$ 都有 $\le cn$ 。我们可能忍不住尝试猜测一个更大的界，比如 $T(n) = O(n^2)$ ，虽然从这个猜测也能推出结果，但原来的猜测 $T (n) = O (n)$ 是正确的。然而为了证明它是正确的，我们必须做出更强的归纳假设。

直接上，我们的猜测是解决正确的：只差一个常数 $1$ ，一个低阶项。但是，除非我们证明与归纳假设严格一致的形式，否则数学归纳法还是会失败。克服这个困难的方法是，从先前的猜测中减去一个低阶项。新的猜测为 $\le cn - d$ ， $d$ 是大于等于 $0$ 的一个常数。我们现在有：
$\le (c \lfloor n / 2 \rfloor - d) + (c \lceil n / 2\rceil - d) + 1 \\ = cn - 2d + 1 \le cn - d$ 只要 $\ge 1$ ，此式就成立。与以前一样，我们必须选择足够大的 $c$ 来处理边界条件。

你可能发现，减去一个低阶项的想法与直觉是相悖的。毕竟，如果证明上界失败了，就应该将猜测增加、而不是减少，更松的界难道不是更容易证明吗？不一定！当利用归纳法证明一个上界时，实际上证明一个更弱的上界可能会更困难一些，因为为了证明一个更弱的上界，我们在归纳证明中也必须使用同样更弱的界。在当前的例子中，当递归式包含超过一个递归项时，将猜测的界减去一个递归项，意味着每次对每个递归项都减去一个低阶项。在上例中，我们减去常数 $d$ 两次，一次是对 $\lfloor n / 2 \rfloor$ 项，另一次是对 $\lceil n / 2 \rceil$ 项。我们以不等式 $\le cn - 2d + 1$ 结束，可以很容易地找到一个 $d$ 值，使得 $c n - 2 d + 1$ 小于等于 $c n - d$ 。

避免陷阱

使用渐近符号很容易出错。例如，在递归式 $(4.19)$ 中，我们可能错误地“证明” $T (n) = O (n)$ ：猜测 $\le cn$ ，并论证： $\le 2 (c \lfloor n / 2\rfloor) + n \le cn + n = O(n)$ 因为 $c$ 是常数。错误在于我们并未证出「与归纳假设严格一致的格式 the exact form of the inductive hypothesis 」，即 $\le cn$ 。因此，当要证明 $T (n) = O (n)$ 时，需要显式地证出 $\le cn$ 。

改变常量

有时，一个小的代数运算可以将一个未知的递归式，变为你所熟悉的形式。例如，考虑如下递归式： $\lfloor \sqrt{n} \rfloor) + \log n$ 它看起来很困难。但我们可以通过改变变量来简化它。为方便起见，我们不必担心值的舍入误差问题，只考虑 $\sqrt{n}$ 是整数的情形即可。令 $\log n$ ，得到： $T(2^m)=2T ( 2^{m/2}) +m$

现在重命名 $S(m) = T(2^m)$ ，得到新的递归式： $S (m) = 2 S (m / 2) + m$ 它与递归式 $(4.19)$ 非常像。这个新的递归式确实与 $(4.19)$ 具有相同的解： $O(m\log m)$ 。再从 $S (m)$ 转换为 $T (n)$ ，我们得到： $T(n) = T(2^m) = S(m) = O(m \log m) = O(\log n \log \log n)$

在这里插入图片描述

3. 用递归树方法求解递归式

虽然我们可以用代入法、简洁地证明一个解确实是递归式的正确解，但想出一个好的猜测可能会很困难。画出递归树 recursion tree ，如在算导2.3.2节分析归并排序的递归式时所做的那样，是设计好的猜测的一种简单而直接的方法。在递归树中，每个结点表示一个单一子问题的代价，子问题对应某次递归函数调用。我们将树中每层中的代价求和，得到每层代价，然后将所有层的代价求和，得到所有层次的递归调用的总代价。

递归树最适合用来生成好的猜测，然后即可用代入法来验证猜测是否正确。当使用递归树来生成好的猜测时，常常需要忍受一点儿“不精确” sloppiness ，因为稍后才会验证猜想是否正确。但如果在画递归树和代价求和时非常仔细，就可以用递归树直接证明解是否正确。在本节中，我们使用递归树生成好的猜测，在算导4.6节中，使用递归树直接证明主方法的基础定理。

我们以递归式 $3T(\lfloor n / 4\rfloor ) + \Theta(n^2)$ 为例来看一下，如何用递归树生成一个好的猜测。首先关注如何寻找解的一个上界。因为我们知道，舍入对求解递归式通常没有影响（此处就是我们需要忍受不精确的一个例子），因此可以为递归式 $\lfloor n / 4 \rfloor) + cn^2$ 创建一棵递归树，其中已将渐近符号改写为隐含的常数系数 $c > 0$ 。

图4-5显示了如何从递归式 $\lfloor n / 4\rfloor ) +cn^2$ 构造出递归树。为方便起见，我们假定 $n$ 是 $4$ 的幂（忍受不精确的另一个例子），这样所有子问题的规模均为正数。图4-5(a)显示了 $T (n)$ ，它在图4-5(b)中扩展为一棵等价的递归树。根结点中的 $cn^2$ 项表示在递归调用顶层的代价 the cost at the top level of recursion ，根结点的三棵子树表示规模为 $n / 4$ 的子问题所产生的代价 the costs incurred by the subproblems of size n/4 。图4-5 c)显示了进一步构造递归树的过程，通过将图4-5(b)中代价为 $T (n / 4)$ 的结点逐一扩展，根的三个子结点的代价为 $c(n / 4)^2$ 。我们继续扩展树中每个结点，将其分解为由递归式确定的组成部分 its constituent parts as determined by the recurrence 。
在这里插入图片描述
因为子问题的规模每一步减少为上一步的 $1 / 4$ ，所以最终必然会达到边界条件。那么根结点与规模为 $1$ 的子问题距离多远呢？深度（从 $0$ 开始）为 $i$ 的结点对应规模为 $n/ 4^i$ 的子问题，因此当 $n / 4^i = 1$ 或等价地 $i = \log_4 n$ 时，子问题规模变为 $1$ 。因此，递归树有 $log_4 n+1$ 层（深度为 $2,\dots, \log_4 n$ ）。

接下来确定树的每一层的代价。每层的结点数都是上一层的 $3$ 倍，因此深度为 $i$ 的结点数为 $3^i$ 。因为每一层子问题规模都是上一层的 $1 / 4$ ，所以对 $\dots, \log_4n-1$ ，深度为 $i$ 的每个结点的代价为 $c(n / 4^i) ^2$ 。做一下乘法可得，对 $\dots, \log_4n-1$ ，深度为 $i$ 的所有结点的代价为 $3^i c (n / 4^i) ^2 = (3 / 16)^i cn ^2$ 。树的最底层深度为 $log_4 n$ ，有 $3^{ \log_4 n} = n^{ \log_4 3}$ 个结点（对数函数互换公式），每个结点的代价为 $T (1)$ ，总代价为 $n^{ \log_4 3 } T(1)$ 即 $\Theta(n^{\log_4 3})$ ，因为假定 $T (1)$ 是常量。

现在我们求所有层次的代价之和，确定整棵树的代价：
$\begin{aligned} T(n) &= cn^2 + \dfrac{3}{16} cn^2 + ( \dfrac{3}{16}) ^2 cn^2 + \dots + ( \dfrac{3}{16}) ^{\log_4 n -1} cn^2 + \Theta(n ^{ \log _4 3}) \\ &= \sum^{ \log_4 n - 1}_{i = 0} (\dfrac{3}{16})^i cn^2 + \Theta(n^{ \log_4 3}) \\ &=\dfrac{ (3 / 16)^{ \log_4 n } - 1} { (3 / 16) - 1} cn^2 + \Theta(n^{\log_4 3}) \end{aligned}$

最后的这个公式看起来有些凌乱，但我们可以再次充分利用一定程度的不精确，并利用无限递减几何级数作为上界。回退一步（应用算导公式 $A . 6$ ），我们得到：
$\begin{aligned} T(n) &= \sum^{ \log_4 n - 1}_{i = 0} (\dfrac{3}{16})^i cn^2 + \Theta(n^{ \log_4 3}) \\ &< \sum^{\infin}_{i=0} (\dfrac{3}{16}) ^i cn^2 + \Theta(n^{\log_4 3}) \\ &= \dfrac{1}{1 - (3 / 16)} cn^2 + \Theta(n^{\log_4 3}) \\ &= \dfrac{16}{13} cn^2 + \Theta(n^{\log_4 3}) \\ &= O(n^2) \end{aligned}$ 这样，对原始的递归式 $\lfloor n / 4\rfloor) + \Theta(n^2)$ ，我们推导出了一个猜测 $T(n) = O(n^2)$ 。在本例中， $cn^2$ 的系数形成了一个递减几何级数，可得出这些系数的和的一个上界——常数 $16 / 13$ 。由于根结点对总代价的贡献为 $cn^2$ ，所以根结点的代价占总代价的一个常数比例 the root contributes a constant fraction of the total cost 。换句话说，根结点的代价支配了整棵树的总代价 the cost of the root dominates the total cost of the tree 。

实际上，如果 $O(n^2)$ 确实是递归式的上界（稍后就会证明这一点），那么它必然是一个紧确界。为什么？因为第一次（即最顶层？）递归调用的代价为 $\Theta(n^2)$ ，因此 $\Omega(n^2)$ 必然是递归式的一个下界。

现在用代入法验证猜测是正确的，即 $T(n) = O(n^2)$ 是递归式 $\lfloor n / 4\rfloor ) + \Theta(n^2)$ 的一个上界。我们希望证明 $\le dn^2$ 对某个常数 $d > 0$ 成立。与之前一样，使用常数 $c > 0$ ，我们有：
$\begin{aligned} T(n) &\le 3T( \lfloor n / 4\rfloor ) + cn^2 \le 3d \lfloor n / 4\rfloor ^2 + cn^2\\ &\le 3d(n /4)^2 + cn^2 = \dfrac{3}{16} dn^2 + cn^2 \le dn^2 \end{aligned}$ 当 $\ge (16/13)c$ 时，最后一步推导成立。

在另一个更复杂的例子中，图4-6显示了如下递归式的递归树： $T (n) = T (n / 3) + T (2 n / 3) + O (n)$
在这里插入图片描述

（为简单起见，再次忽略了舍入问题）与之前一样，令 $c$ 表示 $O (n)$ 项中的常数因子。对图中显示出的递归树的每个层次，当求代价之和时，我们发现每层的代价均为 $c n$ 。从根到叶的最长简单路径是 $\to (2 / 3) n \to (2 / 3)^2n \to \dots \to 1$ 。由于当 $k = \log_{3 / 2} n$ 时， $2/3)^k n = 1$ ，因此树高为 $log_{3/2} n$ （再加 $1$ ？）。

直觉上，我们期望递归式的解最多是层数乘以每层的代价，即 $O(cn \log_{3/2} n) = O(n\log n)$ 。但图4-6仅显示了递归树的顶部几层，并不是递归树中每个层次的代价都是 $c n$ 。考虑叶结点的代价。如果递归树是一棵高度为 $log_{3/2} n$ 的完全二叉树，则叶结点的数量应为 $2^{\log_{3/2} n} = n ^{ \log_{3/2} 2}$ 。由于每个叶结点的代价为常数，因此所有叶结点的总代价为 $\Theta(n^{\log_{3/2} 2})$ 。而且，当从根结点逐步向下走时，越来越多的内结点是缺失的。因此，递归树中靠下的层次对总代价的贡献小于 $c n$ 。我们可以计算出所有代价的准确值，但记住我们只是希望得到一个猜测，用于代入法。我们还是忍受一些不精确，尝试证明猜测的上界 $O(n\log n)$ 是正确的。

我们确实可以用代入法，验证 $O(n\log n)$ 是递归式解的一个上界。我们来证明 $\le dn \log n$ ，其中 $d$ 是一个适当的正常数。我们有：
$\begin{aligned} T(n) &\le T(n / 3) + T(2n / 3) + cn \\ &\le d(n / 3) \log (n/3) + d(2n/ 3) \log (2n / 3) + cn \\ &= ( d(n/3) \log n - d(n / 3) \log 3) + ( d( 2n/ 3) \log n - d(2n / 3) \log (3/2) ) + cn \\ &= dn \log n - d (( n / 3) \log 3 + ( 2n/ 3) \log ( 3/ 2)) + cn \\ &= dn\log n - d (( n / 3) \log 3 + (2n/3) \log 3 - (2n/ 3) \log 2) + cn \\ &= dn\log n - dn(\log 3 - 2 / 3) + cn \\ &\le dn \log n\end{aligned}$

只要 $\ge \dfrac{c}{ \log 3 - (2 / 3) }$ 。因此，无需对递归树的代价进行更精确的计算。

用主方法求解递归式

主方法为如下形式的递归式，提供了一种“菜谱式”的求解方法：
$\tag{4.20}$

其中 $\ge 1$ 和 $b > 1$ 是常数， $f (n)$ 是渐近正函数。为了使用主方法，需要牢记三种情况，但随后就可以很容易地求解很多递归式，通常不需要纸和笔的帮助。

递归式 $(4.20)$ 描述的是这样一种算法的运行时间：它将规模为 $n$ 的问题分解为 $a$ 个子问题，每个子问题规模为 $n / b$ ，其中 $a, b$ 都是正常数。 $a$ 个子问题递归地进行求解，每个花费时间 $T (n / b)$ 。函数 $f (n)$ 包含了问题分解和子问题解合并的代价。例如，描述 Strassen 算法的递归式中 $\Theta(n^2)$ 。

从技术的正确性方面看，此递归式实际上并不是良定义 well defined 的，因为 $n / b$ 可能不是整数。但将 $a$ 项 $T (n / b)$ 都替换为 $\lfloor n / b \rfloor)$ 或 $\lceil n / b \rceil)$ 并不会影响递归式的渐近性质（之后证明这个断言）。因此，我们通常发现，当写下这种形式的分治算法的递归式时，忽略舍入问题是很方便的。

1. 主定理

主方法依赖于下面的定理：

定理4.1（主定理）令 $a\ge 1, b>1$ 是常数， $f (n)$ 是一个函数， $T (n)$ 是定义在非负整数上的递归式： $T (n) = a T (n / b) + f (n)$ 其中我们将 $n / b$ 解释为 $\lfloor n / b \rfloor$ 或 $\lceil n / b \rceil$ 。那么 $T (n)$ 有如下渐近界：

若对某个常数 $\varepsilon > 0$ 有 $O(n^{\log_b a - \varepsilon})$ ，则 $\Theta(n^{\log_b a})$ 。
若 $\Theta(n^{\log_b a})$ ，则有 $\Theta(n^{\log_b a} \log n)$ 。
若对某个常数 $\varepsilon > 0$ 有 $\Omega(n^{ \log_b a + \varepsilon } )$ ，且对某个常数 $c < 1$ 和所有足够大的 $n$ 有 $\le cf(n)$ ，则 $\Theta(f(n))$ 。

在使用主定理之前，花一点时间尝试理解一下它的含义。对于三种情况的每一种，我们将函数 $f (n)$ 与函数 $n^{ \log_b a}$ 进行比较。直觉上，两个函数较大者决定了递归式的解。若函数 $n^{\log_b a}$ 更大，如情况1，则解为 $\Theta(n ^{ \log_b a})$ 。若函数 $f (n)$ 更大，如情况3，则解为 $\Theta(f(n))$ 。若两个函数大小相当，如情况2，则乘上一个对数因子，解为 $\Theta( n^{ \log_b a} \log n)= \Theta(f(n) \log n)$ 。

在此直觉之外，我们需要了解一些技术细节。在第一种情况中，不是 $f (n)$ 小于 $n^{\log_b a}$ 就够了，而是要多项式意义上的小于 polynomially smaller 。也就是说， $f (n)$ 必须渐近小于 $n^{ \log_b a}$ 、且要相差一个因子 $n^{ \varepsilon}$ ，其中 $\varepsilon$ 是大于 $0$ 的常数 f(n) must be asymptotically smaller than n^log_ba by a factor of n^ε for some constant ε > 0 。在第三种情况中，不是 $f (n)$ 大于 $n^{ \log_b a}$ 就够了，而是要多项式意义的大于 polynomially larger ，而且还要满足“正则 regularity ”条件 $\le cf(n)$ 。我们将会遇到的多项式界的函数中，多数都满足此条件 This condition is satisfied by most of the polynomially bounded functions that we shall encounter 。

注意：这三种情况并未覆盖 $f (n)$ 的所有可能性。情况1和情况2之间有一定间隙， $f (n)$ 可能小于 $n^{ \log_b a}$ 但不是多项式意义上的小于。类似地，情况2和情况3之间也有一定间隙， $f (n)$ 可能大于 $n^{\log_b a}$ 但不是多项式意义上的大于。如果函数 $f (n)$ 落在这两个间隙中，或者情况3中要求的正则条件不成立，就不能使用主方法来求解递归式 If the function f(n) falls into one of these gaps, or if the regularity condition in case 3 fails to hold, you cannot use the master method to solve the recurrence 。

2. 使用主方法

使用主方法很简单，我们只需确定主定理的哪种情况成立，即可得到解。我们先看下面这个例子： $T (n) = 9 T (n / 3) + n$

对于这个递归式，我们有 $a = 9, b = 3, f (n) = n$ ，因此 $n^{\log_b a } = n^{ \log_3 9} = \Theta(n^2)$ 。由于 $n^{ \log_3 9 - \varepsilon })$ ，其中 $\varepsilon = 1$ ，因此可以应用主定理的情况1，从而得到解 $\Theta(n^2)$ 。

现在考虑： $T (n) = T (2 n / 3) + 1$

其中 $a = 1, b = 3 / 2, f (n) = 1$ ，因此 $n^{\log_b a} = n^{ \log_{ 3/2} 1} = n^0 = 1$ 。由于 $\Theta(n^{\log_b a}) = \Theta(1)$ ，因此应用情况2，从而得到解 $\Theta(\log n)$ 。

对于递归式： $n\log n$

我们有 $n\log n$ ，因此 $n^{ \log_b a} = n^{\log_4 3} = O(n^{0.793})$ 。由于 $\Omega(n^{ \log_4 3 + \varepsilon})$ ，其中 $\varepsilon \approx 0.2$ ，因此如果可以证明正则条件成立，则可应用情况3。当 $n$ 足够大时，对于 $c = 3 / 4$ ， $\log (n / 4) \le (3 / 4) n\log n = cf(n)$ 。因此由情况3，递归式的解为 $\Theta(n\log n)$ 。

主方法不能用于如下递归式： $n\log n$

虽然这个递归式看起来有恰当的形式： $n\log n$ ，以及 $n^{\log_b a} = n$ 。我们可能错误地认为应该应用情况3，因为 $n\log n$ 渐近大于 $n^{\log_b a} = n$ 。问题出在它并不是多项式意义上的大于 The problem is that it is not polynomially larger（渐近大于不等同于多项式意义上的大于！）。对任意正常数 $\varepsilon$ ，比值 $f(n) / n^{ \log_b a} = (n \log n) / n = \log n$ 都渐近小于 $n^{\varepsilon}$ 。因此，递归式落入了情况2和情况3之间的间隙（此递归式的解参见算导练习4.6-2）。或者说，对任意正常数 $\varepsilon > 0$ ， $n\log n = \Omega(n^{ \log_b a + \varepsilon}) = \Omega(n\times n^{\varepsilon})$ 都不成立，更别说正则条件了。

我们利用主方法，求解算导4.1节和4.2节见过的递归式 $(4.7)$ ： $+\Theta(n)$

它刻画了最大子数组问题和归并排序分治算法的运行时间（按照通常的做法，我们忽略了递归式中基本情况的描述）。这里，我们有 $\Theta(n)$ ，因此 $n^{ \log_b a} = n^{\log_2 2} = n$ 。由于 $\Theta(n)$ ，应用情况2，于是得到解 $\Theta(n \log n)$ 。

算导递归式 $(4.17)$ ： $\Theta(n^2)$ 它描述了矩阵乘法问题第一个分治算法的运行时间。我们有 $\Theta(n^2)$ ，因此 $n^{ \log_b a} = n^{ \log_2 8} = n^3$ 。由于 $n^3$ 多项式意义上大于 $f (n)$ （即对某个正常数 $\varepsilon = 1$ ， $O(n^{3 - \varepsilon})$ ），应用情况1，解为 $\Theta(n^3)$ 。

最后考虑算导递归式 $(4.18)$ ： $\Theta(n^2)$ 它描述了 Strassen 算法的运行时间。这里，我们有 $=\Theta(n^2)$ ，因此 $n^{\log_b a} = n^{\log_2 7}$ 。将 $log_2 7$ 改写为 $\log 7$ ，由于 $\log 7 < 2.81$ ，我们知道对 $\varepsilon = 0.8$ ，有 $O(n^{\log 7 - \varepsilon})$ 。再次应用情况1，我们得到解 $\Theta(n^{\log 7})$ 。

证明主定理

算导4.6节给出了主定理（定理4.1）的证明。但如果只是为了使用主定理，可以不必理解这个证明。证明分为两个部分。第一部分分析主递归式 $(4.20)$ ——为简单起见，假定 $T (n)$ 仅定义在 $b\ (b > 1)$ 的幂上，即仅对 $b^2, \dots$ 定义，这一部分给出了「为理解主定理是正确的」所需的所有直接知识。随后，第二部分显示了如何将分析扩展到所有正整数 $n$ ；这一部分应用了处理向下和向上取整问题的数学技巧。

在这一节，有时会稍微滥用渐近符号，用来描述仅仅定义在 $b$ 的幂上的函数的行为。回忆一下，渐近符号的定义要求对所有足够大的数都证明函数的界、而不是仅仅对 $b$ 的幂。因为可以定义出「仅仅应用于集合 $\{ b^i \mid i = 0, 1, 2, \dots \}$ 上、而非所有非负数上的新的渐近符号」，所以这种滥用问题不大。