期望的最大值与最大值的期望

先上结论:maxiE[Xi]≠E[maxiXi]max_i \mathbb{E}[X_i]\neq \mathbb{E}[max_i X_i]maxiE[Xi]=E[maxiXi]

情况一:最大值和数学期望都关于自变量iii

在这种情况下,最大值与期望都依赖于同一个随机变量。设有一个随机变量 XiX_iXi,其中 iii 是一个离散的索引集合,例如 i=1,2,…,ni = 1, 2, \dots, ni=1,2,,n

1.最大值的期望
假设我们有 nnn 个独立同分布的随机变量 X1,X2,…,XnX_1, X_2, \dots, X_nX1,X2,,Xn,我们关心的是它们的最大值的期望。
E[max⁡(X1,X2,…,Xn)]=E[max⁡iXi] \mathbb{E}\left[\max \left(X_1, X_2, \ldots, X_n\right)\right]=\mathbb{E}\left[\max _i X_i\right] E[max(X1,X2,,Xn)]=E[imaxXi]

  1. 期望的最大值
    另一种情况是先计算每个随机变量的期望,然后取这些期望的最大值.
    max⁡iE[Xi] \max _i \mathbb{E}\left[X_i\right] imaxE[Xi]

如果XiX_iXi 的分布相同,则有:
max⁡iE[Xi]=E[X] \max _i \mathbb{E}\left[X_i\right]=\mathbb{E}[X] imaxE[Xi]=E[X]
但通常情况下,该条件不成立.

情况二:最大值关于非自变量,期望关于自变量

在这种情况下,最大值是关于一个非自变量的,而期望是关于自变量的。举个例子,假设我们有一个固定的随机变量 vvv,然后我们对一组随机变量 XiX_iXiiii 是自变量)进行最大化操作。

1.最大值的期望
这里的最大值是关于一个常数变量 vvv 的。数学表达式为:
max⁡vE[Xi] \max _v \mathbb{E}\left[X_i\right] vmaxE[Xi]

  1. 期望的最大值
    在这种情况下,期望是关于自变量 iii 的,而最大值则是关于常数 vvv 的:
    E[max⁡vXi] \mathbb{E}\left[\max _v X_i\right] E[vmaxXi]

下面给出一个反例,说明期望的最大值不等于最大值的期望:

假设有两个节点 v1v_1v1v2v_2v2,每个节点的函数 Lv(xi)L_v(x_i)Lv(xi) 是随机变量的函数。考虑以下情况:

假设
  1. Lv1(xi)=xiL_{v_1}(x_i) = x_iLv1(xi)=xiLv2(xi)=−xiL_{v_2}(x_i) = -x_iLv2(xi)=xi,其中 xix_ixi 是随机变量,且 E[xi]=0\mathbb{E}[x_i] = 0E[xi]=0

  2. 计算 E[max⁡vLv(xi)]E[\max_v L_v(x_i)]E[maxvLv(xi)],即:
    E[max⁡vLv(xi)]=E[max⁡(xi,−xi)]. E[\max_v L_v(x_i)] = E[\max(x_i, -x_i)]. E[vmaxLv(xi)]=E[max(xi,xi)].
    假设 xix_ixi 服从对称分布,比如 xi∼N(0,1)x_i \sim N(0,1)xiN(0,1),则:
    max⁡(xi,−xi)=∣xi∣. \max(x_i, -x_i) = |x_i|. max(xi,xi)=xi∣.
    因此,期望值为:
    E[max⁡(xi,−xi)]=E[∣xi∣]. E[\max(x_i, -x_i)] = E[|x_i|]. E[max(xi,xi)]=E[xi].
    对于标准正态分布,E[∣xi∣]E[|x_i|]E[xi] 是已知的常数,约为 0.798。

  3. 计算 max⁡vE[Lv(xi)]\max_v E[L_v(x_i)]maxvE[Lv(xi)],即:
    max⁡vE[Lv(xi)]=max⁡(E[xi],E[−xi]). \max_v E[L_v(x_i)] = \max(E[x_i], E[-x_i]). vmaxE[Lv(xi)]=max(E[xi],E[xi]).
    由于 E[xi]=0\mathbb{E}[x_i] = 0E[xi]=0E[−xi]=0\mathbb{E}[-x_i] = 0E[xi]=0,因此:
    max⁡vE[Lv(xi)]=0. \max_v E[L_v(x_i)] = 0. vmaxE[Lv(xi)]=0.

结果:
  • E[max⁡vLv(xi)]=E[∣xi∣]≈0.798E[\max_v L_v(x_i)] = E[|x_i|] \approx 0.798E[maxvLv(xi)]=E[xi]0.798
  • max⁡vE[Lv(xi)]=0\max_v E[L_v(x_i)] = 0maxvE[Lv(xi)]=0

结论

由于期望是对整个随机变量分布的平均,而最大值操作通常会使得期望值偏离,因此在一般情况下,交换顺序是不成立的

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐