t-分布(学生分布), t-distribution 的定义及性质
t-分布, t-distribution 的定义及性质摘要ttt-分布的定义摘要ttt-分布的定义
t-分布, t-distribution 的定义及性质
摘要
本文将简要介绍 t t t 分布 (学生分布)的定义及性质。 t t t分布可以由正态分布抽样的样本均值与样本方差定义得到,也可以直接通过其概率密度函数定义得到。
t t t-分布的定义
t t t-分布与正态分布抽样的关系
假设我们有一个正态分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2), X 1 , X 2 , ⋯ , X n X_1, \, X_2, \cdots, \, X_n X1,X2,⋯,Xn 是独立的来自 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) 的抽样随机变量。于是, X 1 , X 2 , ⋯ , X n X_1, \, X_2, \cdots, \, X_n X1,X2,⋯,Xn 的样本均值 ( X ˉ \bar{X} Xˉ) 与样本方差 ( S 2 S^2 S2) 分别为:
X ˉ = ∑ i = 1 n X i n , S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 \bar{X} = \frac{\sum_{i = 1}^n X_i}{n}, S^2 =\dfrac{1}{n - 1} \sum_{i = 1}^n (X_i - \bar{X})^2 Xˉ=n∑i=1nXi,S2=n−11i=1∑n(Xi−Xˉ)2
我们在卡方分布那一篇文章 [1] 中介绍过, ( n − 1 ) S 2 / σ 2 \displaystyle (n - 1)S^2/\sigma^2 (n−1)S2/σ2 服从的是自由度为 n − 1 n - 1 n−1 的 χ 2 \chi^2 χ2 分布。
现在我们考虑 X ˉ − μ S / n \displaystyle \frac{\bar{X} - \mu}{S / \sqrt{n}} S/nXˉ−μ。经过简单的代数处理,我们有 X ˉ − μ S / n = ( X ˉ − μ ) / ( σ / n ) S 2 / σ 2 \displaystyle \frac{\bar{X} - \mu}{S / \sqrt{n}} =\frac{(\bar{X} - \mu) / (\sigma / \sqrt{n})}{\sqrt{S^2 / \sigma^2}} S/nXˉ−μ=S2/σ2(Xˉ−μ)/(σ/n)。
可以看到,分子 ( X ˉ − μ ) / ( σ / n ) \displaystyle (\bar{X} - \mu) / (\sigma / \sqrt{n}) (Xˉ−μ)/(σ/n) 服从标准正态分布,而 S 2 / σ 2 \sqrt{S^2 / \sigma^2} S2/σ2 是 χ n − 1 2 / ( n − 1 ) \sqrt{\chi^2_{n - 1} / (n - 1)} χn−12/(n−1) 。我们定义 X ˉ − μ S / n \displaystyle \frac{\bar{X} - \mu}{S / \sqrt{n}} S/nXˉ−μ 服从的分布为自由度是 n − 1 n - 1 n−1 的 t t t-分布。
换言之,
定义 : 如果我们有两个独立的随机变量 U , V U, \, V U,V。 U ∼ N ( 0 , 1 ) U \sim N(0, 1) U∼N(0,1), V ∼ χ p 2 V \sim \chi^2_p V∼χp2。即 U U U 服从标准正态分布, V V V 服从自由度为 p p p 的卡方分布。那么 U / V / p U / \sqrt{V / p} U/V/p 服从的分布是一个自由度为 p p p 的 t t t-分布。
t t t-分布的概率密度函数
我们也可以直接从 t t t-分布的概率密度函数(pdf)来定义 t t t-分布。如果随机变量 X X X 的 pdf 为
f X ( t ) = Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π ( 1 + t 2 / p ) − p + 1 2 , − ∞ < t < ∞ , (1) f_{X} (t) = \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} (1 + t^2 / p)^{-\frac{p + 1}{2}}, -\infty < t < \infty ,\tag{1} fX(t)=Γ(2p)Γ(2p+1)pπ1(1+t2/p)−2p+1,−∞<t<∞,(1)
我们称 X X X 服从自由度为 p p p 的 t t t-分布。
那么如何去验证根据之前通过标准正态分布与卡方分布定义的 t t t-分布的 pdf 就是 (1) 呢。在 Casella 书中用的是经典的构造二元变换的方法去证明的。有兴趣的读者可参加 Casella Definition 5.3.4 后面的证明 [2]。
t t t-分布的性质
t t t-分布的期望与方差
假设 X p X_p Xp 是服从自由度为 p p p 的 t t t-分布,那么我们有
E ( X p ) = 0 , p > 1 ; \mathbb{E} ( X_p ) = 0, p > 1; E(Xp)=0,p>1; Var ( X p ) = p p − 2 , p > 2. \text{Var} (X_p) = \frac{p}{p - 2}, p > 2. Var(Xp)=p−2p,p>2. 而当 p = 1 p = 1 p=1 时, t t t-分布的期望不存在;当 p ≤ 2 p \leq 2 p≤2 时, t t t-分布的方差不存在。
t t t-分布的期望与方差的证明略微复杂。
我们先来看期望。
当 p = 1 p = 1 p=1, t t t-分布的期望不存在。这是因为当 p = 1 p = 1 p=1时, t t t-分布的 pdf 为 f ( t ) = 1 π 1 1 + t 2 \displaystyle f(t) = \frac{1}{\pi} \frac{1}{1 + t^2} f(t)=π11+t21。正好是 Cauchy 分布的 pdf。我们知道 Cauchy 分布的期望是没定义的(undefined)。故自由度为 1 的 t t t-分布的期望也是没定义的。
当 p > 1 p > 1 p>1 时,
E ( X p ) = ∫ − ∞ ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 d t , p > 1 \displaystyle \mathbb{E}(X_p) = \int_{-\infty}^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt, \, p > 1 E(Xp)=∫−∞∞Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1tdt,p>1。
我们要证明 E ( X p ) = 0 \displaystyle \mathbb{E}(X_p) = 0 E(Xp)=0。
注意这里我们不能用被积分函数 Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 \displaystyle \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1t 是奇函数来证明它的积分等于 0。这是因为积分上下限均为无穷大,要证明这个 improper 积分有定义,我们必须证明 ∫ 0 ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_0^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫0∞Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1tdt 是有限的(当 p > 1 p > 1 p>1 时)。下面我们来看积分
∫ 0 ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 d t . \displaystyle \int_0^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt. ∫0∞Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1tdt.
把常数提取出来,我们须要证明 ∫ 0 ∞ t ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_0^{\infty} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫0∞(1+t2/p)2p+1tdt 是有限的。首先做变换 u = t p \displaystyle u = \frac{t}{\sqrt{p}} u=pt,我们有 ∫ 0 ∞ t ( 1 + t 2 / p ) p + 1 2 d t = p ∫ 0 ∞ u ( 1 + u 2 ) p + 1 2 d u \displaystyle \int_0^{\infty} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt = p \int_0^{\infty} \frac{u}{ (1 + u^2)^{\frac{p + 1}{2}} } du ∫0∞(1+t2/p)2p+1tdt=p∫0∞(1+u2)2p+1udu。然后再做变换 y = ( 1 + u 2 ) − 1 y = (1 + u^2)^{-1} y=(1+u2)−1。于是我们有 p ∫ 0 ∞ u ( 1 + u 2 ) p + 1 2 d u = p 2 ∫ 0 1 y p − 3 2 d y \displaystyle p \int_0^{\infty} \frac{u}{ (1 + u^2)^{\frac{p + 1}{2}} } du = \frac{p}{2} \int_0^1 y^{\frac{p - 3}{2}} dy p∫0∞(1+u2)2p+1udu=2p∫01y2p−3dy。因为 p > 1 p > 1 p>1,所以 ∫ 0 1 y p − 3 2 d y = 2 p − 1 \displaystyle \int_0^1 y^{\frac{p - 3}{2}} dy = \frac{2}{p - 1} ∫01y2p−3dy=p−12。所以 p ∫ 0 ∞ u ( 1 + u 2 ) p + 1 2 d u = p 2 ∫ 0 1 y p − 3 2 d y = p p − 1 \displaystyle p \int_0^{\infty} \frac{u}{ (1 + u^2)^{\frac{p + 1}{2}} } du = \frac{p}{2} \int_0^1 y^{\frac{p - 3}{2}} dy = \frac{p}{p - 1} p∫0∞(1+u2)2p+1udu=2p∫01y2p−3dy=p−1p。从而 ∫ 0 ∞ t ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_0^{\infty} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫0∞(1+t2/p)2p+1tdt 是有限的。故我们可以得出 E ( X p ) = ∫ − ∞ ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 d t = 0 \displaystyle \mathbb{E}(X_p) = \int_{-\infty}^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt = 0 E(Xp)=∫−∞∞Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1tdt=0,当 p > 1 p > 1 p>1 的时候。
E ( X p ) = 0 , p > 1 \mathbb{E} ( X_p ) = 0, p > 1 E(Xp)=0,p>1。
下面再来看 t t t-分布的方差。当 p = 1 p = 1 p=1时,由于 t t t-分布的期望没有定义,所以其方差也没有定义。当 p = 2 p = 2 p=2时,我们要证明 t t t-分布的方差还是没有定义。这就须要计算 E ( X 2 ) \mathbb{E} (X^2) E(X2)。当 p = 2 p = 2 p=2 时,
E ( X 2 ) = ∫ − ∞ ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t 2 ( 1 + t 2 / p ) p + 1 2 d t \mathbb{E} (X^2) = \int_{-\infty}^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t^2}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt E(X2)=∫−∞∞Γ(2p)Γ(2p+1)pπ1(1+t2/p)2p+1t2dt
把常数项 Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π \displaystyle \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} Γ(2p)Γ(2p+1)pπ1 提出积分号外,我们须要计算
∫ − ∞ ∞ t 2 ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_{-\infty}^{\infty} \frac{t^2}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫−∞∞(1+t2/p)2p+1t2dt。类似上面我们计算期望的技巧,首先先做变换 u = t p \displaystyle u = \frac{t}{\sqrt{p}} u=pt,我们有 ∫ − ∞ ∞ t 2 ( 1 + t 2 / p ) p + 1 2 d t = p p ∫ − ∞ ∞ u 2 ( 1 + u 2 ) p + 1 2 d u \displaystyle \int_{-\infty}^{\infty} \frac{t^2}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt = \displaystyle p \sqrt{p} \int_{-\infty}^{\infty} \frac{ u^2}{ (1 + u^2)^{\frac{p + 1}{2}} } du ∫−∞∞(1+t2/p)2p+1t2dt=pp∫−∞∞(1+u2)2p+1u2du。再做变换 y = ( 1 + u 2 ) − 1 y = (1 + u^2)^{-1} y=(1+u2)−1,我们有
∫ − ∞ ∞ u 2 ( 1 + u 2 ) p + 1 2 d u = 2 ∫ 0 ∞ u 2 ( 1 + u 2 ) p + 1 2 d u = ∫ 0 1 ( 1 − y ) 1 / 2 y p 2 − 2 d y \displaystyle \int_{-\infty}^{\infty} \frac{ u^2}{ (1 + u^2)^{\frac{p + 1}{2}} } du =2 \int_{0}^{\infty} \frac{ u^2}{ (1 + u^2)^{\frac{p + 1}{2}} } du = \int_0^1 (1 - y)^{1 / 2} y^{\frac{p}{2} - 2} dy ∫−∞∞(1+u2)2p+1u2du=2∫0∞(1+u2)2p+1u2du=∫01(1−y)1/2y2p−2dy.
于是,当 p = 2 p = 2 p=2 时,积分就变成了 ∫ 0 1 ( 1 − y ) 1 / 2 y − 1 d y \displaystyle \int_0^1 (1 - y)^{1 / 2} y^{-1} dy ∫01(1−y)1/2y−1dy。这个积分是无穷大的,所以 E ( X 2 ) = ∞ \mathbb{E} (X^2) = \infty E(X2)=∞。于是当 p = 2 p = 2 p=2 时, X X X 的方差为无穷大。
而当 p > 2 p > 2 p>2 时, ∫ 0 1 ( 1 − y ) 1 / 2 y p 2 − 2 d y = Γ ( 3 2 ) Γ ( p 2 − 1 ) Γ ( p + 1 2 ) \displaystyle \int_0^1 (1 - y)^{1 / 2} y^{\frac{p}{2} - 2} dy = \frac{\Gamma(\frac{3}{2}) \Gamma(\frac{p}{2} - 1)}{\Gamma(\frac{p + 1}{2})} ∫01(1−y)1/2y2p−2dy=Γ(2p+1)Γ(23)Γ(2p−1)。把常数项加上,我们有
E ( X 2 ) = Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π × p p × Γ ( 3 2 ) Γ ( p 2 − 1 ) Γ ( p + 1 2 ) = p p − 2 \displaystyle \mathbb{E} (X^2) = \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \times p \sqrt{p} \times \frac{\Gamma(\frac{3}{2}) \Gamma(\frac{p}{2} - 1)}{\Gamma(\frac{p + 1}{2})} = \frac{p}{p - 2} E(X2)=Γ(2p)Γ(2p+1)pπ1×pp×Γ(2p+1)Γ(23)Γ(2p−1)=p−2p
于是, Var ( X ) = p p − 2 \displaystyle \text{Var} (X) = \frac{p}{p - 2} Var(X)=p−2p,当 p > 2 p > 2 p>2 时。
t t t-分布的平方
假设 X ∼ t q X \sim t_q X∼tq,即 X X X 服从自由度为 q q q 的 t t t-分布。那么 X 2 ∼ F 1 , q X^2 \sim F_{1, \, q} X2∼F1,q,即 X 2 X^2 X2 服从自由度为 ( 1 , q ) (1, \, q) (1,q) 的 F F F-分布。
我们知道自由度为 p p p 和 q q q 的 F F F-分布的 pdf 为
f F ( x ) = Γ ( p + q 2 ) Γ ( p 2 ) Γ ( q 2 ) ( p q ) p / 2 x p / 2 − 1 [ 1 + ( p / q ) x ] ( p + q ) / 2 , 0 < x < ∞ f_F(x) = \frac{\Gamma(\frac{p + q}{2})}{\Gamma(\frac{p}{2}) \Gamma(\frac{q}{2})} \left( \frac{p}{q} \right)^{p / 2} \frac{x^{p / 2 - 1}}{[1 + (p / q) x]^{(p + q) / 2}}, 0 < x < \infty fF(x)=Γ(2p)Γ(2q)Γ(2p+q)(qp)p/2[1+(p/q)x](p+q)/2xp/2−1,0<x<∞
那么自由度为 1 和 q q q 的 F F F-分布的 pdf 就为:
f F ( x ) = Γ ( 1 + q 2 ) Γ ( 1 2 ) Γ ( q 2 ) ( 1 q ) 1 / 2 x − 1 / 2 [ 1 + ( x / q ) ] ( 1 + q ) / 2 = Γ ( 1 + q 2 ) Γ ( q 2 ) 1 π q x − 1 / 2 [ 1 + ( x / q ) ] ( 1 + q ) / 2 \begin{aligned} f_F(x) &= \frac{\Gamma(\frac{1 + q}{2})}{\Gamma(\frac{1}{2}) \Gamma(\frac{q}{2})} \left( \frac{1}{q} \right)^{1 / 2} \frac{x^{-1/2}}{[1 + (x / q)]^{(1 + q) / 2}} \\ &= \frac{\Gamma(\frac{1 + q}{2})}{\Gamma(\frac{q}{2})} \frac{1}{\sqrt{\pi q}} \frac{x^{-1/2}}{[1 + (x / q)]^{(1 + q) / 2}} \\ \end{aligned} fF(x)=Γ(21)Γ(2q)Γ(21+q)(q1)1/2[1+(x/q)](1+q)/2x−1/2=Γ(2q)Γ(21+q)πq1[1+(x/q)](1+q)/2x−1/2
我们须要证明 X 2 X^2 X2 服从的分布正好是自由度为 1 和 q q q 的 F F F-分布。
这里的证明方法和我们在《chi square-卡方分布的定义及性质》 附录中证明正态分布平方的方法一样,先表示出 X 2 X^2 X2 的累积分布函数,然后求导。具体计算方法如下。
F ( k ) = P ( Y ≤ k ) = P ( − k ≤ x ≤ k ) = ∫ 0 k Γ ( q + 1 2 ) Γ ( q 2 ) 1 q π ( 1 + t 2 q ) − q + 1 2 d t − ∫ 0 − k Γ ( q + 1 2 ) Γ ( q 2 ) 1 q π ( 1 + t 2 q ) − q + 1 2 d t \begin{aligned}F(k) &= P(Y \leq k) = P(-\sqrt{k} \leq x \leq \sqrt{k} ) \\ &= \int_0^{\sqrt{k}} \frac{\Gamma({\frac{q + 1}{2})}}{\Gamma({\frac{q}{2}})} \frac{1}{\sqrt{q \pi}} \left( 1 + \frac{t^2}{q} \right)^{-\frac{q + 1}{2}} dt - \int_0^{-\sqrt{k}} \frac{\Gamma({\frac{q + 1}{2})}}{\Gamma({\frac{q}{2}})} \frac{1}{\sqrt{q \pi}} \left( 1 + \frac{t^2}{q} \right)^{-\frac{q + 1}{2}} dt \\ \end{aligned} F(k)=P(Y≤k)=P(−k≤x≤k)=∫0kΓ(2q)Γ(2q+1)qπ1(1+qt2)−2q+1dt−∫0−kΓ(2q)Γ(2q+1)qπ1(1+qt2)−2q+1dt
对 k k k 求导,有
d F ( k ) d k = Γ ( q + 1 2 ) Γ ( q 2 ) 1 q π ( 1 + k q ) − q + 1 2 1 2 1 k − Γ ( q + 1 2 ) Γ ( q 2 ) 1 q π ( 1 + k q ) − q + 1 2 ( − 1 2 ) 1 k = Γ ( q + 1 2 ) Γ ( q 2 ) 1 q π ( 1 + k q ) − q + 1 2 1 k \begin{aligned} \frac{dF(k)}{dk} &= \frac{\Gamma({\frac{q + 1}{2})}}{\Gamma({\frac{q}{2}})} \frac{1}{\sqrt{q \pi}} \left( 1 + \frac{k}{q} \right)^{-\frac{q + 1}{2}} \frac{1}{2} \frac{1}{\sqrt{k}} - \frac{\Gamma({\frac{q + 1}{2})}}{\Gamma({\frac{q}{2}})} \frac{1}{\sqrt{q \pi}} \left( 1 + \frac{k}{q} \right)^{-\frac{q + 1}{2}} (-\frac{1}{2}) \frac{1}{\sqrt{k}} \\ &= \frac{\Gamma({\frac{q + 1}{2})}}{\Gamma({\frac{q}{2}})} \frac{1}{\sqrt{q \pi}} \left( 1 + \frac{k}{q} \right)^{-\frac{q + 1}{2}} \frac{1}{\sqrt{k}} \end{aligned} dkdF(k)=Γ(2q)Γ(2q+1)qπ1(1+qk)−2q+121k1−Γ(2q)Γ(2q+1)qπ1(1+qk)−2q+1(−21)k1=Γ(2q)Γ(2q+1)qπ1(1+qk)−2q+1k1
这就是自由度为 1 和 q q q 的 F F F-分布的 pdf。 □ \square □
当 p → ∞ p \rightarrow \infty p→∞ 时 t t t-分布的极限
当 p → ∞ p \rightarrow \infty p→∞ 时,对于任意 x x x, t t t-分布的 pdf f ( x ∣ p ) → 1 2 π e − x 2 / 2 \displaystyle f(x \vert p) \rightarrow \frac{1}{\sqrt{2 \pi}} e^{-x^2 / 2} f(x∣p)→2π1e−x2/2.
这里我们用 Gamma 分布的 Stirling 公式近似来证明。Stirling 公式是说 lim n → ∞ e n n ! n n n = 2 π \displaystyle \lim_{n \rightarrow \infty} \frac{e^n n!}{n^n \sqrt{n}} = \sqrt{2 \pi} n→∞limnnnenn!=2π。而对于 Gamma 函数,我们有
Γ ( z ) = 2 π z ( z e ) z ( 1 + O ( 1 z ) ) \Gamma(z) = \sqrt{\frac{2 \pi}{z}} \left( \frac{z}{e} \right)^z \left( 1 + \mathcal{O} \big( \frac{1}{z} \big) \right) Γ(z)=z2π(ez)z(1+O(z1))
代入 t t t-分布的 pdf,我们有
lim p → ∞ Γ ( p + 1 2 ) Γ ( p 2 ) = 2 π p + 1 2 2 π p 2 ( ( p + 1 2 e ) p + 1 2 ( p 2 e ) p 2 ) ( 1 + O ( 1 p ) ) → p p + 1 p + 1 2 e ( 1 + 1 p ) p 2 = p / 2 \begin{aligned} \lim_{p \rightarrow \infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma(\frac{p}{2})} &= \frac{\sqrt{\frac{2 \pi}{\frac{p + 1}{2}}}}{ \sqrt{ \frac{ 2 \pi }{ \frac{p}{2} } } } \left( \frac{ (\frac{ p + 1 }{ 2e })^{\frac{ p + 1 }{ 2 }} }{ ( \frac{ p }{2e} )^{\frac{ p }{ 2 }} } \right) (1 + \mathcal{O} (\frac{1}{p} ) ) \\ & \rightarrow \sqrt{ \frac{p}{p + 1} } \sqrt{ \frac{p + 1}{2 e} }\left(1 + \frac{1}{p} \right)^{\frac{p}{2}} = \sqrt{p / 2} \end{aligned} p→∞limΓ(2p)Γ(2p+1)=2p2π2p+12π((2ep)2p(2ep+1)2p+1)(1+O(p1))→p+1p2ep+1(1+p1)2p=p/2
我们知道 ( 1 + t 2 / p ) − p + 1 2 → e − t 2 2 \displaystyle (1 + t^2 / p)^{-\frac{p + 1}{2}} \rightarrow e^{-\frac{t^2}{2}} (1+t2/p)−2p+1→e−2t2 。代入上面得到的 Gamma 函数的近似,我们有 f ( x ∣ p ) → 1 2 π e − x 2 / 2 \displaystyle f(x \vert p) \rightarrow \frac{1}{\sqrt{2 \pi}} e^{-x^2 / 2} f(x∣p)→2π1e−x2/2。
事实上,因为我们知道 t t t-分布的 pdf 积分为 1,所以 Gamma 函数部分只是一个 normalization factor。所以我们在得到 ( 1 + t 2 / p ) − p + 1 2 → e − t 2 2 \displaystyle (1 + t^2 / p)^{-\frac{p + 1}{2}} \rightarrow e^{-\frac{t^2}{2}} (1+t2/p)−2p+1→e−2t2 之后,就可以说 t t t-分布的 pdf 当 p → ∞ p \rightarrow \infty p→∞ 的极限是标准正态分布的 pdf 。
Python包中的 t t t-分布
我们可以用 Python 中的 scipy.stats.t 来计算常用的与 t t t-分布相关的值。
from scipy.stats import t
t.pdf(x, df) # 自由度为 df 的 t-分布的pdf 在 x 的值
t.ppf(q, df) # 自由度为 df 的 t-分布的q 分位值。0 <= q <=1
t.cdf(x, df) # 自由度为 df 的 t-分布的 cdf 在 x 的值
t.rvs(df, size=1) # 生成大小为 size 的随机变量
参考文献
[2] George Casella, Roger L. Berger, Statistical inference, Chapter 5.3
更多推荐

所有评论(0)