chi square-卡方分布的定义及性质

chi square-卡方分布的定义及性质摘要χ2\chi^2χ2分布 (卡方分布) 的定义gammagammagamma 分布gammagammagamma 分布的期望、方差及距生成函数χ2\chi^2χ2分布的 pdfχ2\chi^2χ2分布的性质χ2\chi^2χ2分布与正态分布的关系scipy 中的函数附录参考文献摘要χ2\chi^2χ2分布 (卡方分布) 的定义gammagamma...

kdaHugh

27031人浏览 · 2020-04-11 19:55:00

kdaHugh · 2020-04-11 19:55:00 发布

chi square-卡方分布的定义及性质

摘要
$\chi^2$ 分布 (卡方分布) 的定义
$\chi^2$ 分布的性质
$\chi^2$ 分布与正态分布的关系
scipy 中的函数
附录
参考文献

摘要

本文将介绍卡方分布的定义及相关性质，以及卡方分布与正态分布的关系。

$\chi^2$ 分布 (卡方分布) 的定义

$g a m m a$ 分布

首先， $\chi^2$ 分布是一种特殊的 $g a m m a$ 分布。所以在看卡方分布的定义及性质之前，我们先来看 Gamma 分布的定义。

$g a m m a$ 分布由两个参数 $\alpha$ 和 $\beta$ 决定。 $gamma(\alpha, \, \beta)$ 的概率密度函数 (pdf) 为：
$\displaystyle f(x|\alpha, \beta) = \dfrac{1}{\Gamma(\alpha) \beta^\alpha} x^{\alpha - 1} e^{-x/\beta},\, 0 < x < \infty, \alpha > 0, \beta > 0 \tag{1}$
其中 $\Gamma(x)$ 是 gamma 函数， $\displaystyle \Gamma(\alpha) = \int_{0}^{\infty} t^{\alpha - 1} e^{-t} dt$ 。

在 $gamma(\alpha, \, \beta)$ 分布中，如果我们令 $\alpha = p / 2, \, \beta = 2$ ，那么我们就得到了自由度为 $p$ 的 $\chi^2$ 分布，记为 $\chi^2_p$ 分布。

$g a m m a$ 分布的期望、方差及距生成函数

在看卡方分布的性质之前，我们先看一下 $g a m m a$ 分布的性质。

假设 $\sim gamma(\alpha, \, \beta)$ ，那么我们有
$\mathbb{E}(X) = \alpha \beta, \text{Var}(X) = \alpha \beta^2$
证明过程可参见 [1]。我们在附录中给出 $\text{Var}(X) = \alpha \beta^2$ 的证明。

$g a m m a$ 分布的距生成函数 (moment-generating function, mgf) 为
$\displaystyle M_X(t) = \mathbb{E}(e^{tx}) = \Big ( \dfrac{1}{1 - \beta t} \Big) ^{\alpha}, t < \dfrac{1}{\beta}$ 。

其证明过程可参见 Casella Example 2.3.8。

另外，根据 Casella Theorem 4.6.7，我们知道如果
$X_1 \sim gamma(\alpha_1, \beta), \, X_1 \sim gamma(\alpha_2, \beta), \cdots, X_n \sim gamma(\alpha_n, \beta)$ ，
且 $X_i$ 是独立的，那么
$X_1 + X_2 + \cdots X_n \sim gamma(\alpha_1 + \alpha_2 + \cdots + \alpha_n, \beta)$
即 $n$ 个独立的有相同 $\beta$ 参数的 $g a m m a$ 分布的和仍然是一个 $g a m m a$ 分布。

$\chi^2$ 分布的 pdf

把 $\alpha = p / 2, \, \beta = 2$ 代入 $gamma(\alpha, \, \beta)$ 的 pdf，我们有
$\vert p) = \frac{1}{\Gamma(p / 2) 2^{p / 2}} x^{\frac{p}{2} - 1} e^{-x / 2}, \, \, \, \, 0 < x < \infty \tag{2}$
这便是 $\chi^2_p$ 分布的概率密度函数。

$\chi^2$ 分布的性质

由于 $\chi^2_p$ 分布是 $\alpha = p / 2$ , $\beta = 2$ 的 $g a m m a$ 分布，故我们可以直接套用 $g a m m a$ 分布的期望与方差公式。
$\mathbb{E}_{\chi^2_p}(X) = p, \text{Var}_{\chi^2_p}(X) = 2p$

另外，根据独立 $g a m m a$ 分布的相加性的性质，我们有对于独立的 $\chi^2_p$ 分布 $X_i \sim \chi^2_{p_i}$ ，那么 $\displaystyle \sum X_i \sim \chi^2_{\sum p_i}$ 。
即 $n$ 个独立的 $\chi^2$ 分布的和仍然是一个 $\chi^2$ 分布，加和分布的自由度等于所有自由度的和。

$\chi^2$ 分布与正态分布的关系

$\chi^2$ 分布与正态分布有什么关系呢？

首先，如果 $\sim N(0, 1)$ ，即 $Z$ 服从标准正态分布，那么 $Z^2 \sim \chi^2_1$ 。即标准正态分布的平方服从自由度为 1 的卡方分布。证明过程比较直接，参见附录。

另外，我们有如下定理。

如果有 $n$ 个独立同分布的正态分布 $X_i \sim N(\mu, \, \sigma^2), i = 1, \, 2, \, \cdots, n$ 。样本方差为 $\displaystyle S^2 =\dfrac{1}{n - 1} \sum_{i = 1}^n (X_i - \bar{X})^2$ 。那么 $\displaystyle (n - 1)S^2/\sigma^2$ 服从自由度为 $n - 1$ 的 $\chi^2$ 分布。

这个结论的证明可见 Casella Theorem 5.3.1。

scipy 中的函数

scipy 中 chi2 可以用来产生 $\chi^2$ 分布的各种相关函数。

pdf(x, df, loc=0, scale=1) 是自由度为 df 的 $\chi^2$ 分布的 pdf；
rvs(df, loc=0, scale=1, size=1, random_state=None) 可以生成 size 个服从自由度为 df 的 $\chi^2$ 分布的随机数；
cdf(x, df, loc=0, scale=1) 是自由度为 df 的 $\chi^2$ 分布的 cdf；
ppf(q, df, loc=0, scale=1) 是自由度为 df 的 $\chi^2$ 分布的分位数。

附录

$g a m m a$ 分布的方差公式。

假设 $\sim gamma(\alpha, \, \beta)$ 。这里我们假设已经证明了 $\mathbb{E} (X) = \alpha \beta$ 。我们计算 $\mathbb{E} (X^2)$ 。

$\begin{aligned} \mathbb{E}(X^2) &= \int_0^{\infty} x^2 \dfrac{1}{\Gamma(\alpha) \beta^\alpha} x^{\alpha - 1} e^{-x/\beta} dx \\ &= \dfrac{1}{\Gamma(\alpha) \beta^\alpha} \int_0^{\infty} x^{\alpha + 1} e^{-x/\beta} dx \end{aligned}$
因为我们知道 $\displaystyle \int_0^{\infty} x^{\alpha - 1} e^{-x/\beta} dx = \Gamma(\alpha) \beta^\alpha$ （根据 pdf 积分为1 可知），所以我们有 $\displaystyle \int_0^{\infty} x^{\alpha + 1} e^{-x/\beta} dx= \Gamma(\alpha + 2) \beta^{\alpha + 2} = (\alpha + 1) \Gamma(\alpha + 1) \beta^{\alpha + 2} =\alpha (\alpha + 1) \Gamma(\alpha) \beta^{\alpha + 2}$ 。故 $\mathbb{E} (X^2) = \alpha (\alpha + 1) \beta^2$ 。

于是，
$\begin{aligned} \text{Var}(X) &= \mathbb{E} (X^2) - (\mathbb{E} (X))^2 \\ &= \alpha (\alpha + 1) \beta^2 - ( \alpha \beta)^2 \\ &=\alpha \beta^2 \end{aligned}$ 。

标准正态分布的平方

假设 $\sim N(0, 1)$ ， $Y = X^2$ 。我们要求出 $Y$ 的分布。我们计算 $\leq k), k > 0$ 。求出累积分布函数 $F (k)$ 之后，我们可以对 $F (k)$ 求导，来求出 $Y$ 的概率密度函数。

$\begin{aligned} F(k) = P(Y \leq k) &= P(-\sqrt{k} \leq X \leq \sqrt{k}) \\ &= \int_{-\sqrt{k}}^{\sqrt{k}} \frac{1}{\sqrt{2 \pi}} e^{-x^2 / 2} dx \\ &= \int_{-\infty}^{\sqrt{k}} \frac{1}{\sqrt{2 \pi}} e^{-x^2 / 2} dx - \int_{-\infty}^{-\sqrt{k}} \frac{1}{\sqrt{2 \pi}} e^{-x^2 / 2} dx \end{aligned}$
对 $F (k)$ 求导，我们有
$\begin{aligned} \frac{d}{dk} F(k) &= \frac{1}{\sqrt{2 \pi}} e^{-(\sqrt{k})^2 / 2} \frac{d}{dk} (\sqrt{k}) - \frac{1}{\sqrt{2 \pi}} e^{-(-\sqrt{k})^2 / 2} \frac{d}{dk} (-\sqrt{k}) \\ &= \frac{1}{\sqrt{2 \pi}} e^{-\frac{k}{2}} \frac{1}{\sqrt{k}} \end{aligned}$

这正是
$\vert p) = \frac{1}{\Gamma(p / 2) 2^{p / 2}} x^{\frac{p}{2} - 1} e^{-x / 2}, \, \, \, \, 0 < x < \infty$
当 $p = 1$ 时卡方分布 pdf 的表达式。

于是， $\sim \chi^2_1$ 。

参考文献

[1] George Casella, Roger L. Berger, Statistical inference, Chapter 3.3

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

国外的文献怎么找：实用检索方法与资源平台推荐

2048 AI社区

Numpy基础知识

NumPy的核心价值在于矩阵运算优化：并行计算优势：矩阵操作可实现批量数据处理，显著提升AI训练效率数学基础：支持矩阵求逆、求导等高等数学运算，满足机器学习算法需求性能对比：相比Python原生列表，NumPy数组计算速度提升10-100倍Numpy的版本选择与安装推荐安装numpy==1.26.1，通过pip list命令可查看已安装库的版本,Python第三方库镜像地址与配置,使用镜像地址加速

2048 AI社区

面向通用矩阵乘法（GEMM）负载的GPU建模方法：原理、实现与多场景应用价值

本文所论述的面向GEMM负载的GPU建模方法，通过创新的多级协同建模机制，在缓存、指令、计算强度与硬件利用率等多个维度实现深度融合，为GPU密集型应用提供了精准、可解释、可迁移的性能预测工具。其在AI训练、推理优化、稀疏计算及集群调度中的成功应用，凸显了该方法不仅具有学术前瞻性，更具备扎实的工程落地价值和广泛的商业应用前景。在算力日益成为核心竞争力的今天，此类性能建模技术将成为释放硬件潜能、优化系