1. 数理统计---数理统计基本概念

1. 数理统计的基本概念基本思想: 数据⇒\Rightarrow⇒归纳⇒\Rightarrow⇒结果定义: 数理统计是以概率论为基础, 关于实验数据的收集, 整理, 分析与推断的一种科学与艺术.1.1. 数据的收集:总体: 研究对象的全体称为总体个体: 总体中每一个具体的对象称为个体**例子1**: 分析某工厂灯泡的寿命总体--该班厂所有灯泡的寿命个体--每一个灯泡的寿命总体: 研究对象的数量指标

汤宪宇

2562人浏览 · 2020-06-17 16:46:19

汤宪宇 · 2020-06-17 16:46:19 发布

1. 数理统计的基本概念

基本思想: 数据 $⇒\Rightarrow$ 归纳 $⇒\Rightarrow$ 结果
定义: 数理统计是以概率论为基础, 关于实验数据的收集, 整理, 分析与推断的一种科学与艺术.

1.1. 数据的收集:

总体: 研究对象的全体称为总体
个体: 总体中每一个具体的对象称为个体

**例子1**: 分析某工厂灯泡的寿命总体--该班厂所有灯泡的寿命个体--每一个灯泡的寿命

总体: 研究对象的数量指标X $X\sim F(x)$ 个体: 总体X的可能取值

灯泡寿命的例子: **总体**--该厂所有灯泡的寿命X $$X\sim N(\mu, \sigma^2)$$ **个体**--每一个灯泡的使用寿命, 即X的一个可能取值

我知道部分个体的值, 能否预测总体?
假设灯泡服从 $X∼N(μ,σ2),如何预测μ和σX\sim N(\mu, \sigma^2), 如何预测\mu和\sigma$

定义1: 从总体 $X$ 中抽取的部分个体, 得到的数量指标 $X_1, X_2, ..., X_n$ , 若满足下条件:
(1) $X_1, X_2, ..., X_n$ 与 $X$ 同分布;
(2) $X_1, X_2, ..., X_n$ 相互独立.
则称 $X_1, X_2, ..., X_n$ 是来自 $X$ 的一个简单随机样本, 简称样本

样本观测值: 对样本 $X_1, X_2, ..., X_n$ 进行观测后, 得到的观测值: $x_1, x_2, ..., x_n$ 称为样本的观测值.(注意: 小写字母为观测值, 大写字母为样本(随机变量))

样本的联合分布: 设总体 $X∼F(x)X\sim F(x)$ , 则样本 $X_1, X_2, ..., X_n$ 的联合分布函数为:
$F(x_1, ..., x_n)=P\{X_1\leq x_1, ..., X_n\leq x_n\}=\prod_{i=1}^{n}F(x_i)$
若总体 $X$ 的密度函数为 $f (x)$ , 则样本 $X_1, X_2, ..., X_n$ 的联合密度函数为(连续性):
$f(x_1, ..., x_n)=\prod_{i=1}^n f(x_i)$
若总体 $X$ 的分布律为(离散型): $P\{X=a_k\}=p_k, k=1,2, ...$
则样本 $X_1, X_2, ..., X_n$ 的联合分布律为:
$P\{X_1=x_1, X_2=x_2, ..., X_n=x_n\}=P\{X_1=x_1\}*P\{X_2=x_2\}...P\{X_n=x_n\}=\prod_{i=1}^n P\{X=x_i\}$

例子2: 设$X_1, X_2, ..., X_n$是来自总体$N(\mu, \sigma^2)$的样本, 则样本的联合密度函数为: $$f(x_1, x_2, ..., x_n)=\prod_{i=1}^n f(x_i)=\prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x_i-u)^2}{2\sigma^2}}$$

例子3: 设$X_1, X_2, ..., X_n$是来自总体$B(1, p)$的样本, 则样本的联合分布函数为: $$P\{X_1=x_1, ..., X_n=x_n\}=\prod_{i=1}^n P{X=x_i}=\prod_{i=1}^{n}p^{x_1}p^{(1-x_i)}=p^{(\sum_{i=1}^n{x_i})}p^{\sum_{i=1}^n{(1-x_i)}}$$

样本与总体的关系: 总体 $\Downarrow$ $\Uparrow$ 样本 $\Rightarrow$ 样本值

1.2. 数据的整理:

统计量
定义2: 设 $X_1, X_2, ..., X_n$ 是来自总体 $X F (x)$ 的样本, $g(x_1, x_2, ..., x_n)$ 是n元实值连续函数, 若 $g(x_1, x_2, ..., x_n)$ 不含未知参数, 则称 $g(x_1, x_2, ..., x_n)$ 为统计量.

1.2.1 常见的统计量

设 $X_1, X_2, ..., X_n$ 是来自样本X的样本, 则称:
$(1)样本均值Xˉ=1n∑i=1nXi(2)样本方差S2=1n−1∑i=1n(Xi−Xˉ)2样本标准差S=1n−1∑i=1n(Xi−Xˉ)2(3)样本K阶原点矩Ak=1n∑i=1nXik(4)样本K阶中心矩Bk=1n∑i=1n(Xi−Xˉ)k(5)样本极大值,样本极小值,样本极差Rn=X(n)−X(1)\begin{aligned} (1)& 样本均值\bar X=\frac{1}{n}\sum_{i=1}^nX_i\\ (2)& 样本方差S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2\\ &样本标准差S=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2}\\ (3)& 样本K阶原点矩 A_k=\frac{1}{n}\sum_{i=1}^nX_i^k\\ (4)& 样本K阶中心矩 B_k=\frac{1}{n}\sum_{i=1}^n(X_i-\bar X)^k\\ (5)& 样本极大值, 样本极小值, 样本极差 R_n=X_{(n)}-X_{(1)} \end{aligned}$

1.2.2 样本均值与样本方差的数字特征

命题1: 设 $X_1, X_2, ..., X_n$ 是来自总体 $X F (x)$ 的样本, 且总体的均值与方差存在, 记为:
$E(X)=\mu, D(X)=\sigma^2$
则有:
$(1)E(Xˉ)=μ,D(Xˉ)=1nσ2(2)E(S2)=σ2(1)E(\bar X)=\mu, D(\bar X)=\frac{1}{n}\sigma^2\\ (2) E(S^2)=\sigma^2$
证明:
已知 $E(X)=μ,D(X)=σ2E(X)=\mu, D(X)=\sigma^2$
$(1)E(Xˉ)=E(1n∑i=1nXi)=1n∑i=1nE(Xi)=1n∗nμ=μD(Xˉ)=D(1n∑i=1nXi)=1n2∑i=1nD(Xi)(此步用到独立同分布)=1n2∗σ2\begin{aligned} (1) E(\bar X)&=E(\frac{1}{n}\sum_{i=1}^{n}X_i)\\ &=\frac{1}{n}\sum_{i=1}^{n}E(X_i)\\ &=\frac{1}{n}*n\mu=\mu\\ D(\bar X)&=D(\frac{1}{n}\sum_{i=1}^{n}X_i)\\ &=\frac{1}{n^2}\sum_{i=1}^{n}D(X_i)(此步用到独立同分布)\\ &=\frac{1}{n^2}*\sigma^2 \end{aligned}$

(2) 先推导一个公式
$∑i=1n(Xi−Xˉ)2=∑i=1nXi2−nXˉ2左边=∑i=1n(Xi2−2XiXˉ+Xˉ2)=∑i=1nXi2−2∑i=1nXiXˉ+∑i=1nXˉ2=∑i=1nXi2−2Xˉ∑i=1nXi+nXˉ2=∑i=1nXi2−nXˉ2\begin{aligned} \sum_{i=1}^n(X_i-\bar X)^2&=\sum_{i=1}^n X_i^2-n\bar X^2\\ 左边&=\sum_{i=1}^n(X_i^2-2X_i\bar X+\bar X^2)\\ &=\sum_{i=1}^n X_i^2-2\sum_{i=1}^n X_i\bar X+\sum_{i=1}^n \bar X^2\\ &=\sum_{i=1}^n X_i^2-2\bar X\sum_{i=1}^n X_i+n\bar X^2\\ &=\sum_{i=1}^n X_i^2-n\bar X^2 \end{aligned}$
然后证明公式:
$E[∑i=1n(Xi−Xˉ)2]=E[∑i=1nXi2−nXˉ2]=∑i=1nE(Xi2)−nE(Xˉ2)=∑i=1n[D(Xi)+E(Xi)2]−n[D(Xˉ)+E(Xˉ)2]=nσ2+nμ2−n∗1nσ2−n∗μ2=(n−1)σ2(2)\begin{aligned} E[\sum_{i=1}^n(X_i-\bar X)^2]&=E[\sum_{i=1}^n X_i^2-n\bar X^2]\\ &=\sum_{i=1}^n E(X_i^2)-nE(\bar X^2)\\ &=\sum_{i=1}^n [D(X_i)+E(X_i)^2]-n[D(\bar X)+E(\bar X)^2]\\ &=n\sigma^2+n\mu^2-n*\frac{1}{n}\sigma^2-n*\mu^2\\ &=(n-1)\sigma^2 \end{aligned}\tag{2}$
最后得到:
$E(S2)=E(1n−1∑n−11(Xi−Xˉ)2)=1n−1E(∑n−11(Xi−Xˉ)2)=1n−1∗(n−1)σ2=σ2\begin{aligned} E(S^2)&=E(\frac{1}{n-1}\sum_{n-1}^{1}(X_i-\bar X)^2)\\ &=\frac{1}{n-1}E(\sum_{n-1}^{1}(X_i-\bar X)^2)\\ &=\frac{1}{n-1}*(n-1)\sigma^2\\ &=\sigma^2 \end{aligned}$

上面的结果说明了什么?

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI智能体取代传统LLM：架构设计者的终极生存指南

LLM智能体通过记忆、工具和规划三大核心组件的协同工作，实现了超越传统对话式LLM的能力。随着多智能体框架的快速发展，2025年将是智能体技术成熟和应用爆发的重要一年。好了，今天的分享就到这里，我们下期见。

2048 AI社区

论文阅读：arxiv 2025 Benchmarking Adversarial Robustness to Bias Elicitation in Large Language Models: Sc

2048 AI社区

大模型推理加速学习笔记

用一个已经训练好的、庞大而精确的模型（“教师模型”）来指导一个较小的模型（“学生模型”）进行训练。LLM生成Token是串行的（Token_{n+1}依赖于 Token_{0:n}），这是推理的主要延迟来源。生成新Token时，只需计算当前Token的Query向量，并与缓存的历史KV向量进行注意力计算。：现代硬件（如GPU的Tensor Cores）有专门的整数计算单元，执行低精度运算更快、更节