概率论·4 随机变量的数字特征

考纲内容

随机变量的数学期望（均值）、方差、标准差及其性质
随机变量函数的数学期望，矩、协方差、相关系数及其性质

一、数学期望

考纲摘要：理解随机变量数字特征（数学期望、方差、标准差、矩、协方差、相关系数）的概念，会运用数字特征的基本性质，并掌握常用分布的数字特征

1. 数学期望的定义

设离散型随机变量 $X $ 的分布律为 $ P{X=x_k}=p_k,k=1,2,\cdots$ 如果级数 $\sum_{k = 1}^{\infty} x_{k} p_{k}$ 绝对收敛，则称这个级数的和为随机变量 $X$ 的数学期望，记为 E (X)

设连续型随机变量 $X$ 的概率密度为 f (x)，若积分

\int_{- \infty}^{\infty} x f (x) d x

绝对收敛，则称该积分的值为随机变量 $X$ 的数学期望，也记作 E (X)

数学期望也称作期望或均值

2. 随机变量的函数的数学期望

考纲摘要：会求随机变量函数的数学期望。

设 $Y $ 是随机变量 $ X$ 的函数： $Y = g (X)$

离散型的情况； $E (Y) = E [g (X)] = \sum_{k = 1}^{\infty} g (x_{k}) p_{k}$
连续型的情况： $E (Y) = E [g (X)] = \int_{- \infty}^{\infty} g (x) f (x) d x$

这意味着不必算出 $Y $ 的分布律或概率密度（已知 $ X$ 的情况下），也可以求出它的期望

也可以推广到多个随机变量的函数的情况：设 $Z = g (X, Y)$ ，且二维随机变量 X,Y 的概率密度为 f (x,y)，则：

E (Z) = E [g (x, y)] = \int_{- \infty}^{\infty} \int_{- \infty}^{\infty} g (x, y) f (x, y) d x d y

如果是离散型的情况，则：

E (Z) = E [g (x, y)] = \sum_{j = 1}^{\infty} \sum_{i = 1}^{\infty} g (x_{i}, y_{j}) p_{i j}

3. 数学期望的性质

设 $C $ 是常数，则 $ E (C)=C$
$C $ 是常数，$ E (C\cdot X)=C\cdot E (X)$
$E (X + Y) = E (X) + E (Y)$
$E (X Y) = E (X) E (Y)$ ，相互独立的情况下成立

二、方差

1. 方差的定义

设 $X $ 是一个随机变量，若 $ E{[X-E (X)]^2}$ 存在，则称其为 $X$ 的方差，记作 D (X) 或 $Var (X)$ 而 $σ (X) = \sqrt{D (X)}$ 称作标准差或者均方差

方差表达了 $X $ 的取值与其数学期望的偏离程度，其值较小表示 $ X$ 的取值较为集中在 E (X) 附近，其值较大表示 $X $ 的取值较为分散，可以用来衡量 $ X$ 取值的分散程度

D (X) = \sum_{i = 1}^{\infty} [x_{i} - E (X)]^{2} p_{k}

此外，也有：

D (X) = E (X^{2}) - [E (X)]^{2}

对于随机变量 $X^{*} = \frac{X - E (X)}{\sqrt{D (X)}}$ ，其数学期望为 0，方差为 1， $X^{*}$ 称作 $X$ 的标准化变量

2. 方差的性质

设 $C $ 是常数，则 $ D (C)=0$
$D (C X) = C^{2} D (X), D (X + C) = D (X)$
$D (X + Y) = D (X) D (Y) + 2 E {[X - E (X)] [Y - E (Y)]}$
$D (X)=0 $ 的充要条件是 $ P{X=E (X)}=1$

三、协方差及相关系数

1. 协方差与相关系数的定义

协方差： $E {[X - E (X)] [Y - E (Y)]}$ 称作随机变量 X,Y 的协方差，记作 $Cov (X, Y)$
相关系数： $ρ_{X Y} = \frac{Cov (X, Y)}{\sqrt{D (X)} \sqrt{D (Y)}}$ 称作随机变量 X,Y 的相关系数。
柯西-许瓦兹 (Cauchy-Schwarz) 不等式： $[Cov (X, Y)]^{2} \leq D (X) D (Y)$ ，从而有 $| ρ_{X Y} | \leq 1$ 。

由协方差的定义得到的一些基本结论：

$Cov (X, Y) = Cov (Y, X)$
$Cov (X, X) = D (X)$
$D (X + Y) = D (X) + D (Y) + 2 Cov (X, Y)$
$Cov (X, Y) = E (X Y) - E (X) E (Y)$

2. 协方差与相关系数的性质

协方差的性质：

$Cov (a X, b Y) = a b Cov (X, Y)$
$Cov (X_{1} + X_{2}, Y) = Cov (X_{1}, Y) + Cov (X_{2}, Y)$

四、矩与协方差矩阵

1. 矩与协方差矩阵的定义

若 X,Y 是随机变量

$X $ 的 $ k$ 阶原点矩（简称 $k $ 阶矩）： $ E (X^k),k=1,2,\cdots$
$X $ 的 $ k$ 阶中心矩： $E {[X - E (X)]^{k}}$ 显然，D (X) 就是 $X$ 的 2 阶中心距
X,Y 的 $k+l $ 阶混合矩：$ E (X^kY^l)$
X,Y 的 $k+l $ 阶混合中心矩：$ E{[X-E (X)]^k[Y-E (Y)]^l}$ 显然， $Cov (X, Y)$ 就是 X,Y 的 $1 + 1$ 阶混合中心矩

协方差矩阵定义如下：

设随机变量 $(X_{1}, X_{2}, \dots, N_{n})$ 的所有二阶混合中心矩 $c_{i j} = Cov (X_{i}, X_{j}), i, j = 1, 2, \dots, n$ 都存在，则以下矩阵：

C = [\begin{matrix} c_{11} & c_{12} & \dots & c_{1 n} \\ c_{21} & c_{22} & \dots & c_{2 n} \\ ⋮ & ⋮ & ⋮ \\ c_{n 1} & c_{n 2} & \dots & c_{n n} \end{matrix}]

就被称作 $n$ 维随机变量 $(X_{1}, X_{2}, \dots, N_{n})$ 的协方差矩阵，显然， $c_{i j} = c_{j i}$ ，则协方差矩阵是一个对称矩阵

2. $n$ 维正态随机变量

1. 2 维时的情形

二维正态随机变量 $(X_{1}, X_{2}) \sim N (μ_{1}, μ_{2}, σ_{1}^{2}, σ_{2}^{2}, ρ)$ 的概率密度如下：

f (x_{1}, x_{2}) = \frac{1}{2 π σ_{1} σ_{2} \sqrt{1 - ρ^{2}}} \exp {\frac{- 1}{2 (1 - ρ^{2})} [\frac{(x_{1} - μ_{1})^{2}}{σ_{1}^{2}} - 2 ρ \frac{(x_{1} - μ_{1}) (x_{2} - μ_{2})}{σ_{1} σ_{2}} + \frac{(x_{2} - μ_{2})^{2}}{σ_{2}^{2}}]}

显然，随机变量 $(X_{1}, X_{2})$ 的协方差矩阵可以表示如下：

C = [\begin{matrix} D (X_{1}) & Cov (X_{1}, X_{2}) \\ Cov (X_{2}, X_{1}) & D (X_{2}) \end{matrix}] = [\begin{matrix} σ_{1}^{2} & ρ σ_{1} σ_{2} \\ ρ σ_{1} σ_{2} & σ_{2}^{2} \end{matrix}]

其逆矩阵为

C^{- 1} = \frac{1}{| C |} [\begin{matrix} σ_{2}^{2} & - ρ σ_{1} σ_{2} \\ - ρ σ_{1} σ_{2} & σ_{1}^{2} \end{matrix}]

这样一来，二维随机变量 $(X_{1}, X_{2})$ 的概率密度就可以写成：

f (x_{1}, x_{2}) = \frac{1}{(2 π)^{\frac{2}{2}} - | C |^{\frac{1}{2}}} \exp {- \frac{1}{2} (X - μ)^{T} C^{- 1} (X - μ)}

其中：

X = [\begin{matrix} x_{1} \\ x_{2} \end{matrix}], μ = [\begin{matrix} E (X_{1}) \\ E (X_{2}) \end{matrix}]

2. $n$ 维时的情形

对于 $n$ 维正态随机变量 $(X_{1}, X_{2}, \dots, X_{n})$ ，其该概率密度定义为：

f (x_{1}, x_{2}, \dots, x_{n}) = f (x_{1}, x_{2}) = \frac{1}{(2 π)^{n / 2} - | C |^{1 / 2}} \exp {- \frac{1}{2} (X - μ)^{T} C^{- 1} (X - μ)}

其中：

X = [\begin{matrix} x_{1} \\ x_{2} \\ ⋮ \\ x_{n} \end{matrix}], μ = [\begin{matrix} E (X_{1}) \\ E (X_{2}) \\ ⋮ \\ E (X_{n}) \end{matrix}]

3. $n$ 维正态随机变量的性质

$n$ 维正态随机变量 $(X_{1}, X_{2}, \dots, X_{n})$ 的每一个分量 $X_{i}, i = 1, 2, \dots, n$ 反之，若 $X_{1}, X_{2}, \dots, X_{n}$ 都是正态随机变量且相互独立，则 $(X_{1}, X_{2}, \dots, X_{n})$ 是 $n$ 维正态随机变量
$n$ 维正态随机变量 $(X_{1}, X_{2}, \dots, X_{n})$ 服从 $n $ 维正态分布的充要条件是 $ X_1,X_2,\cdots,X_n$ 的任意线性组合 $\sum_{i=1}^n l_iX_i $ 服从一维正态分布（$ l_i$ 不全为 0）
若 $(X_{1}, X_{2}, \dots, X_{n})$ 服从 $n $ 维正态分布，设 $ Y_1,Y_2,\cdots,Y_k $ 是 $ X_j,j=1,2,\cdots,n$ 的线性函数，则 $Y_{1}, Y_{2}, \dots, Y_{k}$ 也服从多维正态分布
设 $(X_{1}, X_{2}, \dots, X_{n})$ 服从 $n $ 维正态分布，则 $ X_1,X_2,\cdots,X_n$ 相互独立的充要条件是 $X_{1}, X_{2}, \dots, X_{n}$ 两两相关系数为 0（也就是不相关）

概率论·4 随机变量的数字特征 ​

考纲内容 ​

一、数学期望 ​

1. 数学期望的定义 ​

2. 随机变量的函数的数学期望 ​

3. 数学期望的性质 ​

二、方差 ​

1. 方差的定义 ​

2. 方差的性质 ​

三、协方差及相关系数 ​

1. 协方差与相关系数的定义 ​

2. 协方差与相关系数的性质 ​

四、矩与协方差矩阵 ​

1. 矩与协方差矩阵的定义 ​

2. n 维正态随机变量 ​

1. 2 维时的情形 ​

2. n 维时的情形 ​

3. n 维正态随机变量的性质 ​