Skip to content

概率论·4 随机变量的数字特征

考纲内容

  • 随机变量的数学期望(均值)、方差、标准差及其性质
  • 随机变量函数的数学期望,矩、协方差、相关系数及其性质

一、数学期望

考纲摘要:理解随机变量数字特征(数学期望、方差、标准差、矩、协方差、相关系数)的概念,会运用数字特征的基本性质,并掌握常用分布的数字特征

1. 数学期望的定义

设离散型随机变量 $X $ 的分布律为 $ P{X=x_k}=p_k,k=1,2,\cdots$ 如果级数 k=1xkpk 绝对收敛,则称这个级数的和为随机变量 X数学期望,记为 E (X)

设连续型随机变量 X 的概率密度为 f (x),若积分

xf(x)dx

绝对收敛,则称该积分的值为随机变量 X数学期望,也记作 E (X)

数学期望也称作期望均值

2. 随机变量的函数的数学期望

考纲摘要:会求随机变量函数的数学期望。

设 $Y $ 是随机变量 $ X$ 的函数:Y=g(X)

  • 离散型的情况;E(Y)=E[g(X)]=k=1g(xk)pk
  • 连续型的情况:E(Y)=E[g(X)]=g(x)f(x)dx

这意味着不必算出 $Y $ 的分布律或概率密度(已知 $ X$ 的情况下),也可以求出它的期望

也可以推广到多个随机变量的函数的情况:设 Z=g(X,Y),且二维随机变量 X,Y 的概率密度为 f (x,y),则:

E(Z)=E[g(x,y)]=g(x,y)f(x,y)dxdy

如果是离散型的情况,则:

E(Z)=E[g(x,y)]=j=1i=1g(xi,yj)pij

3. 数学期望的性质

  • 设 $C $ 是常数,则 $ E (C)=C$
  • $C $ 是常数,$ E (C\cdot X)=C\cdot E (X)$
  • E(X+Y)=E(X)+E(Y)
  • E(XY)=E(X)E(Y),相互独立的情况下成立

二、方差

1. 方差的定义

设 $X $ 是一个随机变量,若 $ E{[X-E (X)]^2}$ 存在,则称其为 X方差,记作 D (X) 或 Var(X)σ(X)=D(X) 称作标准差或者均方差

方差表达了 $X $ 的取值与其数学期望的偏离程度,其值较小表示 $ X$ 的取值较为集中在 E (X) 附近,其值较大表示 $X $ 的取值较为分散,可以用来衡量 $ X$ 取值的分散程度

D(X)=i=1[xiE(X)]2pk

此外,也有:

D(X)=E(X2)[E(X)]2

对于随机变量 X=XE(X)D(X),其数学期望为 0,方差为 1,X 称作 X标准化变量

2. 方差的性质

  • 设 $C $ 是常数,则 $ D (C)=0$
  • D(CX)=C2D(X),D(X+C)=D(X)
  • D(X+Y)=D(X)D(Y)+2E{[XE(X)][YE(Y)]}
  • $D (X)=0 $ 的充要条件是 $ P{X=E (X)}=1$

三、协方差及相关系数

1. 协方差与相关系数的定义

  • 协方差:E{[XE(X)][YE(Y)]} 称作随机变量 X,Y 的协方差,记作 Cov(X,Y)
  • 相关系数:ρXY=Cov(X,Y)D(X)D(Y) 称作随机变量 X,Y 的相关系数
  • 柯西-许瓦兹 (Cauchy-Schwarz) 不等式[Cov(X,Y)]2D(X)D(Y),从而有 |ρXY|1

由协方差的定义得到的一些基本结论:

  • Cov(X,Y)=Cov(Y,X)
  • Cov(X,X)=D(X)
  • D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
  • Cov(X,Y)=E(XY)E(X)E(Y)

2. 协方差与相关系数的性质

协方差的性质:

  • Cov(aX,bY)=abCov(X,Y)
  • Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

相关系数的性质:

  • ρXY1
  • |ρXY|=1 的充要条件是 \exista,b,P{Y=a+bX}=1 |ρXY|=1,X,Y 之间存在线性关系 |ρXY| 较大,X,Y 的线性相关程度较大 |ρXY| 较小,X,Y 的线性相关程度较差 |ρXY|=0,X,Y 不相关

独立与不相关的关系

  1. 若 X, Y 独立 X, Y 不相关。
  2. 反之不一定成立(即不相关 独立)。
  3. 例外:若 (X,Y) 服从二维正态分布,则:独立 不相关。

四、矩与协方差矩阵

1. 矩与协方差矩阵的定义

若 X,Y 是随机变量

  • $X $ 的 $ k$ 阶原点矩(简称 $k $ 阶矩): $ E (X^k),k=1,2,\cdots$
  • $X $ 的 $ k$ 阶中心矩E{[XE(X)]k} 显然,D (X) 就是 X 的 2 阶中心距
  • X,Y 的 $k+l $ 阶混合矩:$ E (X^kY^l)$
  • X,Y 的 $k+l $ 阶混合中心矩:$ E{[X-E (X)]^k[Y-E (Y)]^l}$ 显然,Cov(X,Y) 就是 X,Y 的 1+1 阶混合中心矩

协方差矩阵定义如下:

设随机变量 (X1,X2,,Nn) 的所有二阶混合中心矩 cij=Cov(Xi,Xj),i,j=1,2,,n 都存在,则以下矩阵:

C=[c11c12c1nc21c22c2ncn1cn2cnn]

就被称作 n 维随机变量 (X1,X2,,Nn) 的协方差矩阵,显然,cij=cji,则协方差矩阵是一个对称矩阵

2. n 维正态随机变量

1. 2 维时的情形

二维正态随机变量 (X1,X2)N(μ1,μ2,σ12,σ22,ρ) 的概率密度如下:

f(x1,x2)=12πσ1σ21ρ2exp{12(1ρ2)[(x1μ1)2σ122ρ(x1μ1)(x2μ2)σ1σ2+(x2μ2)2σ22]}

显然,随机变量 (X1,X2) 的协方差矩阵可以表示如下:

C=[D(X1)Cov(X1,X2)Cov(X2,X1)D(X2)]=[σ12ρσ1σ2ρσ1σ2σ22]

其逆矩阵为

C1=1|C|[σ22ρσ1σ2ρσ1σ2σ12]

这样一来,二维随机变量 (X1,X2) 的概率密度就可以写成:

f(x1,x2)=1(2π)22|C|12exp{12(Xμ)TC1(Xμ)}

其中:

X=[x1x2],μ=[E(X1)E(X2)]

2. n 维时的情形

对于 n 维正态随机变量 (X1,X2,,Xn),其该概率密度定义为:

f(x1,x2,,xn)=f(x1,x2)=1(2π)n/2|C|1/2exp{12(Xμ)TC1(Xμ)}

其中:

X=[x1x2xn],μ=[E(X1)E(X2)E(Xn)]

3. n 维正态随机变量的性质

  • n 维正态随机变量 (X1,X2,,Xn) 的每一个分量 Xi,i=1,2,,n 反之,若 X1,X2,,Xn 都是正态随机变量且相互独立,则 (X1,X2,,Xn)n 维正态随机变量
  • n 维正态随机变量 (X1,X2,,Xn) 服从 $n $ 维正态分布的充要条件是 $ X_1,X_2,\cdots,X_n$ 的任意线性组合 $\sum_{i=1}^n l_iX_i $ 服从一维正态分布($ l_i$ 不全为 0)
  • (X1,X2,,Xn) 服从 $n $ 维正态分布,设 $ Y_1,Y_2,\cdots,Y_k $ 是 $ X_j,j=1,2,\cdots,n$ 的线性函数,则 Y1,Y2,,Yk 也服从多维正态分布
  • (X1,X2,,Xn) 服从 $n $ 维正态分布,则 $ X_1,X_2,\cdots,X_n$ 相互独立的充要条件是 X1,X2,,Xn 两两相关系数为 0(也就是不相关)

Released under the MIT License.