多维随机变量及其分布
二维随机变量及其分布
- 二维随机变量
设 \(X=X(\omega), Y=Y(\omega)\) 是定义在样本空间 \(\Omega\) 上的两个随机变量,则称向量 \((X,Y)\) 为二维随机变量,或随机变量
- 二维随机变量 \((X,Y)\) 的分布
\(F(x,y)=P\{X\leq x,Y\leq y\},-\infty<x<\infty,-\infty<y<\infty\)
二维随机变量的边缘分布:
+ 二维随机变量 \((X,Y)\) 的分布函数为 \(F(x,y)\) ,分别称 \(F_x(x)=P\{X\leq x\},F_y(y=P\{Y\leq y\}\) 为 \((X,Y)\) 关于 \(X,Y\) 的边缘分布
\(F_x(x)=\lim\limits_{y\to +\infty}F(x,y)\) |
- 二维随机变量的条件分布
如果对于任意给定的 \(\epsilon>0, P\{y-\epsilon\leq y+\epsilon\}>0\) 有 \(\lim\limits_{\epsilon\to o^}P\{X\leq x|y-\epsilon<Y\leq y\epsilon\}=\lim\limits_{\epsilon\to 0^}\frac{P\{X\leq x,y-\epsilon <Y\leq y\epsilon\}}{P\{y-\epsilon <Y\leq y+\epsilon\}}\) 存在,则称此极限为在条件 \(Y=y\) 下 \(X\) 的条件分布,记作 \(F_{X|Y}(x|y)\) 或 \(P\{X\leq x|Y=y\}\) 。类似的可以定义 \(F_{Y|X}(y|x)\)
- 二维离散型随机变量
二维随机变量 \((X,Y)\) 可能取值为有限个或可数无穷个 \((x_i,y_i), i,j=1,2,\cdots,\) 则称 \((X,Y)\) 为二维离散型随机变量
- 二维离散型随机变量的概率分布
二维离散型随机变量 \((X,Y)\) 的可能取值为 \((x,y),(i,j=1,2,\cdots)\) 称 \(P\{X=x_i,Y=y_i\}=p_{ij},i,j=1,2,\cdots\) 为二维离散型随机变量 \((X,Y)\) 的概率分布或分布律
- 二维离散型随机变量的边缘分布
\(p_{i\cdot}=P\{X=x_i\},i=1,2,\cdots\) 和 \(p_{\cdot j}=P\{Y=y_i\},i=1,2,\cdots\) 分别被称为 \((X,Y)\) 关于 \(X,Y\) 的边缘分布
- 二维离散型随机变量的条件分布
对给定的 \(j\) ,如果 \(P\{Y=y_i\}>0,j=1,2,\cdots\) 则称 \(P\{X=x_i|Y=y_i\}=\frac{P\{X=x_i,Y=y_i\}}{P\{Y=y_i\}}=\frac{p_{ij}}{p_{\cdot j}}, i=1,2,\cdots\) 为在 \(Y=y_i\) 条件下随机变量 \(X\) 的条件分布
- 二维连续型随机变量及其概率密度
如果对随机变量 \((X,Y)\) 的分布 \(F(x,y)\) 存在非负函数 \(f(x,y)\) ,使得对于任意实数 \(x,y\) 都有 \(F(x,y)=\int_{-\infty}^x\int_{-\infty}^yf(u,v)dudv,-\infty<x,y<\infty] 则称 latexmath:[(X,Y)] 为二维连续型随机变量,函数 latexmath:[f(x,y)] 称为 latexmath:[(X,Y)] 的概率密度 + 对于连续型随机变量 latexmath:[(X,Y)] ,设它的概率密度为 latexmath:[f(x,y)] ,由 latexmath:[F(x,\infty)=\int_{-\infty}^x[\int_{-\infty}^{\infty}f(x,y)dy]dx] 知道, latexmath:[X] 也是一个连续型变量,且其概率密度为 latexmath:[f_X(x)=\int_{-\infty}^{\infty}f(x,y)dy\)
- 二维连续型随机变量的边缘密度
定义 \(f_X(x)=\int_{-infty}^{\infty}f(x,y)dy 和 f_Y(y)=\int_{-\infty}^{\infty}f(x,y)dx\) 被分别称为 \((X,Y)\) 关于 \(X,Y\) 的边缘密度
- 二维连续型随机变量的条件密度
设 \(f(x,y)\) 在点 \((x,y)\) 连续, \(f_Y(y)\) 连续且 \(f_Y(y)>0\) ,则条件分布 \(F_{X|Y}(x|y)=\int_{-\infty}^x\frac{f(s,y)}{f_Y(y)}ds\) 其中 \(\frac{f(x,y)}{f_Y(y)}\) 被称为在条件 \(Y=y\) 下的条件密度,记作 \(f_{X|Y}(x|y)\) ,即 \(f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)},f_Y(y)>0\) ,类似可定义,当 \(f_X(x)>0\) 时, \(f_{X|Y}(y|x)=\frac{f(x,y)}{f_X(x)}\) 和 \(F_{Y|X}(y|x)=\int_{-\infty}^y=\frac{f(x,s)}{f_X(x)}ds\)
- \(F(x,y)\) 的性质
对于任意 \(x,y\) ,均有 \(0\leq F(x,y)\leq 1\)
\(F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(\infty,\infty)=1\)
\(F(x,y)\) 关于 \(x,y\) 均单调不减
\(F(x,y)\) 关于 \(x,y\) 是右连续的
\(P\{a<X\leq b,c<Y\leq d\}=F(b,d)-F(b,c)-F(a,d)+F(a,c)\)
- \(P\{X=x_i,Y=y_i\}=p_{ij}\) 的性质
\(p_{ij}\ge 0, i,j=1,2,\cdots\)
\(\sum\limits_{i}\sum\limits_{j}p_{ij}=1\)
- \(f(x,y)\) 的性质
\(f(x,y)\ge 0\)
\(\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(x,y)dxdy=1\)
随机变量 \((X,Y)\) 落在区域 \(D\) 内的概率 \(P\{(X,Y)\in D\}=\iint\limits_D f(x,y)dxdy\)
随机变量的独立性
- 随机变量的独立性
如果对于任意 \(x,y\) 都有 \(P\{X\leq x,Y\leq y\}=P\{X\leq x\}P\{Y\leq y\}, F(x,y)=F_x(x)F_Y(y)\) ,则称随机变量 \(X,Y\) 相互独立
- 随机变量相互独立的充要条件
离散性随机变量 \(X,Y\) 相互独立的充要条件:对于任意 \(i,j=1,2,\cdots\) 成立 \(P\{X=x_i,Y=y_i\}=P\{X=x_i\}P\{Y=y_i\},p_{ij}=p_{i\cdot}p_{\cdot j}\)
连续型随机变量 \(X,Y\) 相互独立的充要条件:对于任意 \(x,y\) 成立 \(f(x,y)=f_X(x)f_Y(y)\)
二维均匀分布和二维正态分布
- 二维均匀分布
如果二维连续型随机变量 \((X,Y)\) 的概率密度为 + + [latexmath] + \[\begin{aligned} f(x,y)= \left\{\begin{array}{lc} \frac{1}{A}, &(x,y)\in G\\ 0, &\text{其他} \end{array}\right. \end{aligned}\] + + 其中 \(A\) 是平面有界区域 \(G\) 的面积,则称 \((X,Y)\) 服从区域 \(G\) 上的均与分布
- 二维正态分布
如果二维连续型随机变量 \((X,Y)\) 的概率密度为 \(f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}exp\{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}\frac{(y-\mu_2)^2}{\sigma_2^2}]\}, -\infty<x<\infty,-\infty<y<+\infty\) + 其中 \(\mu_1.\mu_2,\sigma_1>0,-1<\rho<1\) 均为常数,则称 \((X,Y)\) 服从参数为 \(\mu_1,\mu_2,\sigma_1,\sigma_2,\rho\) 的二维正态分布,记作 \((X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)\)
- 性质
+ 设 \((X,Y)\) 在 \(G\) 上服从均匀分布, \(D\) 是 \(G\) 中的一个部分区域,记它们的面积分别为 \(S_D\) 和
- \(S_G\) ,则 \(P\{(X,Y)\in D\}=\frac{S_D}{S_G}\)
如果设 \((X,Y)\) 的概率密度为 \(f(x,y)\) ,显然 + + [latexmath] + \[\begin{aligned} f(x,y)= \left\{\begin{array}{lc} \frac{1}{S_G}, &(x,y)\in G,\\ 0, &\text{其他} \end{array}\right. \end{aligned}\] + + 而 \(P\{(X,Y)\in D\}=\iint\limits_D f(x,y)dxdy=\iint\limits_D\frac{1}{S_G}dxdy=\frac{S_D}{S_G}\)
+
- 对于正太分布要求不加证明的记住下述性质:
\((X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)\) 时, \(X,Y\) 均服从一维正态
\((X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)\) 时, \(X,Y\) 相互独立的充要条件是 \(\rho=0\)
\((X,Y)\) 服从二维正态时,行列式 \(\left|\begin{array}{ll}a&b\\c&d\end{array}\right|\neq 0,(aX+bY,cX+dY)\) 也服从二维正态,当然 \(aX+bY\) 服从一维正态
如果 \(X,Y\) 均服从一维正态,且相互独立,就是指 \((X,Y)\) 服从二维正态,且 \(\rho=0\)
两个随机变量函数 \(Z=g(X,Y)\) 的分布
若 \(X,Y\) 均为离散型随机变量, \(Z\) 的分布率求法与一维离散型类似 若 \(X,Y\) 均为连续型随机变量, \(F_z(z)\) 的求法请参照 P496