概率论05

二维随机变量及其分布

联合分布函数

定义

设 (𝑋, 𝑌) 为二维随机变量, 对任意实数 𝑥, 𝑦, 二元函数F(x,y)=P(Xx,Yy)F(x,y)=P(X\leq x,Y\leq y)称为二维随机变量 (𝑋, 𝑌) 的联合分布函数, 简称为 (𝑋, 𝑌) 的分布函数.

性质

(1)0F(x,y)10\leq F(x,y)\leq 1,且F(+,+)=1F(+\infty,+\infty)=1,而F(,+)=F(+,)=F(,)=0F(-\infty,+\infty)=F(+\infty,-\infty)=F(-\infty,-\infty)=0.

(2)对每个变量单调不减

  • 固定 x , 对任意的 y1<y2,F(x,y1)F(x,y2)y1< y2 , F (x, y_1 ) \leq F (x, y_2 ),
  • 固定 y , 对任意的 x1<x2,F(x1,y)F(x2,y)x1< x2 , F (x_1 ,y) \leq F (x_2 , y).

(3)对每个变量右连续

F(x0,y0)=F(x0+0,y0)=F(x0,y0+0)F(x_0,y_0)=F(x_0+0,y_0)=F(x_0,y_0+0).

离散型二维随机变量

联合概率分布如下,不必多说

离散型

0p(i,j)1,i,j=1,2,30\leq p(i,j)\leq 1,\quad i,j=1,2,3\cdots

+i=1+j=1p(i,j)=1\underset{i=1}{\overset{+\infty}{\sum}}\underset{j=1}{\overset{+\infty}{\sum}}p(i,j)=1

联合概率分布的计算

pij=P(X=xi,Y=yj)=P(X=xi)P(Y=yjX=xi)p_{ij}=P(X=x_i,Y=y_j)=P(X=x_i)P(Y=y_j|X=x_i)

F(x,y)=xixyjypijF(x,y)=\underset{x_i\leq x}{\sum}\underset{y_j\leq y}{\sum}p_{ij}

P{(X,Y)G}=(xi,yj)GpijP\{(X,Y)\in G\}=\underset{(x_i,y_j)\in G}{\sum}p_{ij}

计算区域

连续型二维随机变量

定义

设二维随机变量(X ,Y )的分布函数为 F(x ,y), 若存在非负可积函 数 f (x,y) , 使得对于任意实数 x , y 有

F(x,y)=xyf(u,v)dudvF(x,y)=\int_{-\infty}^{x}\int_{-\infty}^{y}f(u,v)dudv

则称( X ,Y ) 为二维连续型随机变量,

f (x,y) 为( X ,Y ) 的联合概 率密度函数,简称概率密度函数,简记pdf (joint PDF)

性质

  • f(x,y)0f(x,y)\geq 0,在某些地方可以大于1
  • F(+,+)=1F(+\infty,+\infty)=1
  • 2F(x)xy=f(x,y)\frac{\partial^2F(x)}{\partial x\partial y}=f(x,y).
  • P{(X,Y)G}=Gf(x,y)dxdyP\{(X,Y)\in G\}=\underset{G}{\iint}f(x,y)dxdy.

常用的二维连续型随机变量

均匀分布

uniformv

性质

G1GG_1\subseteq GG1G_1的面积为A1A_1,那么P{(X,Y)G1}=G1GP\{(X,Y)\in G_1\}=\frac{G_1}{G}.

就是说,如果是均匀分布的话,概率为面积之比。

二维正态分布

若随机变量( X ,Y ) 的联合pdf为

正态pdf

则称( X ,Y ) 服从参数为μ1,σ12,μ2,σ22,ρ\mu_1,\sigma_1^2,\mu_2,\sigma_2^2,\rho的正态分布, 记作

(X,Y)N(μ1,σ12,μ2,σ22,ρ)(X,Y)\sim N(\mu_1,\sigma_1^2,\mu_2,\sigma_2^2,\rho)

其中σ1,σ2>0,1<ρ<1\sigma_1,\sigma_2>0,-1<\rho<1.

边缘分布

由联合分布函数可以得到边缘分布函数;反过来一般不成立.

联合与边缘

离散型

即全概率公式

离散型边缘分布

连续型

已知联合密度可求边缘密度

fX(x)=+f(x,y)dyf_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy

同理,

fY(y)=+f(x,y)dxf_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx

这里虽然说是从负无穷到正无穷积分,但是f(x,y)往往是分段的,实际操作时要进一步确定上下限。

关于正态分布:

正态分布边缘分布

条件分布

离散型

离散型条件分布

因为(X ,Y)是二维连续型随机变量时, P(X = x) = 0, P(Y = y) = 0 不能直接代入条件概率公式,所以利用极限的方法引入条件分布函数

连续型

因为当(X ,Y)是二维连续型随机变量时, P(X = x) = 0, P(Y = y) = 0 不能直接代入条件概率公式,所以

条件分布函数

由此,可以得到在条件Y= y下X的条件分布函数

FXY(x,y)=xf(u,y)dufY(y)=xf(u,y)dufY(y)F_{X|Y}(x,y)=\frac{\int_{-\infty}^xf(u,y)du}{f_Y(y)}=\int_{-\infty}^x\frac{f(u,y)du}{f_Y(y)}

所以,

fXY(x,y)=f(x,y)fY(y)f_{X|Y}(x,y)=\frac{f(x,y)}{f_Y(y)}

联合密度除以边缘密度

在实际操作的时候,同样要考虑分段的情况,尤其是当联合密度函数和边缘密度函数都分段且分段不同时,最终结果的分段区间需要仔细考虑。

省流

总结

随机变量的独立性

定义

设X,Y是两个随机变量,若对任意的x,y,有F(x,y)=FX(x)FY(y)F(x,y)=F_X(x)F_Y(y),即P(Xx,Yy)=P(Xx)P(Yy)P(X\leq x,Y\leq y)=P(X\leq x)P(Y\leq y),则称X,Y相互独立.

两个随机变量相互独立时,其联合分布函数等于两个边缘分布函数的乘积, 边缘分布完全确定联合分布.

性质

离散型

X与Y独立等价于对一切i,j有

  • P(X=xi,Y=yj)=P(X=xi)P(Y=yj)P(X=x_i,Y=y_j)=P(X=x_i)P(Y=y_j).
  • pij=pipjp_{ij}=p_{i\cdot}p_{\cdot j}

连续型

X与Y独立等价于对任何x ,y 有

  • f(x,y)=fX(x)fY(y)f(x,y)=f_X(x)f_Y(y)
  • fX(x)=fXY(xy),(fY(y)>0)f_X(x)=f_{X|Y}(x|y),\quad(f_Y(y)>0)
  • fY(y)=fYX(yx),(fX(x)>0)f_Y(y)=f_{Y|X}(y|x),\quad(f_X(x)>0)

对于二维正态分布当X与Y独立时,等价于ρ=0\rho=0.

拓展到n维随机变量

就是同理可得,

分布函数就是密度函数的n次重积分,边缘分布就是除所指定的维度之外的n-1次重积分

F(x1,x2,,xn)=FX1(x1)FX2(x2)FXn(xn)F(x_1,x_2,\dots,x_n)=F_{X_1}(x_1)F_{X_2}(x_2)\dots F_{X_n}(x_n),则称随机变量X1,X2,,XnX_1,X_2,\dots,X_n相互独立。

二维随机变量函数的分布

研究的是Z=g(X,Y)Z=g(X,Y)的概率分布,方法是把Z转化为(X,Y)的事件。

离散型

P(Z=zk)=P(g(X,Y)=zk)P(Z=z_k)=P(g(X,Y)=z_k)

=g(xi,yj)=zkP(X=xi,Y=yj)=\underset{g(x_i,y_j)=z_k}{\sum}P(X=x_i,Y=y_j)

注意,这里X,Y的取值范围是使得所有函数值等于z的x,y

连续型

总体思路

已知随机变量(X,Y)的密度函数求Z=g(X,Y)的密度函数的问题比较复杂,我们只讨论以下几种函数

  • Z=X+YZ=X+Y
  • Z=XYZ=\frac X Y
  • Z=max{X,Y}Z=max\{X,Y\}Z=min{X,Y}Z=min\{X,Y\}

解决问题的方法是,先求分布函数,再求导得密度函数

(1)

FZ(z)=P(Zz)=P(g(X,Y)z)F_Z(z)=P(Z\leq z)=P(g(X,Y)\leq z)

=g(x,y)zf(x,y)dxdy=\underset{g(x,y)\leq z}{\iint}f(x,y)dxdy

注意:积分域是随着z而变化的

(2)求导

fZ(z)=FZ(z)f_Z(z)=F_Z'(z)

一般公式

如果Z=g(X,Y)中,(X,Y)到(Z,Y)或(Z,X)是一一对应变换的,有如下结论成立

设Y=h(X,Z)

fZ(z)=f(x,h(x,z))hzdxf_Z(z)=\int_{-\infty}^\infty f(x,h(x,z))|\frac{\partial h}{\partial z}|dx

同理,设X=h(Z,Y)

fZ(z)=f(h(z,y),y)hzdyf_Z(z)=\int_{-\infty}^\infty f(h(z,y),y)|\frac{\partial h}{\partial z}|dy

特别地,对于最大值,最小值函数

  • 最大值函数:当g为max函数时,即要求X,Y的最大值小于等于z,只需要让X,Y都小于等于z即可
  • 最小值函数:同理,取反面

所以,一览表

g(X,Y) 密度函数
Z=X+Y f(zy,y)dy\int_{-\infty}^\infty f(z-y,y)dyf(x,zx)dx\int_{-\infty}^\infty f(x,z-x)dx
Z=XYZ=\frac X Y f(yz,y)ydy\int_{-\infty}^{\infty}f(yz,y)\vert y\vert dy
g max(X,Y) min(X,Y)
二维 FX(z)FY(z)F_X(z)F_Y(z) 1[1FX(z)][1FY(z)]1-[1-F_X(z)][1-F_Y(z)]
n维 FX1(z)FX2(z)FXn(z)F_{X_1}(z)F_{X_2}(z)\dots F_{X_n}(z) 1[1FX1(z)][1FX2(z)][1FXn(z)]1-[1-F_{X_1}(z)][1-F_{X_2}(z)]\dots [1-F_{X_n}(z)]
独立同分布(iid) [F(z)]n[F(z)]^n 1[1F(z)]n1-[1-F(z)]^n

概率论05
http://halfatooth.github.io/2022/10/20/probability-05/
作者
lhs
发布于
2022年10月20日
许可协议