随机变量
设试验 E的样本空间为Ω,如果对于每一个样本点ω∈Ω,都有唯一实数X(ω)$与之对应,则称单值实函数 $$X=X(\omega)$$ 为样本空间$$\Omega$上的随机变量.
随机变量是一个函数,或者说它是一个因变量,它表示的是从样本空间到实数集合的一个映射。
引入随机变量的意义:
- 可以用随机变量来描述任何随机现象
- 可以使用微积分了
累积分布函数( cdf )
定义
设X是定义在样本空间Ω$上的随机变量,称函数 $$F ( x)= P{X\leq x}, −\infty< x <\infty$为随机变量X的概率分布函数也称累积分布函数。记为X~F(x).
性质
(1)单调不减:∀a<b,F(a)≤F(b),
(2)0≤F(x)≤1:
x→+∞limF(x)=1,x→−∞limF(x)=0
(3)右连续:
x→x0+limF(x)=F(x0)
推论:
随机变量的分类
离散随机变量
设X是样本空间Ω上的随机变量.若集合{X(ω):ω∈Ω}={x1,x2,...,xn,...}是有限集或可列集,则称X是离散型随机变量.
概率分布函数(pmf)
pk=P(X=xk),k=1,2,...称为离散型随机变量X的概率分布或分布律(pmf)
性质
pk满足pk≥0,k=1,2,...k∑pk=1.
用这些性质可以判断 是否为分布律
求离散随机变量的概率分布
(1)确定随机变量的所有可能取值; (2)计算每个取值点的概率.
P(X∈A)=xn∈A∑pn
cdf与pmf是等价的,对于离散型随机变量, pmf更直观与简便.
5种离散型随机变量的概率分布
两点分布(Bernoulli)
只有两种可能结果的随机现象, 随机变量X只可能取0与1两个值,则称X服从两点分布,记为X~Bern(p).
P{X=k}=pk(1−p)(1−k) , 其中k = 0, 1.
几何分布(Geometric)
定义
在伯努利试验中,直到事件A第一次发生时所做的试验次数 X服从几何分布,即“第一次成功”分布。
若随机变量X 的分布列为:0<p≤1,P{X=k}=(1−p)k−1p,其中k=1,2,...则称X服从几何分布,记为X~G( p).
它的含义是前k-1次实验都没有成功,第k次成功了;同理,“第2次成功”分布的含义是除了第k次成功了之外,前k-1次实验中还有一次成功了。
几何分布的无记忆性(Memoryless Property)
P(X=n+k∣X>n)=P(X=k)
该性质表明,在前 n次试验中 A 没有出现的条件下,则在接下 去的 k次试验中 A仍未出现的概率只与 k有关,而与以前n次试 验无关,似乎忘记了前n次试验 结果,这就是无记忆性。
超几何分布(Hypergeometric)
P(x=k)=CNnCN−Mn−kCMk
k=0,1,...,min(M,n)
min(M,n)就是说n≤M.
二项分布(Binomial)
定义
在n重贝努利试验中,事件A出现的次数记为X 服从二项分布。
记作X ~ B(n, p),n指的是独立重复实验的次数,p指的是一次伯努利实验中A发生的概率。
pmf为:P(X=k)=Cnkpk(1−p)n−k,0≤k≤n.
超几何分布与二项分布的关系
设N→∞时,NM→p
则CNnCN−Mn−kCMk=Cnmpm(1−p)n−m,(N→∞)
二项分布的最可能出现次数
(当x取多少时,概率最大)
泊松分布(Poisson)
定义
若随机变量X的分布列为P{X=λ}=e−λk!λk$, $$k=0,1,2…$ λ>0.则称X服从参数为λ的泊松分布.
记为X~P(λ).
泊松分布(稀有分布律)主要用于估计某稀有事件(rare events) 在特定时间内或空间中发生的次数.
泊松分布中最可能出现次数
-
当λ= 整数时,在λ与λ– 1 处的概率取得最大值
-
当λ=整数时, 在 [λ]处的概率取得最大值
二项分布的泊松近似
Possion定理:
二项分布的极限分布是 Poisson 分布: