随机变量及概率分布
一维随机变量
随机变量的概念
随机变量就是"其值随机会而定"的变量,正如随机事件是"其发生与否会随机而定"的事件
比如掷骰子,结果需要掷了骰子以后才知道
随机变量的反面是所谓的"确定性变量",即其取值遵循某种严格规律的变量
考虑打靶试验,命中的坐标由(X,Y)表示,X,Y都是随机变量,而(X,Y)则称为一个二维随机变量.多维随机变量由此推广
随机变量按其可能取值的全体的性质区分为两大类
- 离散型
特征只能是取有限个值,或虽然能在理论上取无限个值,但是这些值都能毫无遗漏的一一列举出来 - 连续性
这种变量的全部可能取值不仅是无穷多个,并且还不能无一遗漏的逐一排列
设X为离散型随机变量,其全部可能值为a1,a2,⋯ ,则
pi=P(X=ai),i=1,2,⋯pi≥0,p1+p2+⋯=1 离散型随机变量的分布及重要例子
设X为一随机变量,则函数
P(X≤x)=F(x),−∞<x<∞ 称为X的分布函数(这里并未限制X为离散型)
若知道概率函数 如 pi=P(X=ai),i=1,2,⋯
则 F(x)=P(X≤x)={i:ai≤x}∑pi
对于任意随机变量X,其分布函数F(x)具有下面的一般性质
当(x1<x2) 有F(x1)≤F(x2)
当x→∞, F(x)→1,当x→−∞,F(x)→0
二项分布
pi=b(i;n,p)=(ni)pi(1−p)n−i,i=0,1,⋯,n X所遵从的概率分布称为二项分布,并常记为B(n,p),以后,当随机变量服从某种分布F时,我们用X∼F来 表达这一点,如,X服从二项分布就记为X∼B(n,p)
二项分布的两个重要条件:
- 各次试验的条件是稳定的,保证了事件A的概率p的各次试验中保持不变
- 各次试验都是独立的
考虑抽奖,有N的产品,废品率是p,从中抽取n个,如果每次抽奖放回,且保证每个产品有同等的1/N的机会被抽出,则这n个产品中所含废品数X就遵从二项分布B(n,p),如果不放回,下次抽中的概率就变了,不符合二项分布,除非N远大于 n,仍可以把X近似看成二项分布
泊松分布
P(X=i)=i!e−λλi i=0∑∞P(X=i)=e−λi=0∑∞i!λi=e−λeλ=1 泊松分布可以看做是二项分布的极限得出的
对于二项分布B(n,nλ)
P(X=i)=(ni)(nλ)i(1−nλ)n−i
当n→∞
ni(ni)(1−nλ)n(ni)(nλ)i(1−nλ)n−i→i!1→e−λ→i!λie−λ 针对n→∞lim(1−nλ)n 的推导
已知n→∞lim(1−n1)n=e1 n→∞lim(1−nλ)n=limn→∞((1−λn1)λn)λ=(e1)λ=e−λ 连续型随机变量的分布及重要例子
连续型随机变量X有概率分布函数F(x),则F(x)的导数f(x)=F′(x),称为X的概率密度函数
连续型随机变量X的概率密度函数f(x)都具有下列三条基本性质
- f(x)≥0
- ∫−∞∞f(x)dx=1
- 对于任何常数a<b有 P(a≤X≤b)=F(b)−F(a)=∫abf(x)dx
正态分布

X∼N(μ,σ2)
f(x)=(2πσ)−1e−(x−μ)2/2σ2,−∞<x<∞ 推导概率密度函数积分
R2∬e−(x2+y2)dxdy=D∬e−r2rdrdθ=∫02πdθ∫0+∞re−r2dr=2π∫0+∞re−r2dr=2π2−1e−r20+∞=0−(−π)=π其中R2=(−∞,+∞)×(−∞,+∞)D={(r,θ)∣0≤r<+∞,0≤θ≤2π}π=R2∬e−(x2+y2)dxdy=∫−∞∞dx∫−∞∞e−(x2+y2)dy=∫−∞∞dx∫−∞∞e−x2e−y2dy=∫−∞∞e−x2dx∫−∞∞e−y2dy=(∫−∞∞e−x2dx)2∴∫−∞+∞e−x2dx=πf(x)∫−∞+∞f(x)=(2πσ)−1e−(x−u)2/2σ2=(2πσ)−1e−(2σx−u)2=∫−∞+∞(2πσ)−1e−(2σx−u)2dx=2πσ1∫−∞+∞e−(2σx−u)2dx=2πσ1∫−∞+∞2σe−(2σx−u)2d2σx−u=π1∫−∞+∞e−(2σx−u)2d2σx−u=π1π=1 当μ=0,σ2=1 时,
f(x)=2πe−x2/2 N(0,1) 称为标准正态分布
任意正态分布到标准正态分布的转换
若X∼N(μ,σ2),则Y=(X−μ)/σ∼N(0,1) 证明:
P(Y≤x)=P((X−μ)/σ≤x)=P(x≤μ+σx)=2πσ1∫−∞μ+σxe−(x−μ)2/2σ2dx=2π1∫−∞μ+σxe−(σx−μ)2/2σ1dx 令u=σx−μ应用第一类换元法设f(x)为可积函数,g=g(x)为连续且可导函数,有∫αβf(g)g′dx=∫g(α)g(β)f(g)dg把u=σx−μ看做是g(x)则 2π1∫−∞μ+σxe−(σx−μ)2/2σ1dx=2π1∫−∞μ+σxe−u2/2σ1dx=2π1∫−∞μ+(σx−μ)σe−u2/2du=2π1∫−∞xe−u2/2du 2π1∫−∞xe−u2/2du的导数是2π1e−x2/2,即Y的密度函数正好等于标准正态分布的概率密度函数 例题:X∼N(1.5,22) ,求计算P(−1≤X≤2)
解:∵(X−1.5)/2∼N(0,1)∴P(−1≤X≤2)=P(2−1−1.5≤2X−1.5≤22−1.5)=P(−1.25≤2X−1.5≤0.25)=Φ(0.25)−Φ(−1.25)=Φ(0.25)−(1−Φ(1.25))=0.4931Φ为标准正态分布 多维随机变量
离散型随向量的分布
随机向量X=(X1,⋯,Xn) ,如果其中每一个分量Xi都是一维离散型随机变量,则称X为离散型的
定义
{ai1,ai2,⋯}记为Xi的全部可能值p(j1,j2,⋯,jn)=P(X1=a1j1,X2=a2j2,⋯,Xn=anjn)称为随机向量X=(X1,⋯,Xn)的概率函数概率函数满足的条件:p(j1,j2,⋯,jn)≥0,jn∑⋯j2∑j1∑p(j1,j2,⋯,jn)=1 多项分布
设A1,A2,⋯,An是某一试验下的完备事件群,即事件A1,⋯,An两两互斥,其和为必然事件(每次试验,事件A1,⋯,An必发生一个且只发生一个),分别以p1,p2,⋯,pn记事件A1,A2,⋯,An的概率,则pi≥0,p1+⋯+pn=1
将试验独立地重复N次,以Xi记在这N次试验中事件Ai发生的次数。
X=(X1,X2,⋯,Xn)的概率分布就叫做多项分布,记为M(N;p1,⋯,pn)
计算事件B={X1=k1,⋯,Xi=ki,⋯Xn=kn}的概率
P(X1=k1,X2=k2,⋯,Xn=kn)=k1!k2!⋯kn!N!p1k1p2k2⋯pnkn 连续型随机向量的分布
若 f(x1,⋯,xn)是定义在 Rn上的非负函数,使对Rn中的任何集合A,有
P(X∈A)=∫A⋯∫f(x1,⋯,xn)dx1⋯dxn 则称 f 是 X的概率密度函数
若把A取成全空间Rn,则{X∈A}为必然事件,概率为1,有
∫−∞∞⋯∫f(x1,⋯,xn)dx1⋯dxn=1 例:向一个无限平面射击,设命中点X=(x1,x2)有概率密度 f(x1,x2)=π−1(1+x12+x22)−2,验证概率密度函数是否正确
验证:
∬−∞∞f(x1,x2)dx1dx2=∫02πdθ∫0∞π−1(1+r2)−2rdr=2π⋅π−1∫0∞(1+r2)−2rdr=2∫0∞(1+r2)−2rdr=2∫0∞(1+t)−2dt/2=1∫0∞(1+t)−2dt=1⋅−1+t10∞=1⋅(0−(−1))=1 命中点与靶心距离不超过 r0 这个事件的概率为
x12+x22≤r02∬f(x1,x2)dx1dx2=∫02πdθ∫0r0π−1(1+r2)−2rdr=1+r02r02 二维正态分布
概率密度函数
f(x1,x2)=(2πσ1σ21−ρ2)−1exp(−2(1−ρ2)1(σ12(x1−a)2−σ1σ22ρ(x1−a)(x2−b)+σ22(x2−b)2)) | 常数 | 取值范围 |
| a | −∞<a<∞ |
| b | −∞<a<∞ |
| σ1 | σ1>0 |
| σ2 | σ2>0 |
| ρ | −1<ρ<1 |
二维正态分布记作N(a,b,σ12,σ22,ρ)

二维正态分布概率密度函数验证

边缘分布
离散型边缘分布
P(X1=a1k)=j2,⋯,jn∑p(k,j2,⋯,jn),k=1,2,⋯ 多项分布的边缘分布是二项分布

连续型边缘分布
f1(x1)=∫−∞∞⋯∫−∞∞f(x1,x2,⋯,xn)dx2⋯dxn 二维正态分布的边缘分布是一维正态分布

条件概率分布与随机变量的独立性
条件概率分布的概念
一个随机变量X的条件概率分布,就是在某中给定的条件下,X的概率分布
此处的条件分布,是在试验中所规定的“基本”条件之外再附加的条件。它一般采取如下的形式:设有两个随机变量X,Y,在给定了Y取值的条件下,去求X的条件分布
离散型随机变量的条件分布
设(X1,X2,⋯,Xn)服从多项分布M(N;p1,⋯,pn) , 计算在X2=k2的条件下,X1的条件分布
P(X1=k1∣X2=k2)=P(X1=k1,X2=k2)/P(X2=k2)
1️⃣根据边缘分布
P(X2=K2)=(N−k2)!N!k2!p2k(1−p2)N−k2 2️⃣求P(X1=k1,X2=k2)
P(X1=k1,X2=k2)=k3,⋯,kn∑′k1!k2!k3!⋯kn!N!p1k1p2k2p3k3⋯pnkn ∑k3,⋯,kn′ 表示求和范围为k3,⋯,kn,显然k3+⋯+kn=N−(k1+k2)
3️⃣ 令 pi′=pi/(1−p1−p2)
P(X1=k1,X2=k2)=k1!k2!(N−k1−k2)!N!⋅p1k1p2k2(1−p1−p2)N−k1−k2⋅CC=k3,⋯,kn∑′k3!⋯kn!(N−k1−k2)!=1p′3k3⋯p′nkn 4️⃣ 所以
P(X1=k1∣X2=k2)=P(X1=k1,X2=k2)/P(X2=k2)=k1!k2!(N−k1−k2)!N!⋅p1k1p2k2(1−p1−p2)N−k1−k2/(N−k2)!N!k2!p2k(1−p2)N−k2=k1!(N−k1−k2)(N−k2)!(1−p2)N−k2p1k1(1−p1−p2)N−k1−k2=k1!(N−k1−k2)(N−k2)!(1−p2)N−k1⋅(1−p2)N−k1−k2p1k1(1−p1−p2)N−k1−k2=k1!(N−k1−k2)(N−k2)!(1−p2p1)k1(1−1−p2p1)N−k1−k2=b(k1;N−k2,p1/(1−p2)),k=0,1,⋯,N−k2 连续型随机变量的条件分布
假设二维随机向量X=(X1,X2) 有概率密度函数f(x1,x2) , 在限定a≤x2≤b的条件下,X1的条件分布有
P(X1≤x1∣a≤X2≤b)=P(X1≤x1,a≤X2≤b)/P(a≤X2≤b) P(X1≤x1,a≤X2≤b)=∫∞x1dt1∫abf(t1,t2)dt2 P(a≤X2≤b)=∫abf2(t2)dt2(f2为X2的边缘分布密度函数) X1 的条件分布函数
P(X1≤x1∣a≤X2≤b)=∫∞x1dt1∫abf(t1,t2)dt2/∫abf2(t2)dt2
对X1的条件分布函数的x1求导倒数,得到条件密度函数f1
f1(x1∣a≤X2≤b)=∫abf(x1,t2)dt2/∫abf2(t2)dt2 当a=b
f1(x1∣X2=x2)=h→0limf1(x1∣x2≤X2≤x2+h)=h→0limh1∫t2x2+hf(x1,t2)dt2/h→0limh1∫x2x2+hf2(t2)dt2=f(x1,x2)/f2(x2) 改写上式,得到
f(x1,x2)=f2(x2)f1(x1∣x2) 即:两个随机变量X1和X2联合概率密度,等于其中之一的概率密度乘以在给定这一之下另外一个的条件概率密度.这个公式相应于条件概率的公式P(AB)=P(B)P(A∣B)
同理也有
f(x1,x2)=f1(x1)f2(x2∣x1)
推广到n维随机向量(X1,⋯,Xn),其概率密度函数为f(x1,⋯,xn) 则
f(x1,⋯,xn)=g(x1,⋯,xk)h(xk+1,⋯,xn∣x1,⋯,xk) 其中g是(X1,⋯,Xk)的概率密度,而h则是在给定了X1=x1,⋯,Xk=xk条件下,Xk+1,⋯,Xn的条件概率密度