概率论与数理统计(第二版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

§3 二维随机变量及其分布

在实际问题中,有很多随机现象往往需要引进两个或更多个随机变量来描述。为此,有必要研究多维随机变量及其分布。本节主要介绍二维随机变量及其分布。

一、二维随机变量及其联合分布

要考查一个圆柱形工件尺寸是否合格,需要考查径向尺寸X与轴向尺寸YXY都是随机变量,要考查圆柱形工件尺寸的合格率就需要研究二维随机变量及其概率分布。

定义3.1 设Ω为随机试验E的样本空间,XY是定义在Ω上的一对有序的随机变量,则称(XY)为二维随机变量

对于任意一对实数xy,称二元函数

Fxy)=P{XxYy}(3.1)

为(XY)的联合分布函数(joint distribution function),简称为(XY)的分布函数

XY)的分布函数Fxy)实际上是(XY)取值落在区域G={(xy)|-∞<Xx,-∞<Yy}内的概率。如图2-5(左)所示。

图2-5

由图2-5(右)可知

P{a<Xbc<Yd}=Fbd)-Fbc)-Fad)+Fac)  (3.2)

二维随机变量的分布函数有下列性质:

(1)0≤Fxy)≤1;

(2)Fxy)对于xy都是单调不减的;

(3)F(-∞,y)=Fx,-∞)=F(-∞,-∞)=0,

F(+∞,+∞)=1;  (3.3)

(4)Fxy)对于xy均右连续;

(5)对于任意的x1x2y1y2,且x1x2y1y2,均有

P{x1<Xx2y1<Yy2}=Fx2y2)-Fx2y1)-Fx1y2)+Fx1y1)≥0成立。

前4条性质与一维随机变量分布函数性质相似,性质(5)由概率的非负性和Fxy)的单调性可知是正确的。

1.二维离散型随机变量及其联合分布

定义3.2 如果二维随机变量(XY)中的XY分别都是离散型随机变量,即(XY)可能的取值为有限对或可列无限对,则称(XY)为二维离散型随机变量。称随机事件{X=xiY=yj}(即事件{X=xi}∩{Y=yj})的概率P{X=xiY=yj}=pijij=1,2,…)为(XY)的联合分布律联合分布(joint distribution)。

联合分布率常用下面表格形式表达

XY)的联合分布律有下列性质:

(1)0≤pij≤1(i=1,2,…,m,…;j=1,2,…,n,…);

(2)

XY)的联合分布函数为

   (3.4)   

其中和号是对满足条件“xixyjy”的所有pij求和。

【例1】 一个口袋里装有三个球,分别标有号码1,1,2,从中先后任取两个球,第一次取出球的标号为X,第二次取出球的标号为Y,求(XY)的联合分布律。

 (1)(不放回抽样)由概率的乘法公式可得(XY)的联合分布律:

或用表格形式

表示。

(2)(放回抽样)由概率的乘法公式可得(XY)的联合分布律为

2.二维连续型随机变量及其联合分布

定义3.3 若二维随机变量(XY)的分布函数Fxy)对任意xy

   (3.5)   

其中fxy)≥0。则称(XY)为二维连续型随机变量,fxy)为(XY)的联合密度函数,简称联合密度

XY)的联合密度具有下列性质:

(1)fxy)≥0;

(2)

(3)在fxy)的连续点处,有

(4)若GxOy平面上的任一区域,则

   (3.6)   

凡满足前两条性质的函数fxy)均可作为二维连续型随机变量的联合密度。

【例2】 设(XY)的联合密度函数为

求(1)(XY)的分布函数;(2)求P{0<X<1,X<Y<1}。

 (1)

x≤0或y≤0时,fst)=0

故  Fxy)=0

x>0,0<yx

(积分限的确定如图2-6所示)

图2-6

x>0,y>x时,

(积分限的确定如图2-7所示)

图2-7

(2)

几种常用的二维连续型随机变量的分布:

(1)均匀分布 若(XY)的联合密度为

   (3.7)   

式中,GxOy平面上的有界区域;s为区域G的面积。则称(XY)服从区域G上的均匀分布

(2)二维正态分布 若(XY)的联合密度为

   (3.8)   

其中 μ1μ2σ1σ2ρ均为实常数,且σ1>0,σ2>0,-1<ρ<1(-∞<x<+∞,-∞<y<+∞)。

则称(XY)服从二维正态分布。记为

对于二维随机变量的讨论可以推广到nn>2)维随机变量的情形。

X1X2,…,Xn是建立在随机试验E的样本空间Ω上的一组n个有序随机变量,则称(X1X2,…,Xn)为n维随机变量(或n维随机向量)。对于任意的(x1x2,…,xn)∈Rn,称Fx1x2,…,xn)=P{X1x1X2x2,…,Xnxn}为(X1X2,…,Xn)的联合分布函数(或简称分布函数)。它具有类似于二维随机变量分布函数的性质。

二、边缘分布与*条件分布

1.边缘分布

二维随机变量(XY)中的XY都是随机变量,它们各有自己的分布函数FXx),FYy),而(XY)又有联合分布函数Fxy),它们之间既有区别,又有联系。为了深入研究,于是引入边缘分布的概念。

定义3.4 设Fxy)为二维随机变量(XY)的联合分布函数,则称

为(XY)关于X边缘分布函数(marginal distribution function)。同理,称

   (3.9)   

为(XY)关于Y边缘分布函数

对于离散型的情形,(XY)的两个边缘分布函数分别为

XY)的两个边缘分布律分别为

   (3.10)   

对于连续型的情形,(XY)关于XY的两个边缘分布函数分别为

XY)的两个边缘密度函数分别为

   (3.11)   

【例3】 设(XY)的联合分布律为

求(XY)的边缘分布律。

 (XY)关于XY的边缘分布律分别为:

边缘分布律与联合分布律可用同一表格表示,如例3可表示为

一般情形如下表所示

【例4】 设(XY)的联合密度为

求(1)常数C;(2)fXx),fYy)。

 (1)由fxy)的性质(2)可知

,故C=6。

(2)

x<0时,fxy)=0,因而fXx)=0;

x≥0时,0;

故   

同理可得

【例5】 设(XY)在区域G内服从均匀分布,其中Gy=x所围成(如图2-8所示),求边缘概率密度fXx),fYy)。

图2-8

 G的面积

所以

同理

【例6】 设,求fXx),fYy)。

 由式(3.11)知

由式(3.8)知

   令   

   则 

     同理可得   

由上述结果可知:(XY)关于X的边缘分布为,关于Y的边缘分布为,它们都与ρ无关。由联合分布可唯一确定边缘分布。反过来,一般由边缘分布不能确定联合分布。

*2.条件分布

由条件概率很自然地引出条件分布。

设二维离散型随机变量(XY)的联合分布律为

pij=P{X=xiY=yj} (ij=1,2,…)

XY)关于XY的边缘分布律分别为

p>0,p·j>0,我们考虑在事件“Y=yj”发生条件下事件“X=xi”发生的概率。也就是要研究P{X=xiY=yj}。

令  A={X=xi},B={Y=yj}

因  PA)=p>0,PB)=p·j>0

由条件概率定义

   即       (3.12)

同理可得

   (3.13)   

不难验证

(1)P{X=xiY=yj}≥0;

(2)

于是我们引出下列定义:

定义3.5 设(XY)是二维离散型随机变量,对于固定的j,若P{Y=yj}>0,则称

为在Y=yj条件下随机变量X条件分布律

同样,对于固定的i,若P{X=xi}>0,则称

为在X=xi条件下随机变量Y条件分布律

值得指出的是式(3.12)和式(3.13)可分别改作

P{X=xiY=yj}=P{Y=yjP{X=xiY=yj}

P{X=xiY=yj}=P{X=xiP{Y=yjX=xi}

这两个式子与事件概率的乘法公式是十分相似的。

【例7】 一射手进行射击,击中目标的概率为p(0<p<1),射击到击中目标两次为止。设X表示第一次击中目标时的射击次数,Y表示射击的总次数,试求(XY)的联合分布律及条件分布律。

 设第一次击中目标为第m次,总的射击次数为n次,则

m=1,2,…时

n=2,3,…时

【例8】 设袋中有白球3个,黑球3个,红球2个。现从中任取2球,其中白球与红球的个数分别记作XY,求(1)P{X+Y=1};(2)Y=1条件下,随机变量X的条件分布。

 由古典概型可得(XY)的联合分布律

这是二维超几何分布,其分布律的表格形式如下

(1)

(2)

设(XY)是二维连续型随机变量。这时,由于对任意的xy都有P{X=x}=0,P{Y=y}=0,因此就不能用条件概率公式引入条件分布了。下面,用极限的方法来处理。

给定y,设对于任意给定的正数εP{y-ε<Yy+ε}>0,于是对于任意实数x

上式给出了在条件y-ε<Yy+εX的条件分布函数。现在我们引入以下定义。

定义3.6 给定y,设对于任意给定的正数εP{y-ε<Yy+ε}>0。若极限

存在,则称此极限为在条件Y=yX条件分布函数。记为

FXYxy) 或 P{XxY=y}

设(XY)的联合分布函数为Fxy),联合密度为fxy),而fxy)在点(xy)处连续,边缘密度函数fYy)连续,且fYy)>0,则有

   即       (3.14)

若记fXYxy)为在条件Y=yX的条件概率密度,则由上式知

   (3.15)   

同理可推出,若fxy)在(xy)处连续,fXx)连续且fXx)>0,则

   (3.16)   

   (3.17)   

【例9】 设(XY)在区域G:{(xy)/0≤x<1,且内服从均匀分布,求fYXyx);fXYxy)。

   由例5可知  

由式(3.15)、式(3.17)可得,

当0<x<1时

当0<y<1时

【例10】 设,求fXYxy);fYXyx)。

 由例6知

又由式(3.15)、式(3.17)可得

由此可知,二维正态分布的条件分布仍为正态分布。

三、随机变量的独立性

由随机事件的独立性不难引出随机变量的独立性。设Fxy),FXx),FYy)分别为(XY)的联合分布函数和边缘分布函数,{Xx}为随机事件A,{Yy}为随机事件B。若随机事件AB独立,则

PAB)=PAPB

即  P{XxYy}=P{XxP{Yy}

也就是  Fxy)=FXxFYy

从而,我们可以引入两个随机变量独立的定义。

定义3.7 设Fxy),FXx),FYy)分别是(XY)的联合分布函数和边缘分布函数,若对任意实数xy都有

Fxy)=FXxFYy)  (3.18)

则称随机变量XY相互独立,简称独立

前边已经讲过,由(XY)的两个边缘分布一般不能确定(XY)的联合分布。但是,当XY相互独立时,(XY)的联合分布可由其边缘分布唯一确定

Fxy)=FXxFYy

随机变量的独立性有如下等价形式:

(1)若(XY)是离散型随机变量,XY相互独立的充分必要条件是,对(XY)所有可能取值(xiyj)都有

P{X=xiY=yj}=P{X=xiP{Y=yj}

(2)若(XY)是连续型随机变量,则XY相互独立的充分必要条件是,在fxy)的连续点(xy)处都有

fxy)=fXxfYy

下边的定理以后常常用到。

定理3.1 若随机变量XY相互独立,g1x)与g2x)是任意两个连续函数,则g1X)与g2Y)也相互独立。

【例11】 设随机变量XY相互独立且具有二维分布律:

试求ab的值。

P=P{X=1}=1/8+a, P=P{X=2}=3/8+b

P·1=P{Y=3}=1/8+3/8=1/2, P·2=P{Y=4}=a+b

又因XY相互独立,所以p11=pp·1,即

,所以

【例12】 已知(XY)服从区域上的均匀分布,求关于XY的边缘分布密度,并判定XY是否独立?

 由式(3.7)知,(XY)的联合密度为

因 fxy)≠fXxfYy)如在处,故XY不独立。

【例13】 若(XY)服从二维正态分布。试证:XY相互独立的充分必要条件是ρ=0。

证明 由例6知

XY独立,则fxy)=fXxfYy)对任意xy均成立,在(μ1μ2)点当然也成立。即

所以,故ρ=0。

ρ=0,显然有fxy)=fXxfYy)恒成立。故XY独立。

随机变量的独立性可以推广到nn>2)个随机变量的情形。即若n个随机变量X1X2,…,Xn均定义在同一样本空间Ω上,对任一组实数(x1x2,…,xn)∈Rn,均有

P{X1x1X2x2,…,Xnxn}=P{X1x1}P{X2x2}…P{Xnxn}

即   

则称X1X2,…,Xn相互独立,简称独立。

n个随机变量X1X2,…,Xn独立的含义是随机向量(X1X2,…,Xn)的联合分布函数是各个Xi的边缘分布函数的乘积。

特别地,当(X1X2,…,Xn)是连续型随机向量时,则n个随机变量X1X2,…,Xn独立的充要条件是:随机向量(X1X2,…,Xn)的联合分布密度是各个Xi的边缘分布密度的乘积,即

下面阐述随机向量间的独立性概念。

设两个随机向量(X1X2,…,Xn)与(Y1Y2,…,Ym),若对任意的实数x1x2,…,xny1y2,…,ym,随机事件{X1x1,…,Xnxn}与随机事件{Y1Y1,…,Ymym}总是独立的,即

P{X1x1,…,XnxnY1y1,…,Ymym}

     =P{X1x1,…,XnxnP{Y1y1,…,Ymym}  (3.19)

用联合分布函数可表作:

   (3.20)   

则称(X1X2,…,Xn)与(Y1Y2,…,Yn)相互独立,简称独立。

关于随机向量间的独立性,以后会常用到以下结论。设(X1X2,…,Xm)和(Y1Y2,…,Yn)相互独立,则Xii=1,2,…,m)和Yjj=1,2,…,n)相互独立,又若hg是连续函数,则hX1X2,…,Xm)和gY1Y2,…,Yn)相互独立。