中心极限定理的应用
摘要:中心极限定理是概率论与数理统计课程中一个重要的定理,衔接着概率论知识与数理统计的相关知识,既是教学重点又是难点。中心极限定理在很一般的条件下证明了无论随机变量Xi服从什么分布,n个随机变量的和∑nk=1Xk的极限分布是正态分布,本文仅介绍其中两个最基本的结论并举例应用。
关键词:中心极限定理;正态分布;应用
中图分类号:O212文献标志码:A文章编号:2095-9214(2016)03-0138-02前言
大数定律和中心极限定理是统计学的两大基石,前者确保了统计推断至少在样本增大时可以无限接近真相,而后者则给出了大多数统计量分布的正态近似。大数定律只能从质的方面描述随机现象,而中心极限定理可以更进一步从量的方面描述随机现象,所以中心极限定理比大数定律深刻实用得多,它是概率论与数理统计的基础。
中心极限定理解决了大量独立随机变量和的近似分布问题,其结论表明:当一个量受许多随机因素的共同影响而随机取值,则它的分布就近似服从正态分布,而正态分布的许多完美理论,能帮助我们获得实用简单的统计分析结果,本文仅介绍其中的两个最基本的结论,并通过举例加以应用。
1.独立同分布的中心极限定理
定理1设随机变量X1,X2,…,Xn,…相互独立、服从同一分布,且E(Xk)=μ,D(Xk)=σ2>0,(k=1,2,…,n,…),则随机变量X1,X2,…,Xn,…之和∑nk=1Xk的标准化变量Yn=∑nk=1Xk-E(∑nk=1Xk)D(∑nk=1Xk)=∑nk=1Xk-nμnσ的分布函数Fn(x),对于任意的x,满足:
limn→∞Fn(x)=limn→∞P∑nk=1Xk-nμnσ≤x=∫x-∞12πe-t22dt=φ(x)
注1当n充分大时,满足均值为μ,方差为σ2>0的独立同分布(无论服从什么分布)的随机变量X1,X2,…,Xn…,它们的和∑nk=1Xk总是近似地服从正态分布,记作:
∑nk=1Xk-nμnσ近似~N0,1
即∑nk=1Xk-nμnσ=1n∑nk=1Xk-μσ/n=X-μσ/n近似~N0,1
即有X近似~N(μ,σ2n),于是有下面的推论:
当n充分大时,记Sn=X1+X2+…+Xn,可得如下的近似计算公式:
PSn-nμnσ≤x≈Φx
注2对任意a
Pa≤Sn≤b=Pa-nμnσ ≈Φb-nμnσ-Φx-nμnσ 例1某炮兵阵地对敌人的防御地段进行100次射击,每次射击中炮弹的命中数是一个随机变量,其期望为2,方差为1.69,求在100次射击中有180颗到220颗炮弹命中目标的概率。 解设Xk表示第k次射击中的炮弹数,则EXi=2,DXi=1.69,且S100=X1+X2+…+X100,应用中心极限定理,S100-100μ100σ近似服从N(0,1),由题意n=100,nμ=200,nσ=13 ,所以: P(180≤Sn≤220)=P180-20013≤Sn-20013≤220-20013 ≈Φ2013-Φ-2013=2Φ1.54-1 =0.8764 例2设各零件的质量都是随机变量,他们相互独立且服从相同的分布,其期望为0.5kg,均方差为0.1 kg,问5000个零件的总重量超过2510 kg的概率是多少? 解由题意可知,Xi表示第i个零件的质量,且E(Xi)=0.5,D(Xi)=0.12,n=5000,令X=∑5000i=1Xi表示5000个零件的总重量,由独立同分布的中心极限定理: X-E(X)D(X)=X-5000×0.55000×0.1~N(0,1) P(X>2510)=1-P(X≤2510) =1-φ(2510-5000×0.55000×0.1) =1-φ(2)=1-0.9213=0.0787 2.棣莫弗-拉普拉斯定理 定理2设随机变量ηn(n=1,2,…)服从参数为n,p(0 注1正态分布是二项分布的极限分布,当n充分大时,可用正态分布来计算二项分布的概率。且对任意的区间a,b有Pa≤ηn-npnp(1-p)≤b=∫ba12πe-t22dt.ηn-npnp(1-p)近似服从N(0,1)分布,而ηn近似服从N(np,np(1-p)).二项分布的随机变量的概率可转化为正态分布的概率来计算,计算方法如下: Pa≤ηn≤b=Pa-npnp(1-p)≤ηn-npnp(1-p)≤b-npnp(1-p) ≈Φb-npnp(1-p)-Φa-npnp(1-p)。 注2定理1和定理2这两个中心极限定理都是研究可列个相互独立的随机变量的和的分布的,在一般条件下,当独立的随机变量的个数增加时,其和的分布趋于正态分布,也说明正态分布的重要性。 例3一个复杂系统由100个相互独立的元件组成,在系统运行时每个元件损坏的概率为0.1,为使系统正常工作,至少必须有85个元件工作,求系统的可靠度(正常工作的概率)。 解以X表示100个元件中正常工作的元件数,则X~B(100,0.9),由二项分布的正态近似,X-100×0.9100×0.9×0.1~N(0,1), P(X≥85)=1-P(X<85)=1-P(X-903<85-903) =1-φ(-53)=0.9525 例4产品为废品的概率p=0.005,求1000件产品中废品数不大于7的概率。 解1000件产品中的废品数X服从二项分布,n=1000,p=0.005,np=5,np(1-p)≈2.2305,下面用三种方法计算 (1)由二项分布公式计算,P(X≤7)=∑7k=0Ck10000.005k0.9951000-k (2)用泊松公式计算, λ=np=5,查表P(X≤7)≈∑7k=0pk5≈0.866624 (3)用中心极限定理计算,P(X≤7)≈Φ7-52.2305≈Φ0.8968=0.8133 正态分布和泊松分布虽然都是二项分布的极限分布,但后者以n→∞,同时p→0,np→λ为条件,而前者则只要求n→∞这一条件,一般对于n很大p很小的二项分布,用正态分布来近似不如用泊松分布计算精确。 大数定律是研究随机变量序列Xn依概率收敛的极限问题,而中心极限定理则是研究随机变量序列Xn依分布收敛的极限问题,他们都是讨论大量的随机变量之和的极限行为,当X1,X2,…,Xn,…相互独立且服从同一分布,且有大于0的有限方差时,大数定律和中心极限定理同时成立,但是通常中心极限定理比大数定律更为精确。 (作者单位:长江大学工程技术学院) 参考文献: [1]秦川.概率论与数理统计(第二版)[M].湖南教育出版社,2013. [2]宗序平.概率论与数理统计(第三版)[M].机械工业出版社,2011. [3]陶伟.概率论与数理统计习题全解[M].国家行政学院出版社,2008. [4]王伟珠.论中心极限定理及应用[J].赤峰学院学报, 2013(10). [5]王筑娟.中心极限定理介绍[J].上海应用技术学院学报,2013(4).