二项分布和Poisson分布均是常见的离散型分布,在分类资料的统计推断中有非常广泛的应用。
一、二项分布的概念及应用条件
1. 二项分布的概念:
如某实验中小白鼠染毒后死亡概率P为0.8,则生存概率为=1-P=0.2,故
对一只小白鼠进行实验的结果为:死(概率为P)或生(概率为1-P)
对二只小白鼠(甲乙)进行实验的结果为:甲乙均死(概率为P2)、甲死乙生[概率为P(1-P)]、乙死甲生[概率为(1-P)P]或甲乙均生[概率为(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]2
依此类推,对n只小白鼠进行实验,所有可能结果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n 其中n为样本含量,即事件发生总数,x为某事件出现次数,cnxPx(1-P)n-x为二项式通式,cnx=n!/x!(n-x)!, P为总体率。
因此,二项分布是说明结果只有两种情况的n次实验中发生某种结果为x次的概率分布。其概率密度为:
P(x)=cnxPx(1-P)n-x, x=0,1,...n。
2. 二项分布的应用条件:
医学领域有许多二分类记数资料都符合二项分布(传染病和遗传病除外),但应用时仍应注意考察是否满足以下应用条件:(1) 每次实验只有两类对立的结果;(2) n次事件相互独立;(3) 每次实验某类结果的发生的概率是一个常数。
3. 二项分布的累计概率
二项分布下最多发生k例阳性的概率为发生0例阳性、1例阳性、...、直至k例阳性的概率之和。至少发生k例阳性的概率为发生k例阳性、k+1例阳性、...、直至n例阳性的概率之和。
4. 二项分布的图形
二项分布的图形有如下特征:(1)二项分布图形的形状取决于P 和n 的大小;(2) 当P=0.5时,无论n的大小,均为对称分布;(3) 当P<>0.5 ,n较小时为偏态分布,n较大时逼近正态分布。
5. 二项分布的均数和标准差
二项分布的均数µ=np,当用率表示时µ=p
二项分布的标准差为np(1-p)的算术平方根,当用率表示时为p(1-p)的算术平方根。
二、二项分布的应用
二项分布主要用于符合二项分布分类资料的率的区间估计和假设检验。当P=0.5或n较大,nP及n(1-P)均大于等于5时,可用(p-u0.05sp,p+u0.05sp)对总体率进行95%的区间估计。当总体率P接近0.5,阳性数x较小时,可直接计算二项分布的累计概率进行单侧的假设检验。当P=0.5或n较大,nP及n(1-P)均大于等于5时,可用正态近似法进行样本率与总体率,两个样本率比较的u检验。
三、Poisson分布的概念及应用条件
1. Poisson分布的概念:
Poisson分布是二项分布n很大而P很小时的特殊形式,是两分类资料在n次实验中发生x次某种结果的概率分布。其概率密度函数为:P(x)=e-µ*µx/x! x=0,1,2...n,其中e为自然对数的底,µ为总体均数,x为事件发生的阳性数。
2. Poisson分布的应用条件:
医学领域中有很多稀有疾病(如肿瘤,交通事故等)资料都符合Poisson分布,但应用中仍应注意要满足以下条件:(1) 两类结果要相互对立;(2) n次试验相互独立;(3) n应很大, P应很小。
3. Poisson分布的概率
Poisson分布的概率利用以下递推公式很容易求得:
P(0)=e-µ
P(x+1)=P(x)*µ/x+1, x=0,1,2,...
4. Poisson分布的性质:
(1) Poisson分布均数与方差相等;
(2) Poisson分布均数µ较小时呈偏态,µ>=20时近似正态;
(3) n很大, P很小,nP=µ为常数时二项分布趋近于Poisson分布;
(4) n个独立的Poisson分布相加仍符合Poisson分布
四、Poisson分布的应用
Poisson分布也主要用于符合Poisson分布分类资料率的区间估计和假设检验。当µ>=20时,根据正态近似的原理,可用(x-u0.05*x的算术平方根,x+u0.05*x的算术平方根)对总体均数进行95%的区间估计。同样,也可通过直接计算Poisson分布的累计概率进行单侧的假设检验,在符合正态近似条件时,也可用u检验进行样本率与总体率,两个样本率比较的假设检验。