第四节 概率与可信限

作者:徐荣祥 出版社:中国科学技术出版社 发行日期:2009年7月
一、概率
概率又称几率,是指总体某事件理论发生率大小的数值,或称作是估计某事件发生的可能性大小的一种变量指标,用符号P表示。概率这个名词虽然在日常工作中直接使用者较少,但是对于这一概念的应用却非常广泛,例如,医生根据自己的诊治经验,认为“这个病人十有八九会死于急性肾功衰竭”。若从概率论的角度分析,就是说这个病人致死的原因80%~90%可能是急性肾功衰竭。有文献记载,烧伤病人的半数致死烧伤面积(LD50)为87%,如果统计的数量相当大,我们就可以把这个频率看作概率,是说87%烧伤面积者的治愈率在50%左右。又如,某动物室存有雌雄各半的一大群动物,我们随意抽取2只,虽然不能预言其雌雄,但是根据统计学原理可以推算出,取一只为雄性的发生率为50%(即05);连取两只均为雄性的发生率为025(05×05),其规律性可用05表示,(即连取n只均为雄性的发生率应为05)。一般情况下,总体中某事件的概率是未知的,可以通过多次重复观察样本,从样本中的雄性发生率来判断总体的概率。所以,概率也可以认为是无数次重复时该事件的发生率。
概率可用小数或百分数表示,如P<05(005),或写作50%(5%)。P值波动在0~1之间。若某一事件必然不发生,则该事件发生的概率为0;某一事件必然发生,则该事件发生的概率为1。概率越接近0,表示发生的可能性越小,概率越接近1,发生的可能性越大。我们经常遇到说明概率事件的情况有三种:①必然事件指的是必然发生的事件,如人体皮肤与100℃沸水接触1min,必然会发生Ⅲ度烧伤,必然事件的概率P=1;②不可能事件如1%烧伤面积的成人患者不会发生早期低血容量休克,必定不会发生,不可能事件的概率P=0;③随机事件指的是在一定条件下可能发生,也可能不发生,如病人发生了条件致病菌感染,是否会发生败血症?回答是可能发生,也可能不发生,随机事件的概率P在0与1之间。
概率也是某事件出现的可能性大小的度量,它与频率不同,概率是对总体而言,频率是对样本而言。在相同条件下进行n次重复实验,事件发生数a小于或等于n(a≤n),则a与n的比(a/n)为事件A的频率。如n逐渐增大,则事件A的频率则越来越接近概率P。统计学上常以n充分大时事件A的频率作为该事件概率的近似值。
二、可信区间
前边已经提到,可以用样本均数估计总体均数,样本率可以估计总体率。每种估计如果仅是一个值,称为净值估计,或点估计。它们都是无偏估计,因为它们的数字期望就等于各自的总体值。从变异的意义上讲,样本均数(或率)仅是对一份样本而言,是总体均数(或率)的最好估计。样本均数包括了一份样本用于估计总体均数的所有信息。因此,样本均数或样本率具有估计的优越性。但是,样本均数与在各样本之间是不一样的,对于一个连续性的变量来讲,样本均数可取无穷多个值,即样本均数未必恰好等于总体均数。样本率也是如此,因为在研究工作中所观察到的百分率或均数,毕竟是从数量有限的样本中得到的,它仅仅是接近而不是等于总体的概率或均数。为解决这个问题,从而产生了区间可信限这个概念:用一个区间而不是一个点来估计总体参数。根据统计学原理,我们可以在百分率或均数的上下扩大一定范围,使总体均数(或率)处于该范围内的可能性为95%,这就是“95%的可信限”,或称95%的可信区间。
事实上,我们并未测定总体的均数(或率),但是根据统计分析原理,有95%甚至99%的把握可以推导出总体均数所在的范围。如果样本例数很大,重复次数又很多,我们推断总体的准确性也就愈大。统计学常用样本均数加减95%可信限,或99%的可信限来表示总体均数的预期范围。