第四节概率与可信限

作者：徐荣祥出版社：中国科学技术出版社发行日期：2009年7月

一、概率
概率又称几率，是指总体某事件理论发生率大小的数值，或称作是估计某事件发生的可能性大小的一种变量指标，用符号P表示。概率这个名词虽然在日常工作中直接使用者较少，但是对于这一概念的应用却非常广泛，例如，医生根据自己的诊治经验，认为“这个病人十有八九会死于急性肾功衰竭”。若从概率论的角度分析，就是说这个病人致死的原因80%～90%可能是急性肾功衰竭。有文献记载，烧伤病人的半数致死烧伤面积（LD50）为87%，如果统计的数量相当大，我们就可以把这个频率看作概率，是说87%烧伤面积者的治愈率在50%左右。又如，某动物室存有雌雄各半的一大群动物，我们随意抽取2只，虽然不能预言其雌雄，但是根据统计学原理可以推算出，取一只为雄性的发生率为50%(即05)；连取两只均为雄性的发生率为025(05×05)，其规律性可用05表示，(即连取n只均为雄性的发生率应为05)。一般情况下，总体中某事件的概率是未知的，可以通过多次重复观察样本，从样本中的雄性发生率来判断总体的概率。所以，概率也可以认为是无数次重复时该事件的发生率。
概率可用小数或百分数表示，如P＜05（005），或写作50%（5%）。P值波动在0～1之间。若某一事件必然不发生，则该事件发生的概率为0；某一事件必然发生，则该事件发生的概率为1。概率越接近0，表示发生的可能性越小，概率越接近1，发生的可能性越大。我们经常遇到说明概率事件的情况有三种：①必然事件指的是必然发生的事件，如人体皮肤与100℃沸水接触1min，必然会发生Ⅲ度烧伤，必然事件的概率P=1；②不可能事件如1%烧伤面积的成人患者不会发生早期低血容量休克，必定不会发生，不可能事件的概率P=0；③随机事件指的是在一定条件下可能发生，也可能不发生，如病人发生了条件致病菌感染，是否会发生败血症？回答是可能发生，也可能不发生，随机事件的概率P在0与1之间。
概率也是某事件出现的可能性大小的度量，它与频率不同，概率是对总体而言，频率是对样本而言。在相同条件下进行n次重复实验，事件发生数a小于或等于n（a≤n），则a与n的比（a/n）为事件A的频率。如n逐渐增大，则事件A的频率则越来越接近概率P。统计学上常以n充分大时事件A的频率作为该事件概率的近似值。
二、可信区间
前边已经提到，可以用样本均数估计总体均数，样本率可以估计总体率。每种估计如果仅是一个值，称为净值估计，或点估计。它们都是无偏估计，因为它们的数字期望就等于各自的总体值。从变异的意义上讲，样本均数（或率）仅是对一份样本而言，是总体均数（或率）的最好估计。样本均数包括了一份样本用于估计总体均数的所有信息。因此，样本均数或样本率具有估计的优越性。但是，样本均数与在各样本之间是不一样的，对于一个连续性的变量来讲，样本均数可取无穷多个值，即样本均数未必恰好等于总体均数。样本率也是如此，因为在研究工作中所观察到的百分率或均数，毕竟是从数量有限的样本中得到的，它仅仅是接近而不是等于总体的概率或均数。为解决这个问题，从而产生了区间可信限这个概念：用一个区间而不是一个点来估计总体参数。根据统计学原理，我们可以在百分率或均数的上下扩大一定范围，使总体均数（或率）处于该范围内的可能性为95%，这就是“95%的可信限”，或称95%的可信区间。
事实上，我们并未测定总体的均数（或率），但是根据统计分析原理，有95%甚至99%的把握可以推导出总体均数所在的范围。如果样本例数很大，重复次数又很多，我们推断总体的准确性也就愈大。统计学常用样本均数加减95%可信限，或99%的可信限来表示总体均数的预期范围。

第四节 概率与可信限

第四节概率与可信限