第一节计数资料常用指标

作者：徐荣祥出版社：中国科学技术出版社发行日期：2009年7月

一、率的抽样误差和标准误
关于抽样误差的概念已在第一章中作了介绍，在抽样研究中，获得的样本率与总体率或各样本率之间必然也存在着“率”的抽样误差。均数抽样误差产生的原因与之相同。表示率（比）抽样误差大小的统计指标叫率的标准误。如某医生调查了某乡某种疾病的患病率为15%（即调查1 000人有150人患这种疾病），但在抽样过程中必然会有抽样误差。被调查的这个乡是一个整体，如果再次重复调查1 000人，其患病率不一定是15%，可能高一点，也可能低一点。这种差异是由于抽样所造成的。率的标准误根据公式计算：

式中αp为率的标准误，π为总体率，n为样本的含量。
由于π为总体率，实际工作中一般不知道它的数值，故常用样本率p来代替，从而计算出率的标准误的估计值（Sp），计算公式为：

式中Sp为率的标准误估计值； p为样本率；n为样本的含量
示例341某医生用一种新药治疗烧伤康复期贫血，100例病人有75例血液血红蛋白增加至10g/L以上，求血红蛋白增加率的标准误。
【解题步骤】
1计算血红蛋白增长率：75÷100=075，或750%。
2将数值代入公式342，计算血红蛋白增加率的标准误：

3分析：血红蛋白增加率为750%，其标准误为185%。由此可见，率的标准误反映率的抽样误差大小，是衡量样本率的稳定性和可靠性的指标。率的标准误越小，表示率的抽样误差越小，用以估计总体率的可靠性越大。反之，率的标准误也越大，则由样本估计总体率的可靠性就越小。
4意义：有了率的标准误，可以用其来确定总体率的可信区间；还可用于样本率与总体率及两个样本率之间差异的显著性检验。
二、总体率的可信区间
由于样本率与总体率之间存在误差，所以我们只能根据样本率来推算总体率的可能性。当总体率π不太接近0或1时，且每次抽样的样本观察数n又不是太小时，样本率的分布也属正态分布。因此可以根据率的标准误，仿照估计均数可信区间方法估计总体率所在的范围，这个范围即为总体率的可信区间。
总体率的可信区间公式为：

式中p为标准率，Sp为率的标准误，U为常量。
总体率区间的表达参数与公式：①求95%可信区间的参数采用196； ②求99%可信区间的参数采用258。
即：总体率95%可信区间为：

总体率99%可信区间为：

示例342某医院用新疗法治疗大面积烧伤病人243例，治愈236例，死亡7例，病死率为288%。求其总体病死率95%和99%的可信区间。
【解题步骤】
1根据例中提供的资料已知：病死率P=288%，（1-P）=9712%，n=243。
2将以上数据代入公式（342），求病死率的标准误：

3根据公式（344）、（345），求出95%、99%的可信区间：
（1）总体率95%的可信区间范围为：P±196SP，即288%±196×（107）=288%±210%。说明总体病死率有95%的可能性在078%～498%之间。
（2）总体率99%的可信区间范围为：P±258SP，即288%±258×（107）=288%±276%。说明总体病死率有99%的可能性在012%～564%。
4分析：由于抽样误差的存在，当发现两个率或两个以上的率之间存在差异时，应考虑到差异是真正存在的，还是由于抽样误差造成的，故应进行显著性检验。

第一节 计数资料常用指标

第一节计数资料常用指标