质量复习---抽样统计知识(1)
发布于:2009-4-12 已被阅读: 次 

根据中心极限定理,任何一种连续型随机变量,不管它本身的图形如何,只要它的样本个数超过30个,它的均值就可以视为服从正态分布.

抽样统计学原理概要

我们从一个总数为N的群体中选取n个样本,并估计参数μ和σ2,即样本容量和方差。可以用这两个参数来描述分布状态,尤其是正态分布。随机性确保了群体中的每个单元都有均等的入选机会,它排除了选择的偏差。估计值ā和s2,即样本的平均值和方差都有它们各自的分布形式,我们常假定正态分布是最佳分布形式。可以用这种分布来估计z的概率和正态偏差(即用t分布估计t的概率)或者形成确定样本数的z、t分布表。有许多种随机取样方法,最简单的是对随机性没有限制的简单随机取样。

例如,如果一个取样区域的一部分是斜坡,而另一部分是平地,那么,这两个部分应该分别进行取样分析和解释。我们可以对随机性附加些限定条件,如在分层随机取样中我们希望去除层次之间的变异,其限制条件是在每一个层次中都分别随机性处理。在简单随机取样中,样本平均值总是群体平均值的无偏估计值。我们谈到的“最优”估计值是指它的取样方差最小。其结果是样本平均值和样本方差都能达到最优等。人们经常想到的是样本的大小。如果样本的采集方法合适,我们知道,取样分数n/N小,它的值就很难保证估计的精确度,其有效精确度依赖于样本数绝对值。这也就意味着在估计最佳样本数时,有必要考虑绝对样本数,而不是样本百分数。在确定样本数的公式中,经常用n而不用n/N。从样本数和精确度考虑,样本平均值ā的精确度随样本数的提高而提高。在不考虑抽样群体的总体形状时,样本均值ā随样本数的增大而更接近于正态分布,它的根据是中心极限定理。30个样本对于标准估计是足够的(但是,我们也可以抽取超过30个的样本从而达到必要的精确度)。这种假设关系的根据是,方差是有限的,而从总体中抽取样本是随机的。

编辑:admin
SPConline.net