统计 09 随机抽样
随机抽样是一种从总体中抽取样本的方法,旨在确保每个个体都有相等的机会被选入样本,从而使样本能够较好地代表总体。
简单随机抽样
定义:从总体\(N\)个单位中随机地抽取\(n\)个单位作为样本,每个单位被抽中的概率相等,抽样过程中完全排除主观因素的干扰,每个个体的抽取都是相互独立的。
实施方法
抽签法:将总体中的每个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀后,每次从中抽取一个号签,连续抽取\(n\)次,就得到一个容量为\(n\)的样本。
随机数法:利用随机数表、随机数生成器或统计软件等工具来生成随机数,根据随机数确定抽取的个体。例如,先将总体中的个体编号,然后从随机数表中任意指定一个位置开始,按照一定的方向和顺序读取数字,凡编号范围内的数字就对应抽取的个体,直到抽满\(n\)个为止。
系统抽样
定义:将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本。
实施步骤
编号:将总体中的个体编号,编号可以从\(1\)到\(N\)。
分段:计算抽样距\(k = \frac{N}{n}\)(\(N\)是总体个数,\(n\)是样本容量,若\(k\)不是整数,则先从总体中剔除一些个体,使剩下的总体个数\(N'\)能被\(n\)整除,此时\(k=\frac{N'}{n}\)),将总体分成\(n\)段,每段包含\(k\)个个体。
确定起始个体:在第一段中用简单随机抽样确定起始个体编号\(l\)。
抽取样本:按照一定的规则抽取样本,通常是每隔\(k\)个个体抽取一个,即抽取编号为\(l\),\(l + k\),\(l + 2k\),\(\cdots\),\(l+(n - 1)k\)的个体。
分层抽样
定义:将总体按照某些特征或属性分成若干层(子总体),然后从每一层中按照一定的比例独立地进行简单随机抽样,再将各层抽取的样本合在一起构成总样本。
实施步骤
分层:根据总体的特征或属性,将总体划分为若干互不重叠的层,例如按性别、年龄、职业等分层。
计算各层抽样比例:根据总体中各层的个体数占总体个体数的比例,确定在各层中抽取样本的比例。假设总体有\(N\)个个体,分为\(k\)层,第\(i\)层有\(N_i\)个个体,样本容量为\(n\),则第\(i\)层的抽样比例为\(p_i=\frac{n_i}{N_i}=\frac{n}{N}\)(\(n_i\)是第\(i\)层应抽取的样本数量)。
在各层中进行抽样:在每一层中采用简单随机抽样的方法抽取相应数量的个体,组成各层的样本。
汇总样本:将各层抽取的样本组合起来,得到总体的样本。
整群抽样
定义:将总体划分为若干个群,然后以群为抽样单位,从总体中随机抽取若干个群,对被抽中的群内所有个体进行调查的抽样方法。
实施步骤
分群:将总体按照某种方式划分为若干个群,例如按地理位置、行政区域等划分。
抽取群:从所有群中随机抽取若干个群,可以采用简单随机抽样或其他抽样方法。
调查群内个体:对抽中的群内的所有个体进行调查或测量,获取所需的数据。