2020.05.20第九章《统计》9.1.2分层随机抽样简单随机抽样是使总体中每一个个体都有相等的机会被抽中,即能保证抽样的公平性;但因为抽样的随机性,有可能会出现比较“极端”的样本。抽样调查最核心的问题就是样本的代表性.例如,在对树人中学高一年级学生身高的调查中,可能出现样本中50个个体大部分来自高个子或者矮个子的情形。这种“极端”样本的平均数会大幅度偏离总体平均数,从而使得估计出现较大的误差。问题:能否利用总体中的一些额外信息对抽样方法进行改进呢?4.分层抽样【问题3.1】树人中学高一年级有712名学生,其中男生有326名,女生有386名.能否利用这个辅助信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?性别是影响身高的其中一个主要因素。高中男生的身高普遍高于女生的身高,而相同性别的身高差异相对较小。我们可利用性别和身高的这种关系,把高一年级学生分成男生和女生两个身高有明显差异的群体,对两个群体分别进行简单随机抽样,然后汇总作为总体的一个样本。由于在男生和女生两个群体中都抽取了相应的个体,这样就能有效地避免“极端”样本。4.分层抽样【问题3.2】树人中学高一年级有712名学生,其中男生有326名,女生有386名.抽取一个容量为50的简单随机样本,应如何分配?为了使样本的结构与总体的分布相近,人数多的群体应多抽一些,人数少的群体应少抽一些.即可按男生、女生在全体学生中所占的比例进行分配:无论是男生还是女生,每个学生抽到的概率都相等,均为n/N.男生人数男生样本量总样本量全体人数女生人数女生样本量总样本量全体人数男生人数男生样本量为每个男生被抽到的概率女生人数女生样本量为每个女生被抽到的概率全体人数总样本量全体人数总样本量,男2350712326n.2750712386女n这种样本量的分配方式为比例分配。按照性别变量4.1分层抽样的定义高一年级的学生男生女生男生样本女生样本抽样抽样样本特征总体特征子总体1子总体2按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本。注:每一个子总体称为层。分层随机抽样:总体人数总样本量各层总人数各层样本量抽样比例(1)分层根据已经掌握的信息,将总体分成互不相交的层;(3)定数确定每一层应抽取的个体数目,并使每一层应抽取的个体数目之和为样本容量n;(4)抽样按步...