第九章统计第九章统计9.1随机抽样9.1.2分层随机抽样第九章统计第九章统计第九章统计抽样调查最核心的问题是样本的代表性.简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本.能否利用总体中的一些额外信息对抽样方法进行改进呢?例如,在对树人中学高一年级学生身高的调查中,可能出现样本中50个个体大部分来自高个子或矮个子的情形,这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现较大的误差.第九章统计第九章统计问题3在树人中学高一年级的712名学生中,男生有326名、女生有386名.能否利用这个辅助信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?影响身高因素有很多,性别是其中的一个主要因素.高中男生的身高普遍高于女生的身高,而相同性别的身高差异相对较小.我们可以利用性别和身高的这种关系,把高一年级学生分成男生和女生两个身高有明显差异的群体,对两个群体分别进行简单随机抽样,然后汇总作为总体的一个样本.由于在男生和女生两个群体中都抽取了相应的个体,这样就能有效地避免“极端”样本.第九章统计第九章统计对男生、女生分别进行简单随机抽样,样本量在男生、女生中应如何分配?为了使样本的结构与总体的分布相近,人数多的群体应多抽一些,人数少的群体应少抽一些因此,按男生、女生在全体学生中所占的比例进行分配是一种比较合理的方式,即男生样本量=×总样本量全体学生数男生人数女生样本量=×总样本量全体学生数女生人数第九章统计第九章统计这样无论是男生还是女生,每个学生抽到的概率都相等.当总样本量为50时,可以计算出从男生、女生中分别应抽取的人数为n男=×50≈71232623,n女=×50≈71238627.第九章统计第九章统计我们按上述方法抽取了一个容量为50的样本,其观测数据(单位:cm)如下:男生173.0174.0166.0172.0170.0165.0165.0168.0164.0173.0172.0173.0175.0168.0170.0172.0176.0175.0168.0173.0167.0170.0175.0女生163.0164.0161.0157.0162.0165.0158.0155.0164.0162.5154.0154.0164.0149.0159.0161.0170.0171.0155.0148.0172.0162.5158.0155.5157.0163.0172.0第九章统计第九章统计通过计算,得出男生和女生身高的样本平均数分别为170.6、160.6.根据男生、女生身高的样本平均数以及他们各自的人数,可以估计总体平均数为712386160.6326170.6165.2,即估计树人中学高一年级学生的平均身高在1...