第4章基本统计分析Frequencies频数分析表Descriptive描述性统计分析过程Explore探索分析过程Crosstabs列联表分析过程本章主要内容数据分布的特征集中趋势集中趋势((位置位置))偏态和峰态偏态和峰态(形状)(形状)离中趋势离中趋势((分散程度分散程度))集中趋势(Centraltendency)1.1.一一组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度2.2.测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值3.3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4.4.低层次数据的测度值适用于高层次的测量数据,但高层次低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据数据的测度值并不适用于低层次的测量数据1均值(Mean):2众数(Mode):出现频率最高的数3中位数(Median):将数据排序后位于正中间的数值。适合于所有分布类型的数据4总和(Sum)基本描述统计量niixnx11众数(mode)1.出现次数最多的变量值2.不受极端值的影响3.一组数据可能没有众数或有几个众数4.主要用于分类数据,也可用于顺序数据和数值型数据众数(不唯一性)无众数原始数据:10591268一个众数一个众数原始数据原始数据:6:65598985555多于一个众数多于一个众数原始数据原始数据:25:2528282828363642424242中位数(median)1.排序后处于中间位置上的值MMee50%50%50%50%50%50%50%50%2.2.不受极端值的影响不受极端值的影响3.3.主要用于顺序数据,也可用数值型数据,但不能主要用于顺序数据,也可用数值型数据,但不能用于分类数据用于分类数据4.4.各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即min1nieiMxmin1nieiMx数值型数据的中位数(9个数据的算例)【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数中位数10810800521921n位置521921n位置数值型数据的中位数(10个数据的算例)【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:123456789105.5211021n位置5.5211021n位置102021080960中位数102021080960中位数四分位数(quartile)1.排序后处于25%,50%和75%位置上的值2.2.不受极端值的影响不...