SPSS宝典
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

6.2 频数分析过程

6.2.1 频数分析过程的SPSS操作

SPSS的频数分析过程可对单变量的许多类型的数据进行,并且可以产生多个统计量和统计图形。下面介绍其操作方法和主要对话框选项的意义。

(1)打开频数分析对话框

在数据编辑窗口,选择菜单“Analyze”→“Descriptive Statistics”→“Frequencies”命令,打开“Frequencies”(频数分析)主对话框,如图6.2所示。

图6.2 “Frequencies”(频数分析)主对话框

(2)选择进行频数分析的变量

在对话框左侧的变量列表框中选择要分析的变量名后,单击右向箭头按钮,使其进入“Variable(s)”(变量)窗口;并在该对话框中选择是否在输出窗口中显示频数分布表,对话框下方给出选项“Display Frequency Tables”(显示频数分布表),默认选择该项。

(3)选择所需计算的基本统计量

单击“Statistics”按钮,打开“Frequencies:Statistics”(频数分析:统计量)对话框,如图6.3所示。

图6.3 “Frequencies:Statistics” (频数分析:统计量)对话框

在“Frequencies:Statistics”对话框中选择需要输出的统计量。关于对话框中所列的统计量的含义,可参考6.1节中的介绍。

按统计量的性质来分,对话框中的基本统计量共分四类。

1. “Percentile Values”(百分位数)窗口用于计算并显示分位数,有如下选择:

QuartiIes 计算四分位数,显示25%、50%、75%的百分位数。

Cut Points for()equaI groups 选择该项,后面的输入窗口变为可用。在窗口中输入数据分组数(2~100间的整数),比如n,表示将所选变量的数据分成n组,计算n分位数,显示1/n100%、2/n10%、…、(n-1)/n100%分位数。

PercentiIe(s) 选择该项,可以选择显示任意的分位数。在后面的窗口中输入0至100之间的分位数,单击“Add”按钮,将输入的百分位数添加到方框内的窗口中,可以多次输入不同数值;选择列表框中输入的数值后,单击“Change”按钮,可修改输入的数值;单击“Remove”按钮,可删除所选数值。

2. “Central Tendency”(中心趋势)窗口用于描述和计算集中趋势的统计量。该窗口中有4个统计量:

Mean 均值。

Median 中位数。

Mode 众数。

Sum 求和。

3. “Dispersion”(偏离度)窗口用于计算描述离散趋势的统计量。该窗口给出6个统计量:

Std.deviation 标准差。

Variance 方差。

Range 极差。

Minimum 最小值。

Maximum 最大值。

S.E.mean 标准误差。

4. “Distribution”(分布)窗口给出计算描述分布的统计量。有两个可选项:

Skewness 偏度以及偏度的标准误差(Std. Error of Skewness)。

Kurtosis 峰度以及峰度的标准误差(Std. Error of Kurtosis)。

关于分组数据,如果选择“Value are group midpoints”选项,表示如果数据已经分组,选择此项后,按分组的数据计算中位数和百分位数。

选择完毕后,单击“Continue”按钮,确认操作并返回至“Frequencies”主对话框。

(4)选择图形类型

在“Frequencies”主对话框中,单击“Charts”按钮,打开“Frequencies:Charts”(频数分析:图形)对话框,如图6.4所示。

在“Frequencies:Charts”对话框中,显示两个窗口,分别是图形类型和图形取值,分述如下:

“Chart Type”(图形类型)窗口给出图形的输出方式,有4种SPSS图形输出方式:

None 默认选项,选择该项,不生成图形。

Bar chart(s) 生成并显示条形图。

Pie chart(s) 生成并显示饼图。

Histogram(s) 生成并显示直方图。如选择该项,下面的“Show normal curve on histogram”(画出正态分布曲线)选项将被激活,选择该项时,表示在显示的直方图中添加正态曲线图,用于推断数据是否近似服从正态分布。

关于条形图、饼图、直方图等统计基本图形的基本形态和定义方式,请参考SPSS图形的创建和编辑章节(第20章)。

“Chart Values”(图形取值)窗口中给出了SPSS图形取值的计算方式,有两个单选项,当图形类型选择条形图或饼图时,单选项会被激活。

Frequencies 默认选项。选择该项,表示图形中的度量用相应变量的个案频数表示。

Percentages 选择该项,表示图形中的度量用相应变量的个案占个案总数的百分比表示。

选择完毕后,单击“Continue”按钮,确认操作并返回至“Frequencies”(频数分析)对话框。

(5)选择输出格式

在“Frequencies”(频数分析)对话框中,单击“Format”按钮,打开“Frequencies:Format”(频数分析:格式)对话框,如图6.5所示。

图6.4 “Frequencies:Charts”(频数分析:图形)对话框

图6.5 “Frequencies:Format”(频数分析:格式)对话框

“Frequencies:Format”(频数分析:格式)对话框用于设置输出频数分析表的格式。对话框中的窗口以及含义如下:

“Order by”窗口中的选项用于设置频数分析表中数据的排列顺序,有4个单选项:

Ascending vaIues 默认选项。选择此项,表示按照变量值的大小升序排列频数。

Descending vaIues 按照变量值的大小降序排列频数。

Ascending counts 按照变量值出现的频数升序排列。

Descending counts 按照变量值出现的频数降序排列。

如果选择了两个以上的变量作频数分析,选择“Multiple Variables”窗口的单选项,可以设置表格的显示方式,有两个单选项:

Compare variabIes 默认选项。选择该项,表示不同变量的统计量显示在同一张列表中。

Organize output by variabIes 不同变量的统计量分别显示在不同的表格中。

“Suppress Tables with many categories”选定该项时,下面的“Maximum number of categories”(分类变量的最大值)窗口会被激活,输入最大的显示分类变量,即输出的组数不能大于窗口中输入的数值。默认数值为10。

选择完毕后,单击“Continue”按钮,确认操作并返回至“Frequencies”(频数分析)对话框。

(6)执行操作

单击“OK”按钮,执行频数分析操作,在输出窗口得到分析结果。

6.2.2 实例:成年男子血压数据的频数分析

6.2.2.1 实例数据

在一次体检中,测得100名成年男子的舒张压(mmhg)的数据如下:

65  78  68  80  77  84  75  83  79  70  81  82  75  76  73  86  73  79  72  73  86
73  87  75  71  75  92  79  82  84  82  79  77  84  71  76  80  89  83  78  70  81
69  78  75  77  71  84  82  70  78  78  71  75  87  82  73  78  77  89  75  63  64
80  77  83  72  64  78  81  72  81  72  74  69  88  93  73  73  73  71  87  71  73
75  90  69  68  91  67  66  67  79  77  72  93  86  79  76  67

计算给定数据的所有统计量的结果,并绘制频数的直方图。(数据文件:frequencies.sav)

6.2.2.2 操作步骤

step 1 建立或打开数据文件frequencies.sav。

step 2 选择菜单“Analyze”→“Descriptive Statistics”→“Frequencies”命令,打开“Frequencies”对话框,将变量“舒张压”移动至“Variable(s)”窗口内,取消对“Display Frequency Tables”项的选择。

step 3 单击“Statistics”(统计量)按钮,打开“Frequencies:Statistics”对话框,选择选项“Quartiles”、“Mean”、“Median”、“Mode”、“Sum”、“Std.deviation”、“Variance”、“Range”、“Minimum”、“Maximum”、“S.E.mean”、“Skewness”、“Kurtosis”。单击“Continue”按钮,返回至“Frequencies”对话框。

step 4 单击“Charts”按钮,进入“Frequencies:Charts”对话框,选择Histogram(s)、With normal curve。单击“Continue”按钮,返回至“Frequencies”对话框。

step 5 单击“OK”按钮,执行频数分析操作。

step 6 “Paste”得到的Syntax语句程序如下:

          /* 频数分析过程的命令语句.
          FREQUENCIES
            VARIABLES=舒张压  /FORMAT=NOTABLE
            /NTILES=  4
            /STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN MODE
            SUM SKEWNESS SESKEW KURTOSIS SEKURT
            /HISTOGRAM  NORMAL
            /ORDER=  ANALYSIS .

6.2.3 频数分析的结果

(1)频数分析的统计量

表6.1是频数分析的输出结果。从表中可以看出,100例成年男子的舒张压单变量频数分析分布的统计量,包括均值为77.03、标准均值误差为0.695、中位数为76.81、众数为63、标准差为6.955、方差为48.368、偏度为0.296、偏度的标准误差为0.241、峰度为-0.439、峰度的标准误差为0.478、极差为30、最小值为63、最大值为93、总和为7703。

四分位数分别为:25%分位数为72.10、50%分位数为76.81、75%分位数为81.59。

频数的分布形态。偏度为0.296>0,表示正偏,即曲线向左偏;峰度为-0.439<0,数值较小,曲线较平缓。

表6.1 频数分析的输出结果

a Multiple modes exist. The smallest value is shown

(2)频数分析的直方图

从如图6.6所示的直方图中可以看出,分布形态基本对称,且比较接近正态分布。

图6.6 直方图