- 1.41 MB
- 2023-01-17 11:48:40 发布
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
第四章统计图
我们往往很难从一大堆离散数据中体会到它们的含义,而用数据画出图形却能使我们用视觉器官直接感受到数据的许多内在本质。SPSS可以绘制一般的科技绘图软件所能绘制的几乎所有图形。在SPSS中,各种统计图既可由相应的统计过程产生,也可直接用“Graphs”菜单项绘制。
“Graphs”菜单项主要包括:“Gallery”:SPSS作图列表“Interactive”:交互式作图“Bar”:条形图“Line”:线图“Area”:面积图“Pie”:饼图“High-Low”:高低图“Pareto”:帕累托图“Control”:控制图
“Boxplot”:箱图“ErrorBar”:误差条图“Scatter”:散点图“Histogram”:直方图“P-P”:P-P正态概率图“Q-Q”:Q-Q正态概率图“Sequence”:序列图“ROCCurve”:ROC分类效果曲线图“TimeSeries”:自相关图、偏自相关图和互相关图。
4.1“Gallery”作图列表SPSS所能创建的图表都在这里有一个比较直观的说明。实际上该功能主要是让用户能够比较直接地了解各种图表的大致形状,可以说就是提供了一种帮助。单击Graphs-Gallery,出现帮助界面。
4.2交互式创建图表SPSS提供了交互式作图的快捷方式,能够根据数据信息,绘制初步图形,用户可以根据自己的需要,再做精细修改。通过这种方式创建的图表包括:条形图、线形图、饼图、直方图、箱图、散点图等。交互式作图功能都在Graphs-Interactive菜单中。
优点:交互式作图产生的图形比传统方式产生的图形容易修改,并且可以随时修改目标变量,而不再是传统方式只是图形本身的修改。缺点:只能作一些简单的图形,如条形图、线形图、饼图等,而对于其他一些比较复杂的图形,这种方式难以胜任。
4.2.1条形图的交互式创建条形图是利用宽度相同的条形的高度表示数值大小的统计图。基本步骤:(1)单击Graphs-Interactive-Bar菜单,在出现的窗口中主要是定义坐标轴,以及图形的形状(二维或三维)。2-DCoordinate选项定义图表的类型,即2-DCoordinate(平面二维图)、3-DEffect(立体二维图)、3-DCoordinate(三维图)。
内置变量定距变量分类变量分配变量设置直条形状误差条选项标题和脚注改善图形输出效果
“Legend”选项是指定图形的样式。Color子选项,定义方框中所选变量的颜色;Style子选项,定义方框中所选变量的风格类型;Color和Style选项都有分组(Cluster)和分段(Stack)模式可供选择;Panel子选项,定义统计图面板中统计图的分类变量。。“BarsRepresent”选项是定义Y轴变量的哪种统计结果,如果Y轴用了定距变量则会出现下拉列表用于指明所代表的指标类型。“DisplayKey”选项指是否在结果中指明Y轴所代表的汇总指标名称。
(2)单击“BarChartOptions”选项卡打开的窗口中,主要用于设置直条的形状等指标。“BarShape”子选项是定义图形的形状;“BarLabels”子选项是定义图形的标签;“Bar”子选项是图形的起始位置,按照设定的数值,大于它的直条向上,小于它的直条向下。通常采用“Automatic”模式。
(3)单击“ErrorBars”选项卡,打开的窗口主要是定义误差图的基本属性。当Y轴是定距变量并且均值作为汇总变量时,可以在条上添加误差线,在这里可以指定置信区间的大小、误差线的方向、形状和外观。“DisplayErrorBar”是否显示误差图,默认为置信度为95%的置信区间。可以更改为标准差或标准误的倍数,下方的滑块和框用于指定区间范围或倍数;“ConfidenceInterval”置信区间;“Shape”选择误差条的形状,CAP指的是误差线上面的短线的长度占直条宽度的百分数;“Direction”选择误差条的方向,在正负两个方向、只在正向、只在负向和只在外侧四个选项中选择。
(4)单击“Titles”选项卡,打开的窗口主要是定义图形的标题、脚注等。“ChartTitle”统计图的标题“ChartSubtitle”统计图的描述,即副标题“Caption”统计图的脚注(5)单击“Options”选项卡,打开的窗口主要是定义SPSS进行绘图运算的一些参数,比如改变分类轴的排序、Y轴的范围、选择喜欢的图形模板、坐标轴的长短等。
“CategoricalOrder”:定类变量的排序方式。“Variable”指定变量,“Order”指定排序标准,“Sort”指定排序的方向,“Excludeemptycategories”指定是否排除没有数据的空类。“ScaleRange”:定距变量的范围。“ChartLook”:统计图的外观,相当于图形模板,保存有图形颜色、符号的设置。“Axes”:定义三个坐标轴的长度,默认为三英寸。(6)最后,单击“确定”按钮,在输出窗口产生统计图。
应用举例:利用职工数据分析不同职称不同性别的平均基本工资的交互式条形图。分析:单击Graphs-Interactive-Bar。选择职称作为X轴变量,选择基本工资作为Y轴变量,选择性别作为颜色图例,选择平均值(Mean)为显示值,其他采用SPSS默认选项。
4.2.2点图、线图、条带图、垂线图和面积图的交互式创建这几种交互图的用途相近,做法也非常类似。1、线图:对一个或多个分类变量做汇总,但它比较强调发展变化,而不是单个数值的比较,所以常用于数据本身或数据的变化速度随着时间的变化趋势,当数据点比较多时,绘图尤其有效。2、点图:如果把各数据点连接起来就是线图,换言之,如果把线图断开就是点图。3、带图:其实就是把线变成了带子。4、垂线图:对于多重线图或点图,可以绘出其垂线图。5、面积图:将线图下方或者各曲线之间的区域用色块填充,就成了面积图。
基本步骤:(1)单击Graphs-Interactive-Dots(line、ribbon、dropline、area)菜单,出现的窗口主要是定义坐标轴,以及图形的形状(二维或三维)。所不同的是在legend框组中多了size框,可以用点/线的大小或粗细来区别不同的亚组。
(2)单击“dotsandlines”选项卡,在出现的窗口中主要是设置点图的点和连接方式。display复选框组:选择lines,则显示点之间的连线,其实就变成了线图;选择droplines,就成了垂线图,但同一分类中必须有多个点,也就是说多线图。pointlabels复选框组:选择是否显示数据个数、百分比或代表的实际值。linelabels复选框组:选择每条线的标签,可以是代表的分类,百分比或个数。interpolation框组:点的连接方式。可以是直接连接、阶梯形连接、跳跃连接和平滑连接。breaklineatmissingvalues缺失值的地方将线条中断,以反映实际情况。
(3)单击“Title”选项卡,在窗口中主要是定义图形的标题、名称等。(4)单击“Option”选项卡,在窗口中主要是定义SPSS进行绘图运算的一些参数。最后,单击“确定”按钮,在输出窗口产生统计图。
应用举例:利用汽车数据选择适当的图形表现不同产地生产的不同汽缸数的汽车其功率的差别。点图:选择dots的二维图式,功率选入x轴,y轴为count,其他为默认选项。功率选入y轴,均值为其汇总函数,汽缸数和产地分别选入x轴和style框。线图:在点图的基础上点击dotsandlines选项卡,显示线,并选择一种连接方法。或者用lines菜单,变量定义方式不变,从dotsandlines选项卡上选择显示dots和连接方式。
垂线图:方法一在线图的基础上继续编辑,选择显示droplines;方法二直接作垂线图,变量定义同线图,选择显示点和线。带图:选择ribbon,变量选择方法与线图相同。面积图:选择area,功率选入y轴,汽缸数选入x轴,产地选入color框中。不同汽缸数的车型哪个国家的多就填充哪个国家的颜色。
4.2.3直方图的交互式创建直方图是描述一组变量频数分布的图形,其纵轴一般是频数或百分比,可以显示数据分布是否对称和是否符合正态分布,可以显示数据的极端值和变异程度。基本步骤:(1)单击Graphs-Interactive-Histogram菜单,出现的窗口是定义坐标轴,以及图形的形状(二维或三维)。Y轴只能选入Count或百分比,X轴只能选入定距变量,panel框可以选入分类变量,下面的cumulativehistogram单选框用于绘出累计直方图,每个直条都是它前面直条的累积,累计频数或累计百分比(频率)。
举例为了分析学生人数在某一成绩段上、下的分布情况,还可以在分组计算的基础上计算累计频数和累计频率。如果从最小变量值向最大变量值累计,称为向上累计,反之为向下累计,如下表所示:按成绩分组(分)学生数(人)比重(%)向上累计向下累计累计频数(人)累计频率(%)累计频数(人)累计频率(%)60以下60~7070~8080~9090以上36151247.51537.53010392537407.522.5609010040373116410092.577.54010合计40100----
(2)单击“histogram”选项卡,在出现的窗口中主要用于增强直方图功能的选项。“normalcurve”要求使用该数据的均值和方差在直方图上绘出正态性曲线,但只能在二维直方图上实现。(3)“Setintervalandstartpointforthevariable”下拉列表:下拉式菜单中有x1和x2轴,与下面的intervalsize和startpoint选项相结合,确定所选轴的起始点和间隔大小。“intervalsize”:选择组段的数目和宽度;“startpoint”:设置第一组段的起始点,可定义为最小值到最小值+组距的任意值。
(4)单击“Title”选项卡,在窗口中主要是定义图形的标题、脚注等。(5)单击“Option”选项卡,在窗口中主要是定义SPSS进行绘图运算的一些参数。(6)最后,单击“确定”按钮,在输出窗口产生统计图。
应用举例:利用18名学生成绩数据分析男女生的英语成绩的交互式直方图。分析:单击Graphs-Interactive-histogram菜单,选择英语作为X轴变量,选择性别作为颜色图例,选择绘制normalcurve,其他采用SPSS默认选项。
利用汽车数据分析功率的频数分布。二维直方图:单击Graphs-Interactive-histogram菜单,选择功率作为X轴变量,选择count作为Y轴变量,选择normalcurve复选框。累计直方图:在上图的基础上,在assignvariables中选择cumulativehistogram选项。
3D效果直方图:在二维直方图的基础上,选择3D效果图式,其他不变。直方图图组:在上图的基础上,选择origin入panel框中。
4.2.4饼图的交互式创建交互式饼图可以绘制三种不同类型的图式:simple:生成简单交互式饼图clustered:生成复合交互式饼图plotted:生成散点交互式饼图简单饼图:(1)单击Graphs-Interactive-pie—simple菜单,出现的窗口是定义坐标轴,以及图形的形状(二维或三维)。在pie框中至少需要定义两个变量,上面是sliceby框,需要选入一个分类变量用于切饼,下面的slicesummary框,表示饼图的不同饼块代表的是什么指标,默认状态是count变量,也可选入定距变量,则可在最下面的slicerepresent框中选择汇总函数。Color和style单选框用于定义是用不同颜色还是填充方式来区分饼块,panel框中可以选入一个或几个分类变量,将按照他们的取值不同分别输出饼图。
(2)单击“pie”选项卡,主要用于定义饼标签和饼的位置、方向和起始点。“slicelabels”有四种选项,分类变量的值、实际值的大小、例数和百分数。(3)“location”用来改变标签的位置,饼的位置可以有direction和start起始点两种选择,方向指的是各饼块的排列顺序,有顺时针和逆时针两种。
(4)单击“Title”选项卡,在窗口中主要是定义图形的标题、脚注等。(5)单击“Option”选项卡,在窗口中主要是定义SPSS进行绘图运算的一些参数。(6)最后,单击“确定”按钮,在输出窗口产生统计图。
应用举例:利用18名学生成绩数据分析男女生的中文成绩的交互式饼图。分析:单击Graphs-Interactive-pie-simple菜单,选择性别作为切饼变量,选择中文作为汇总变量并计算平均成绩统计量,在pie中选择cateory和percent,其他采用SPSS默认选项。
利用汽车数据分析汽缸数的构成。简单饼图:单击Graphs-Interactive-pie-simple菜单,选择汽缸数作为切饼变量,选择percent作为汇总变量,在pie中选择cateory和percent,其他采用SPSS默认选项。3D饼图:在上图的基础上使用颜色来区分饼块,同时使用三维效果。分组饼图图组:将产地变量选入panel框中,其它不变。
复式饼图:复式饼图是简单饼图的堆积。(1)单击Graphs-Interactive-pie—cluster菜单,出现的窗口是定义坐标轴,以及图形的形状(二维或三维)。同简单饼图相比复式饼图只是多了一个cluster变量框,此框选入一个分类变量。在pies选项卡中添加了clusterlabels的有关显示标签选项。
利用汽车数据分析不同产地汽缸数的构成。复式饼图:单击Graphs-Interactive-pie-cluster菜单,选择汽缸数作为切饼变量,选择产地为分类变量,选择percent作为汇总变量,在pie中选择cateory和percent,其他采用SPSS默认选项。3D复式饼图:在上图的基础上使用颜色来区分饼块,同时使用三维效果。
散点饼图:散点饼图实际上包含了一系列饼图,这些饼图排列在坐标系中,就像一个个饼图构成的散点图。(1)单击Graphs-Interactive-pie—plotted菜单,出现的窗口是定义坐标轴,以及图形的形状(二维或三维)。同复合饼图相比散点饼图需要定义坐标系,可以选择二维、三维或三维效果图,定义变量时需要首先定义坐标轴变量。
利用汽车数据分析不同产地和年代不同汽缸数汽车的数量变动情况。散点饼图:单击Graphs-Interactive-pie-plotted菜单,选择年代选入x轴,选择产地为y轴,再把汽缸数选入sliceby框,选择count作为汇总变量,在pie中选择cateory和percent,其他采用SPSS默认选项。
4.2.5箱式图的交互式创建交互式箱式图有助于直观描述分布与离散状况,显示数据的中位数、分位数、离群值和极值:(1)单击Graphs-Interactive-boxplot菜单,出现的窗口是定义坐标轴,以及图形的形状(二维或三维)。同其他图形不同的是boxes选项卡。Boxesdisplay复选框组:共有outliers、extremes、medianline三个选项框,分别用于定义是否显示离群值、极值和中位数线;Whiskercaps框组:定义触须线的形状;Boxbase:如果选择了三维图形此项可用,可以设定作出的是圆柱还是方柱。Displaycountlabel:是否显示数据标签。
框图中间的的黑粗线为中位数,方框为四分位间距的范围,上下两条细线与相应的方框线之间的距离是1.5倍四分位数间距,之外的数据点称为离群值或极值,其中离方框上下界的距离超过1.5倍四分位间距为离群值,以“o”表示,超过三倍的称为极值,用“*”表示。
利用汽车数据绘制箱式图。2D分组箱式图:单击Graphs-Interactive-boxplot菜单,选择功率为y轴,选择产地为x轴,其他采用SPSS默认选项。可见欧洲的数据中有两个离群值。复式分组箱式图:将功率和汽缸数分别选入y轴和x1轴,产地选入颜色图例一栏。从中可以看出美国车的一个离群值在六缸组中,并且在该组中实际上是一个极值。3D箱式图:功率、汽缸数和产地分别选入Y轴X1轴和X2轴,触须线选择中间一种,设置箱体为圆形。
4.2.6散点图的交互式创建散点图用于发现两个或两个以上数值型变量的关系,也可以用于发现异常值。基本步骤:(1)单击Graphs-Interactive-Scatterplot菜单,出现的窗口主要是定义坐标轴,以及图形的形状(二维或三维)。“LabelCases”选项定义散点图的不同点的标签。
(2)单击“Fit”选项卡,在出现的窗口中主要是散点图的计算方法。“Method”选项用于定义散点的计算方法。SPSS提供了三种方式:回归、均值、平滑。(3)单击“Spikes”选项卡,在窗口中主要是选择连线的方式。“Spike”:是否显示散点的连线;“Colorspikesbycolorlegend”:连线采用图例的颜色是否用colorlegend变量确定;“Stylespikesbystylelegend”:连线采用图例的类型是否用stylelegend变量确定。
(4)单击“Title”选项卡,在窗口中主要是定义图形的标题、名称等。(5)单击“Option”选项卡,在窗口中主要是定义SPSS进行绘图运算的一些参数。(6)最后,单击“确定”按钮,在输出窗口产生统计图。
应用举例:利用18名学生成绩数据分析男女生的铁饼和标枪成绩的交互式散点图。分析:单击Graphs-Interactive-Scatterplot菜单,选择铁饼作为X轴变量,选择标枪作为Y轴变量,选择性别作为颜色图例,选择回归(Regression)方法拟合曲线,其他采用SPSS默认选项。
应用举例:利用汽车数据分析不同产地每百公里耗油量和功率的交互式散点图。分组拟合的均数预测线:单击Graphs-Interactive-Scatterplot菜单,选择每百公里耗油量作为X轴变量,选择功率作为Y轴变量,选择产地作为颜色图例,选择均值方法拟合曲线,fitlinefor选项选subgroup其他采用SPSS默认选项。从图中可见实际上是分三组给出了均数值及可信区间的范围。
对整个样本拟合回归线:选择每百公里耗油量作为X轴变量,选择功率作为Y轴变量,选择产地作为风格图例,选择回归方法拟合曲线,fitlinefor选项选total其他采用SPSS默认选项。从图中可见自动给出了直线回归方程和可决系数。
三维散点图:选择每百公里耗油量和加速时间作为X1和x2轴变量,选择功率作为Y轴变量,选择回归方法拟合曲线,fitlinefor选项选total其他采用SPSS默认选项。在上面图形的基础上在spike选项卡中添加到fit面的钉线。
4.3条形图4.3.1条形图的绘制步骤(1)单击Graphs-Bar菜单,打开条形图窗口。对话框的上半部分用于选择条图类型,下半部分用于定义条图中数据的类型。
Simple:简单条形图,用于表现单个指标的大小;Clustered:分组条形图,用于表现两个或多个指标,比如同时比较男、女生身高和体重;Stacked:分段条形图,用于表现每个指标各取值的构成情况。在以上三种样式中,用鼠标单击相应的图标,则选中了相应的样式。“DatainChartAre”框用于选择条图中数据的类型:Summariesforgroupsofcases按同一变量取值不同做分组汇总,条形图中每一直条代表变量的一个分类;Summariesofseparatevariables按不同变量汇总,条形图中每一直条代表一个变量,至少需要两个或两个以上变量生成相应的条形图;Valuesofindividualcases反映个体观测值,条形图中每一直条代表一个观测值。
(2)通过选择三个图标和条图中数据的类型,可以生成9中条形图,选中Simple和Summariesforgroupsofcases项时,单击“Define”按钮,将打开如下页所示窗口,该窗口用于定义图形参数。
该窗口的设置可以分为以下几步:第1步,“BarsRepresent”框用于选择条形图中的条代表的统计量:Nofcases:按照分类变量分类后各类的观测量数(频数)%ofcases:按照分类变量分类后各类的观测量数占总观测量数的比例(频率)Cum.Nofcases:累计频数Cum.%ofcases:累计百分比
Othersummaryfunction:当要绘制的统计量不在前面四项中时,选择该项。从左边的源变量框中选择分析变量进入该页下边的“Variable”框中,单击“ChangeStatistics”按钮,打开如下窗口,该窗口用于选择统计量:
在“ChangeStatistics”框中共有17个选项,各项的意义分别为:Meanofvalues:均值Medianofvalues:中位数Modeofvalues:众数Numberofcases:不含缺失值的观测量数Sumofvalues:变量值的和Standarddeviation:标准差Variance:方差Minimumvalue:最小值Maximumvalue:最大值Cumulativesum:累积变量值的和
Percentageabove:观测量中大于设定值的百分比Percentagebelow:观测量中小于设定值的百分比Percentile:百分位数Numberabove:大于设定值的观测量数Numberbelow:小于设定值的观测量数Percentageinside:变量值在设置区间内的观测量的比例,High和Low框分别用于输入设置区间的上下限Numberinside:变量值在设置区间内的观测量数
第2步,“CategoryAxis”框用于选择分类变量。绘制条形图以前会按照分类变量的值把所有观测量分组,条形图中的条的长度代表各组统计量的值。第3步,“Template”框用于选择特定的图形模板文件。该项为可选项,利用该项选定某图形模板文件后,绘制的条形图将按照模板文件的格式形成。
第4步,单击“Titles”按钮,打开如下窗口,该窗口用于输入图形的标题和脚注。
第5步,单击“Option”按钮,出现如下窗口,该窗口用于定义与缺失值有关的选项。
1.missingvalue单选框组:定义对缺失值的处理方法,只有在要汇总的变量有两个或两个以上时才可用,提供了两种处理缺失值的方法:Excludecaseslistwise:如果汇总变量中任何一个含有缺失值则排除整个纪录。Excludecasesvariablebyvariable:对哪个变量计算统计量则排除该变量有缺失值得记录。2.Displaygroupsdefinedbymissingvalues:是否把分组变量的缺失值作为一个组显示出来,只有分组变量是分类变量时才可用。3.Displaychartwithcaselabels:显示有观测值标签的图,只有主对话框中为变量指定了标签时才可用。
(3)当选择simple和Summariesofseparatevariables时,单击Define按钮,将打开如下窗口:
BarsRepresent框用于选择要绘制的变量,默认状态是对各变量求均值,单击该对话框下面的changestatistics按钮,可以改变其统计函数。BarsRepresent框中至少应选入两个以上的变量,所选的变量可以是不同变量,也可以是同一变量的不同统计函数。
(4)选中simple和Valuesofindividualcases选项,单击Define按钮,出现如下窗口:
BarsRepresent框用于选择要绘制的变量。CategoryLabels框用于选择分类轴显示的内容。其中各项分别为:Casenumber:显示观测量序号来标注观测量;Variable:指定相应的变量标注观测量。
分组条图和分段条图分组条图是指两条或两条以上小直条组成条组的条形图,各条组之间有间隙,组内小条之间无间隙。分段条图是以条形的全长代表某个变量的整体,各分段的长短代表各组成部分在整体中所占比例的统计图,每一段之间没有间隙,并用不同线条或颜色表示。与简单条图相比,这两种条图多了一个分组因素或分段因素,定义对话框中就相应多了一个变量选项框。
4.3.2条形图应用举例以18名学生成绩为例说明各种条形图:1、观测量分类模式的简单条形图选择性别为分类变量,选择条形图表示英语的均值。在Title框的第一行输入“观测量分类模式的简单条形图”;在Subtitle框中输入字符串“子标题”;在Footnote框中的第一行输入字符串“脚注”。
2、变量模式的简单条形图选择英语中文进入BarRepresent框中,并采用默认的求均值项。3、观测值模式的简单条形图选择英语变量进入BarRepresent框中,选择姓名为分类标签变量。4、观测量分类模式的分组条形图在BarRepresent框中选择英语大于60的比例,选择年级变量进入Category框,选择性别变量进入DefineClustersby框。
5、变量模式的分组条形图选择英语和中文变量进入BarRepresent框中,并采用默认的求均值项,选择分类变量年级进入CategoryAxis框中。6、观测值模式的分组条形图选择英语和中文进入BarRepresent框中,选中姓名为分类变量标签进入CategoryLabels框中。
7、观测量分类模式的分段条形图在BarRepresent框中选择求中文的均值,选择年级变量进入Category框,选择性别变量进入DefineClustersby框。8、变量模式的分段条形图在BarRepresent框中选择英语和中文,并采用系统默认求平均值选项,选择性别变量进入Category框。9、观测值模式的分段条形图在BarRepresent框中选择英语和中文,选择姓名为分类标签变量。
4.4线图线图是采用曲线的升降说明现象的变动情况。4.4.1线图绘制的步骤(1)打开数据文件,选择菜单Graphs-Line,出现绘制线图的窗口:Simple:单线图Multiple:多线图Drop-line:垂线图
用鼠标单击相应的图标,则选中了相应的样式。DatainChartAre框用于选择统计量描述模式Summariesforgroupsofcases:线图中每个数据点代表观测量的一个分类(观测量分类模式)Summariesofseparatevariables:线图中每个数据点代表一个变量(变量模式)Valuesofindividualcases:线图中每个数据点代表一个观测值(观测值模式)
通过选择三个图标和统计量的描述模式,可以生成9种线图。绘制线图的其他步骤和条形图类似,在此不再赘述。下面举例说明。4.4.2应用举例利用18名学生的成绩数据绘制各种线图。
1、观测量分类模式的单线图选择年级为分类变量,选择线图表示英语的均值。得到的线图将给出每个年级的英文平均成绩。2、变量模式的单线图选择英语和中文进入“LinesRepresent”框中,并采用默认的求均值项。得到的线图将列出所有观测量的英文和中文的平均成绩。
3、观测值模式的单线图选择变量英语进入“LinesRepresent”框中,选择姓名为分类标签变量,得到的线图将给出每个学生的英文成绩。4、观测量分类模式的多线图在“LinesRepresent”框中选择英语大于80的比例,选择年级变量进入“Category”框,选择性别变量进入“DefineClustersby”框,在结果窗口将输出各年级男女生英语成绩大于80分的百分比。
5、变量模式的多线图选择英语和中文进入“LinesRepresent”框中,并采用默认的求均值项,选中分类变量年级进入“CategoryAxis”框中,结果将给出各年级学生英文和中文的平均成绩。6、观测值模式的多线图选择英语和中文进入“LinesRepresent”框中,选中姓名为分类变量标签进入“CategoryLabels”框中,结果将列出每个学生英文和中文的成绩。
7、观测量分类模式的垂线图在“LinesRepresent”框中选择求中文的均值,选择年级变量进入“Category”框中,选择性别变量进入“DefineClustersby”框,输出结果将列出各年级男女生的英文平均成绩。
8、变量模式的垂线图在“LinesRepresent”框中选择英语和中文,并采用系统默认的求平均值选项,选择性别变量进入“Category”框,输出结果将给出男女生的中文和英文平均成绩。9、观测值模式的垂线图在“LinesRepresent”框中选择英语、标枪和中文,选择姓名为分类标签变量,输出结果将列出每个学生的中文、英文和标枪成绩。
4.5面积图面积图用线段下面的阴影表示现象的变化。4.5.1面积图绘制的步骤面积图的绘制步骤和线图、条形图相似。单击Graphs-Area项,出现窗口:
用鼠标单击相应的图标,则选中了相应的样式。Simple:简单面积图Stacked:累积面积图DatainChartAre框用于选择统计量描述模式:Summariesforgroupsofcases:每一个面积图代表观测量的一个分类Summariesofseparatevariables:每一个面积图代表一个变量Valuesofindividualcases:每一个面积图代表一个观测值
通过选择两个图标和三个统计量的描述模式,可以生成六种面积图。由于面积图和线图的操作步骤类似,在此也不再赘述,现举例说明。4.5.2应用举例应用18名学生的成绩数据绘制各种面积图。
1、观测量分类模式的简单面积图选择年级为分类变量,选择面积图表示英语的均值,得到的面积图将给出各年级英语成绩的平均值。2、变量模式的简单面积图选择英语和中文进入“AreasRepresent”框中,采用默认的求均值项,输出结果将列出所有观测量的中文和英文的平均成绩。
3、观测值模式的简单面积图选择变量英语进入“AreasRepresent”框中,选择姓名为分类标签变量,结果将给出每个学生的英文成绩。4、观测量分类模式的累积面积图在“AreasRepresent”框中选择求中文的均值,选择年级变量进入“Category”框,选择性别变量进入“DefineAreasby”框,输出结果将列出各年级男女生的中文平均成绩。
5、变量模式的累积面积图在“AreasRepresent”框中选择英语和中文,并采用求平均值选项,选择性别变量进入“Category”框,输出结果将列出男女生的中文和英文平均成绩。6、观测值模式的累积面积图在“AreasRepresent”框中选择标枪、铁饼和中文,选择姓名为分类标签变量,输出结果将列出每个学生的标枪、铁饼和中文成绩。
4.6饼图饼图采用扇面的大小表示数值的大小。4.6.1操作步骤(1)选择菜单Graphs-Pie项,将打开窗口:
上面的窗口用于选择和当前数据文件相符的数据组织方式,其中,Summariesforgroupsofcases:观测量分类模式Summariesofseparatevariable:变量模式Valuesofindividualcases:观测值模式(2)单击Define按钮,将打开设置对话框,DefineSlices项用于选择分类变量(3)提交各项设置,饼图将绘制在输出窗口中。
4.6.2应用举例利用18名学生的成绩数据绘制各种饼图。1、观测量分类模式的饼图选择年级为分类变量,选择饼图表示英语总成绩。2、变量模式的饼图选择英语和中文进入“SlicesRepresent”框中,并采用默认的求和项。3、观测值模式的饼图选择变量英语进入“SlicesRepresent”框中,选择姓名为分类标签变量。
4.7p-p图和Q-Q图正态分布在许多统计分析中起着重要的作用,这也是我们为什么常要检查数据服从正态分布的原因。p-p图和Q-Q图可用于直观表示数据分布是否符合正态分布。4.7.1p-p概率图p-p概率图是根据变量的累积概率对应于所指定的理论分布累计概率绘制的散点图,它可以直观的检测数据是否与某个概率分布的统计图形一致。如果被检验的数据符合所指定的分布,数据的点应当成对角线分布。打开数据文件,选择菜单Graphs-p-p,出现绘制p-p图的窗口:将被检测的数值型变量选入variable框中,可以依次选入多个。其他采用默认选项即可。如果数据呈正态分布,则图中数据点应和理论直线重合。去势p-p图是按照正态分布计算的理论值和实际值之差的分布情况,即分布的残差图。如果数据分布为正态分布,则数据点应较均匀的分布在y=0这条直线上下。
4.7.2Q-Q概率图Q-Q图和p-p图的原理基本一致,所不同的是它采用的是变量数据分布的分位数与所指定分布的分位数之间的曲线来进行检验。例:检测学生成绩数据库中的中文成绩是否服从正态分布。
4.8箱图箱图是一种描述数据分布情况的统计图。从箱图上可以看到数据的中位数、四分位数以及极值等。单击Graphs-Boxplot项,出现窗口:Simple:简单箱图Cluster:分组箱图
DatainChartAre框用于选择数据组织方式:Summariesforgroupsofcases:观测量分类模式Summariesofseparatevariables:变量模式通过选择两个图标和两种数据组织方式,共有四种情况。
应用举例1、简单箱图在Boxplot框中选择观测量分类模式的简单箱图,在出现的窗口中分别选择英语、年级为分析变量和分类变量,并选择编号为标签变量。
2、分组箱图在Boxplot框中选择观测量分类模式的分组箱图,在出现的窗口中分别选择英语为分析变量,年级为横轴变量,性别为分组变量。
4.9散点图散点图又称相关图。根据散点图中数据的分布走向和密集程度,可以大致判断变量之间的相关关系。单击Graphs-Scatter项,打开窗口
SimpleScatter:简单散点图,只能在图上显示一对相关变量MatrixScatter:矩阵散点图,在矩阵中显示多个相关变量OverlayScatter:重叠散点图,在图上显示多对相关变量3-DScatter:三维散点图,显示三个相关变量下面分别介绍各种散点图。
1、简单散点图单击Define按钮,打开窗口
YAxis:选择Y轴要绘制的变量XAxis:选择X轴要绘制的变量SetMarkersby:选择分组变量,SPSS根据该变量的值将观测量分成几组,每组采用不同的符号标注LabelCasesby:观测量标签变量仍以学生成绩为例,分别选择中文、英语和性别进入YAxis、XAxis、SetMarkersby框中。
2、矩阵散点图在矩阵散点图中,将图形分成多个方格,在每个方格中单独绘制某两个变量的数据。在散点图窗口中选择矩阵散点图,单击Define,在出现的窗口中,依次选择英语、中文、铁饼和标枪进入Matrix框中,选择性别进入SetMarkers框中。
3、重叠散点图在重叠散点图中,在一个坐标系中绘制多个不同的变量对。在散点图窗口中选择重叠散点图,单击Define,在出现的窗口中,选择变量中文、英语对和铁饼、标枪对进入Y-XPairs框中。
4、三维散点图三维散点图在三维坐标系中绘制三个变量的数据。在散点图窗口中选择三维散点图,单击Define,在出现的窗口中,分别选择中文、英语和标枪为Y轴变量、X轴变量、Z轴变量。
4.10直方图相比而言,在SPSS中直方图最简单。单击Graphs-Histogram项,出现窗口
Variable框用于选择要分析的变量。选中Displaynormalcurve项可绘制正态曲线,以便比较。仍以学生成绩为例,选择中文为分析变量,选中Displaynormalcurve项。
谢谢!祝同学们学习愉快、一帆风顺!