- 363.00 KB
- 2023-01-16 11:33:01 发布
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
第十一章绘制统计图
统计图是用点的位置、线段的升降、直条的长短或面积的大小等来表达资料的内容。它可以把资料所反映的变化趋势、数量多少、分布状态和相互关系等形象直观地表现出来,以便于读者的阅读、比较和分析。本章将介绍SPSS在绘制常用统计图方面的功能。由于计算机绘图具有快速、清晰、规范、可修正以保证准确无误等特点,故在论文、报告等写作中有着十分重要的应用价值。
条图散点图线图直方图饼图面积图箱式图正态Q-Q图正态P-P图质量控制图Pareto图自回归曲线图高低图交互相关图序列图频谱图误差线图
朴素的美削尖脑袋的模样墙上长满了爬山虎太阳照在红墙内外反客为主的蓝飘带我没有放倒!
直条图主要功能调用Graphs菜单的Bar过程,可绘制直条图。直条图用直条的长短来表示非连续性资料(该资料可以是绝对数,也可以是相对数)的数量大小。
研究血压状态与冠心病各临床型发生情况的关系,分析资料如下所示,试绘制统计图。血压状态年龄标化发生率(1/10万)冠状动脉机能不全猝死心绞痛心肌梗塞正常临界异常8.9010.6319.8412.0018.0530.5534.7146.1873.0644.0067.24116.82
,定义变量名:年龄标化发生率为RATE,冠心病临床型为DISEASE,血压状态为BP。RATE按原数据输入,DISEASE按冠状动脉机能不全=1、猝死=2、心绞痛=3、心肌梗塞=4输入,BP按正常=1、临界=2、异常=3输入。
选Graphs菜单的Bar...过程,弹出BarChart定义选项框。在定义选项框的下方有一数据类型栏,系统提供3种数据类型:Summariesforgroupsofcases:以组为单位体现数据;Summariesofseparatevariables:以变量为单位体现数据;Valuesofindividualcases:以观察样例为单位体现数据。大多数情形下,统计图都是以组为单位的形式来体现数据的。在定义选项框的上方有3种直条图可选:Simple为单一直条图、Clustered为复式直条图、Stacked为堆积式直条图,本例选复式直条图。点击Define钮,弹出DefineClusteredBar:SummariesforGroupsofCases对话框,在左侧的变量列表中选rate点击钮使之进入BarsRepresent栏的Othersnmmaryfunction选项的Variable框,选disease点击钮使之进入CategoryAxis框,选bp点击钮使之进入DefineClustersby框。
点击Titles...钮,弹出Titles对话框,在Title栏内输入“血压状态与冠心病各临床型年龄标化发生率的关系”,点击Continue钮返回DefineClusteredChart:SummariesforGroupsofCases对话框,再点击OK钮即完成。系统在统计图编辑窗口中输出直条图。由于在原始数据库中,为了输入的方便,分组采用简单的1、2、3……等数字表示,故体现在统计图中的分组条目会让读者感到不理解。为此,用户可点击窗口上端工具栏中的Edit钮,对统计图进行编辑。用户欲在图中的哪一部位(如:标题、纵横轴的尺度与标目、统计图的色彩或花纹,等等)进行编辑,只须将鼠标箭头指向这一部位并双击鼠标左键,系统即弹出相应的编辑对话框。编辑过程简便易行,用户不妨一试。本章对此内容的介绍从略。
线图调用Graphs菜单的Line过程,可绘制线图。线图是用线条的上下波动形式,反映连续性的相对数资料的变化趋势。非连续性的资料一般不用线图表现。
某地调查居民心理问题的存在现状,资料如下表所示,试绘制线图比较不同性别和年龄组的居民心理问题检出情况。年龄分组心理问题检出率(%)男性女性15-25-35-45-55-65-75-10.5711.579.5711.7113.5115.0216.0019.7311.9815.5013.8512.9116.7721.04
定义变量名:心理问题检出率为RATE,年龄分组为AGE,性别为SEX,AGE与SEX可定义为字符变量。RATE按原数据输入,AGE按分组情况分别输入15-、25-、35-、45-、55-、65-、75-,SEX是男的输入M、女的输入F。
选Graphs菜单的Line...过程,弹出LineChart定义选项框,有3种线图可选:Simple为单一线图、Multiple为多条线图、Drop-line为落点线图,本例选多条线图。点击Define钮,弹出DefineMultipleLine:SummariesforGroupsofCases对话框,在左侧的变量列表中选rate点击钮使之进入LinesRepresent栏的Othersnmmaryfunction选项的Variable框,选age点击钮使之进入CategoryAxis框,选sex点击钮使之进入DefineLinesby框。点击Titles...钮,弹出Titles对话框,在Title栏内输入“某地男女性年龄别心理问题检出率比较”,点击Continue钮返回DefineMultipleLine:SummariesforGroupsofCases对话框,再点击OK钮即完成。
区域图调用Graphs菜单的Area过程,可绘制区域图。实际上区域图是用面积来表现连续性的频数分布资料,面积越大,频数越多,反之亦然。
在某城市抽样研究20-49岁已婚育龄妇女的避孕现状,频数分布资料参见下表,试绘制区域图。年龄分组避孕现状有无20-25-30-35-40-45-639391860127711419876818427391173399
定义变量名:避孕有无的人数为NUMBER,年龄分组为AGE,避孕现状为CONTRA,AGE与CONTRA可定义为字符变量。NUMBER按实际人数输入(有无避孕的人数全部输入变量NUMBER中),AGE按分组情况分别输入20-、25-、30-、35-、40-、45-,CONTRA有的输入Y、无的输入N。
选Graphs菜单的Area...过程,弹出AreaChart定义选项框,有2种线图可选:Simple为简单区域图、Stacked为堆积区域图,本例选堆积区域图。点击Define钮,弹出DefineStackedArea:SummariesforGroupsofCases对话框,在左侧的变量列表中选number点击钮使之进入AreasRepresent栏的Othersnmmaryfunction选项的Variable框,选age点击钮使之进入CategoryAxis框,选contra点击钮使之进入DefineAreasby框。
点击Titles...钮,弹出Titles对话框,在Title栏内输入“某市已婚育龄妇女避孕状况分析”,点击Continue钮返回DefineStackedArea:SummariesforGroupsofCases对话框,再点击OK钮即完成。
构成图调用Graphs菜单的Pie过程,可绘制构成图。构成图也称馅饼图,用一个圆来表现百分构成,读者可根据圆中各个扇形面积的大小,判断某一部分在全部中所占比例的多少。
某年某医院用中草药治疗182例慢性支气管炎患者,其疗效如下所示,试绘制构成图。疗效病例数百分构成(%)控制显效好转无效3771601420.339.033.07.7合计182100.0
定义变量名:百分构成资料为DATA,构成部分的名称为TEXT,TEXT定义为字符变量。DATA按实际百分数输入,TEXT依次输入1、2、3、4。
选Graphs菜单的Pie...过程,弹出PieChart定义选项框,构成图仅有一种,故直接点击Define钮,弹出DefinePie:SummariesforGroupsofCases对话框,在左侧的变量列表中选data点击钮使之进入SlicesRepresent栏的Othersnmmaryfunction选项的Variable框,选text点击钮使之进入DefineSlicesby框。点击Titles...钮,弹出Titles对话框,在Title栏内输入“中草药治疗慢性支气管炎效果构成图”,点击Continue钮返回DefinePie:SummariesforGroupsofCases对话框,再点击OK钮即完成。
高低区域图调用Graphs菜单的High-Low过程,可绘制高低区域图。高低区域图用于表现多种形式的数据区域,如一组测定值的范围(最小值—最大值)、95%可信区间值(低限—高限)、±1.96·SD(低值—均值—高值)等,形象直观。
为了解水体污染情况,某市测定三种水源中放射性元素锶(90Sr)的含量(10-2Bq·L-1),资料如下,试绘制高低区域图。水源点范围均值自来水湖水水库水0.65~0.931.31~2.111.01~2.160.791.711.58
定义变量名:数据的变量名为DATA,将范围的低值与高值以及均值一并输入;设一变量为CAT,用于定义低值、高值和均值,低值为1、高值为2、均值为3;水源点变量名为GROUP,依次输入1、2、3。
选Graphs菜单的High-Low...过程,弹出High-LowChart定义选项框,高低区域图有5种,即:SimpleHigh-Low-Close:简单线型高低区域图;ClusteredHigh-Low-Close:复式线型高低区域图;SimpleRangeBar:简单直条型高低区域图;ClusteredRangeBar:复式直条型高低区域图;DifferenceLine:差异线区域图。本例选用简单线型高低区域图。然后点击Define钮,弹出DefineSimpleHigh-Low-Close:SummariesforGroupsofCases对话框,在左侧的变量列表中选data点击钮使之进入BarsRepresent栏的Othersnmmaryfunction选项的Variable框,选cat点击钮使之进入CategoryAxis框,选group点击钮使之进入DefineHigh-Low-Closeby框。点击Titles...钮,弹出Titles对话框,在Title栏内输入“某市测定不同水体放射性元素锶的含量比较”,点击Continue钮返回DefineSimpleHigh-Low-Close:SummariesforGroupsofCases对话框,再点击OK钮即完成。
直条构成线图调用Graphs菜单的Pareto过程,可绘制直条构成线图(又称佩尔托图)。直条构成线图是直条图与构成图的结合,它用直条的长短表现各组绝对数的多少,同时用线段的逐渐上升趋势表现各组百分构成比接近100.00%的过程。
随访1000名20-25岁的男性一年,分季节考察其感冒发生情况,结果如下,试绘制直条构成线图。季节病例数百分构成(%)春夏秋冬44310437918739.809.3534.0516.80合计1113100.00
定义变量名:各季节病例数的变量名为DATA,输入具体数字;季节的变量名为SEASON,依次输入1、2、3、4。百分构成不必建立变量,也不必输入数据,系统会自动生成。
选Graphs菜单的Pareto...过程,弹出ParetoChart定义选项框,有2种直条构成线图可选:Simple为单一直条构成线图,Stacked为堆积式直条构成线图,本例选用单一直条构成线图。然后点击Define钮,弹出DefineSimplePareto:SummariesforGroupsofCases对话框,在左侧的变量列表中选data点击钮使之进入Sumsofvariable框,选season点击钮使之进入CategoryAxis框。点击Titles...钮,弹出Titles对话框,在Title栏内输入“1000名20-25岁男性各季节感冒发生人数分析”,点击Continue钮返回DefineSimplePareto:SummariesforGroupsofCases对话框,再点击OK钮即完成。
质量控制图调用Graphs菜单的Control过程,可绘制质量控制图。质量控制图是进行质量控制的常用工具,可提示工作过程中所发生的变化及其趋势,从而提醒人们的警觉与注意,以便分析原因、采取解决对策。
对一种标准试液中某物质含量测平行样5次,结果如下,试绘制质量控制图以便对准确度与精确度进行评价。测定次序平行样均数极差第一次第二次1234510.410.89.89.410.110.111.010.411.011.310.2510.9010.1010.2010.700.30.20.61.61.2
定义变量名:平行样数据的变量名为DATA,将测定数据一并输入;设一变量为GROUP,用于定义测定次序,依次输入1、2、3、4、5。均数和极差的数据不必输入,系统会自动生成。
选Graphs菜单的Control...过程,弹出ControlChart定义选项框,有5种质量控制图可选:X-Bar,R,s:均数控制图和极差(标准差)控制图。均数控制图又称图,用于控制重复测定的准确度;极差控制图又称R图,用于控制例数较少时重复测定的精确度;标准差控制图又称s图,用于控制例数较多时重复测定的精确度。Individuals,MovingRange:个值控制图。根据容许区间的原理绘制,适用于单个测定值的控制。p,np:率的控制图。根据率的二项分布原理绘制,适用于率的控制。c,u:数量控制图。根据组中非一致测定值绘制,各组例数相等时用u图,不相等时用c图,适用于属性资料的质量控制。
本例选用X-Bar,R,s。选项框的下方为数据类型选择栏(DataOrganization),Casesareunits表示数据文件中各观察样例只是一个值,其分组需要再定义;Casesaresubgroups表示数据文件中各观察样例本身就是一个组。点击Define钮,弹出X-Bar,R,s:CasesAreUnits对话框,在左侧的变量列表中选data点击钮使之进入ProcessMeasurement框,选group点击钮使之进入SubgroupsDefinedby框。因本例样品少,故在Charts栏中选X-Barandrange项,要求输出均数控制图和极差控制图。点击Titles...钮,弹出Titles对话框,在Title栏内输入“样品测定的质量控制图”,点击Continue钮返回X-Bar,R,s:CasesAreUnits对话框,再点击OK钮即完成。
箱图调用Graphs菜单的Boxplot过程,可绘制箱图。箱图可用于表现观测数据的中位数、四分位数和两头极端值。
研究甲基汞对肝脏脂质过氧化的毒性作用,选用25只大白鼠,随机分成五组,按不同剂量染毒一段时期后测定肝脏LPO含量(nmol/L),资料如下表,试绘制箱图。编号染毒剂量(mg/kg体重)5.010.020.030.040.012345184.30268.20222.64127.52291.50391.50487.25345.69574.12526.781025.401289.241463.551168.471356.701897.211705.331532.462015.462100.401821.332897.532001.402748.974539.75
定义变量名:所测定肝脏LPO含量数据的变量名为DATA,输入原始数据;再设一变量为GROUP,用于定义不同染毒剂量组,依次输入1、2、3、4、5。选Graphs菜单的Boxplot...过程,弹出BoxplotChart定义选项框,有2种箱图可选:Simple为简单箱图,Clustered为复式箱图,本例选用简单箱图。然后点击Define钮,弹出DefineSimpleBoxplot:SummariesforGroupsofCases对话框,在左侧的变量列表中选data点击钮使之进入Variable框,选group点击钮使之进入CategoryAxis框。点击OK钮即完成。
均值相关区间图调用Graphs菜单的ErrorBar过程,可绘制均值相关区间图。正态分布资料的描述性指标:如均值、标准差、标准误,并由此求得的参照值范围、总体均值的可信区间等,都可用均值相关区间图来表现。
食品中微量砷(As)主要采用两种方法测定,一是新银盐法,另一是DDC-Ag法。今比较两种方法测定不同浓度As标准液(μg/5ml)的光密度值可信区间,试绘制均值相关区间图。编号新银盐法DDC-Ag法1.02.03.04.05.01.02.03.04.05.0123450.1500.1300.1400.1800.1900.3300.4100.2500.3800.3500.4900.5100.5700.5300.5500.6900.6200.7300.7800.8100.9900.8100.8600.9400.9500.0210.0330.0380.0410.0290.0650.0590.0480.0690.0570.0870.0890.0920.0730.0810.1120.1090.1190.1340.1270.1690.1480.1340.1750.162
定义变量名:数据的变量名为DATA,将新银盐法和DDC-Ag法的测定所得光密度值一并输入;然后设一变量为GROUP,用于定义不同标准液浓度组,依次输入1、2、3、4、5;再设一变量为CATE,用于定义不同方法组,依次输入1、2。
选Graphs菜单的ErrorBar...过程,弹出ErrorBar定义选项框,均值相关区间图有2种,Simple为简单均值相关区间图,Clustered为复式均值相关区间图,本例选用复式均值相关区间图。然后点击Define钮,弹出DefineClusteredErrorBar:SummariesforGroupsofCases对话框,在左侧的变量列表中选data点击钮使之进入Variable框,选group点击钮使之进入CategoryAxis框,选cate点击钮使之进入DefineClustersby框。在BarRepresent栏中有一下拉菜单,系统提供3种图形表现方式让用户选择:Confidenceintervalformean:绘出总体均值的可信区间,要求输入区间的百分数;Standarderrorofmean:绘出均值+/-两倍标准误的区间;Standarddeviation:绘出均值+/-两倍标准差的区间。本例选用Confidenceintervalformean。之后点击Titles...钮,弹出Titles对话框,在Title栏内输入“两种方法测定微量砷的光密度95%可信区间比较”,点击Continue钮返回DefineClusteredErrorBar:SummariesforGroupsofCases对话框,再点击OK钮即完成。
散点图调用Graphs菜单的Scatter过程,可绘制散点图。散点图用于表现测量数据的原始分布状况,读者可从点的位置判断测量值的高低、大小、变动趋势或变化范围。
研究饮茶对人体血清微量元素(μmol/L)的影响作用,结果如下,试绘制散点图。编号多喝茶组少喝茶组不喝茶组ZnFeMnZnFeMnZnFeMn12315.8716.2716.7736.8735.9037.450.290.280.2413.2512.9813.6432.4032.6533.040.210.220.1911.4010.8911.0529.8730.1430.700.120.140.11
定义变量名:数据的变量名为DATA,将各组各微量元素的测定值一并输入;设一变量为CATE1,用于定义喝茶状况组,多喝茶组为1、少喝茶组为2、不喝茶组为3;再设一变量为CATE2,用于定义微量元素种类,Zn为1、Fe为2、Mn为3。
选Graphs菜单的Scatter...过程,弹出Scatterplot定义选项框,散点图有4种,Simple为单层散点图,Overlay为多层散点图,Matrix为矩阵散点图,3-D为立体散点图,本例选用单层散点图。然后点击Define钮,弹出SimpleScatterplot对话框,在左侧的变量列表中选data点击钮使之进入YAxis框,选cate1点击钮使之进入XAxis框(指定饮茶状况为横轴标目),选cate2点击钮使之进入SetMarkersby框(指定微量元素种类为散点标志)。点击Titles...钮,弹出Titles对话框,在Title栏内输入“饮茶与人体血清微量元素的关系”,点击Continue钮返回SimpleScatterplot对话框,再点击OK钮即完成。
直方图调用Graphs菜单的Histogram过程,可绘制直方图。直方图是用直条的长短来表示连续性的绝对数(或称频数)资料的多少,其意义与本章第三节介绍的区域图相似,但区域图能进行多组资料的比较(如堆积式区域图),而直方图不能。
现有某地某年流行性乙型脑炎患者的年龄分布资料如下表,试绘制直方图。年龄分组患者人数每岁患者人数0-1-2-3-4-5-6-7-8-9-10-1415-1920-2425-2930-3435-4445-5455-64303075787749715956671437716101273130.030.075.078.077.049.071.059.056.067.028.615.43.22.02.40.70.30.1
定义变量名:频数资料的变量名为NUMBER,将每岁患者人数资料输入;设一变量为GROUP,用于定义年龄组,将各年龄分组的下限值输入。为使频数资料在作图中生效,应选Data菜单的WeightCases...命令项,在弹出的WeightCases对话框中取Weightcasesby项,并选变量NUMBER点击钮使之进入FrequencyVariable框,点击OK钮即可。
选Graphs菜单的Histogram...过程,因直方图只有一种类型,故直接弹出Histogram对话框,在左侧的变量列表中选group点击钮使之进入Variable框;点击Titles...钮,弹出Titles对话框,在Title栏内输入“某地某年流行性乙型脑炎患者年龄分布”,点击Continue钮返回Histogram对话框,再点击OK钮即完成。
系统在ChartCarousel窗口输出直方图。由于本例资料的分组情形比较细(即每岁一组),而系统只按默认的每5岁一组方式输出图形,所以需要安用户的要求对统计图进行编辑。点击ChartCarousel窗口上端工具栏中的Edit钮,弹出!Chart1窗口,将鼠标箭头指向图的横轴并双击鼠标左键,弹出IntervalAxis对话框,在AxisTitle处将“GROUP”改为中文“年龄分组”;在Intervals栏选择Custom项,点击Define...钮,弹出IntervalAxis:DefineCustomInterval对话框,在Definition栏的Intervalwidth处输入1,要求按每岁一组的方式作图;在Range栏的Minimum处输入0,在Maximum处输入65,要求横轴从0岁开始至65岁止。点击Continue钮返回IntervalAxis对话框,再点击OK钮即可。
正态概率分布图调用Graphs菜单的NormalP-P过程,可绘制正态概率分布图。如果变量值是正态分布的,则所绘制的正态概率分布图将呈现一条从纵轴零点指定右上角的直线。
某医师测得30名健康女大学生血清总蛋白含量(g/L)资料如下,试绘制正态概率分布图。74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.973.578.874.375.865.074.371.269.768.0
数据的变量名为DATA,将原始测定值输入。选Graphs菜单的NormalP-P...过程,弹出NormalP-PPlot对话框,在左侧的变量列表中选data点击钮使之进入Variable框。在Transform栏中,系统有4种数据转换形式供用户选择:NaturalLogtransform:作自然对数的转换;Standardizevalues:作标准化值(即Z值)的转换;Difference:使用系列值与n个相近观察值的差别值替代原始值;Seasonallydifference:使用系列值与n个时期值的差别值替代原始值。
本例不作数据转换。点击Expected...钮弹出NormalP-PPlot:Expected对话框,系统询问用户采用什么方法计算预期正态概率值,共4种方法:Blom:使用公式推算;Tukey:使用公式推算;Rankit:使用公式推算;VanderWaerden:使用公式推算。上列各式中,n为观察单位数,r为1~n的秩次。本例选Blom方法。点击Continue钮返回NormalP-PPlot对话框,再点击OK钮完成操作。
正态概率单位分布图调用Graphs菜单的NormalQ-Q过程,可绘制正态概率单位分布图。绘制正态概率单位分布图的意义与本章第十二节介绍的正态概率分布图一样,只是其纵轴采用概率单位而不是采用概率。
某医师研究不同布氏菌苗免疫后布氏菌素皮肤反应情况,资料如下,试绘制正态概率单位分布图。A组菌苗皮肤浸润直径(mm)20.024.025.023.022.020.517.519.025.023.024.024.016.521.015.011.520.515.522.525.5B组菌苗皮肤浸润直径(mm)20.020.022.020.015.518.516.515.518.016.515.520.014.013.513.512.516.514.513.020.520.525.010.020.022.518.0
A组菌苗皮肤浸润直径的数据变量名为X1,将原始测定值输入;B组菌苗皮肤浸润直径的数据变量名为X2,也将原始测定值输入。选Graphs菜单的NormalQ-Q...过程,弹出NormalQ-QPlot对话框,在左侧的变量列表中选data点击钮使之进入Variable框;不作数据转换;选择Blom方法推算预期正态概率单位值;点击OK钮完成操作。
时间序列图调用Graphs菜单的TimeSeries过程,可绘制时间序列图。时间序列是指按时间顺序排列的随机变量的一组实测值。分析时间序列图,可以从运动的角度认识事物的本质,如几个时间序列之间的差别、一个较长时间序列的周期性,或对未来的情况进行预测。
时间第一周第二周第三周第四周第1天第2天第3天第4天第5天3.74.011.57.53.83.06.612.75.92.04.44.910.85.64.13.24.810.95.86.0连续4周(每周5个工作日)测定某无菌操作室空气中的细菌含量(×103/M3),资料如下,试绘制时间序列图,看是否存在周期性变动趋势。
定义变量名为DATA,然后按时间顺序从第一周第1天起将观察数据依次输入。在Graphs菜单的TimeSeries项中,含两个过程:Autocorrelations:自相关时间序列图,自相关指相关值来自一组时间序列中前一时间序列与其后序列的对应各观测值的相关;Cross-correlations:交叉相关时间序列图,交互相关指相关值来自某一时间序列变量与相邻另一个或一些时间序列变量的对应各观测值的相关。本例只有一个随机变量,故选用Autocorrelations过程。在弹出的Autocorrelations对话框中,选左侧变量列表中的data点击钮使之进入Variable框。在Display栏选Autocorrelations项,要求仅绘制自动相关的时间序列图。点击Options...钮,弹出Autocorrelations:Options对话框,在MaximumNumberofLags处输入5,表示时间序列阶段为每5天一个周期,点击Continue钮返回Autocorrelations对话框,再点击OK钮即完成。
SPSS与问卷分析刘文平
提纲编码与数据录入编码注意变量类型与尺度数据录入统计分析统计制图
编码与录入单选题例1当前贵组织机构是否设有面向组织的职业生涯规划系统?A有B正在开创C没有D曾经有过但已中断编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D四个选项。录入:录入选项对应值,如选C则录入3
编码与录入(续)多项选择题(选项数固定和不固定)例2贵处的职业生涯规划系统工作涵盖哪些组群?画钩时请把所有提示考虑在内。A月薪员工B日薪员工C钟点工编码:把每一个相应选项定义为一个变量,每一个变量Value值均如下定义:“0”未选,“1”选。录入:被调查者选了的选项录入1、没选录入0,如选择被调查者选AC,则三个变量分别录入为1、0、1。
编码与录入(续)多项选择题例3你认为开展保持党员先进性教育活动的最重要的目标是哪三项:1( )2()3( )A、提高党员素质B、加强基层组织C、坚持发扬民主D、激发创业热情E、服务人民群众F、促进各项工作编码:定义三个变量分别代表题目中的1、2、3三个括号,三个变量Value值均同样的以对应的选项定义,即:“1”A,“2”B,“3”C,“4”D,“5”E,“6”F录入:录入的数值1、2、3、4、5、6分别代表选项ABCDEF,相应录入到每个括号对应的变量下。如被调查者三个括号分别选ACF,则在三个变量下分别录入1、3、6。
编码与录入(续)排序题例4您购买商品时在 ①品牌②流行③质量④实用⑤价格 中对它们的关注程度先后顺序是(请填代号重新排列)第一位 第二位 第三位 第四位 第五位 编码:定义五个变量,分别可以代表第一位第五位,每个变量的Value都做如下定义:“1”品牌,“2”流行,“3”质量,“4”实用,“5”价格录入:录入的数字1、2、3、4、5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3“。
编码与录入(续)选择排序题例5你认为开展保持党员先进性教育活动的最重要的目标是哪三项,按从高到低顺序排列。A、提高党员素质B、加强基层组织C、坚持发扬民主D、激发创业热情E、服务人民群众F、促进各项工作编码:以ABCDEF6个选项分别对应定义6个变量,每个变量的Value都做同样的如下定义:“1”未选,“2”排第一,“3”排第二,“4”排第三。录入:以变量的Value值录入。比如三个括号里分别选的是ECF,则该题的6个变量的值应该分别录入:1(代表A选项未选)、1、3(代表C选项排在第二)、1、2、4。
关于选择排序题的注该方法是对多选题和排序题相结合的一种方法,对一般排序题(例4)也同样适用,只是两者用的分析方法不同(例4用频数分析、例5用描述分析),输出结果从不同的侧面反映问题的重要性(前一种方法从位次看排序,后一种方法从变量的频数看排序)。
编码与录入(续)开放性数值题和量表题这类题目要求被调查者自己填入数值,或者打分例6你的年龄(实岁):______编码:一个变量,不定义Value值录入:即录入被调查者实际填入的数值。
编码与录入(续)开放性文字题如果可能的话可以按照含义相似的答案进行编码,转换成为封闭式选项进行分析。如果答案内容较为丰富、不容易归类的,应对这类问题直接做定性分析。
统计分析频数分析:Frequencies过程可以做单变量的频数分布表;显示数据文件中由用户指定的变量的特定值发生的频数;获得某些描述统计量和描述数值范围的统计量。 适用范围:单选题(例1),排序题(例4),多选题的方法二(例3) 频数分析也是问卷分析中最常用的方法。 实现:Descriptivestatistics……Frequencies
统计分析(续)描述分析:Descriptives过程可以计算单变量的描述统计量。这些述统计量有平均值、算术和、标准差,最大值、最小值、方差、范围和平均数标准误等。 适用范围:选择并排序题(例5)、开放性数值题(例6)。 实现:Descriptivestatistics……Descriptives,需要的统计量点击按钮Statistics…中选择.
统计分析(续)多重反应下的频次分析适用范围:多选题的二分法(例2) 实现:第一步在MultipleResponse……DefineSets把一道多选问题中定义了的所有变量集合在一起,给新的集合变量取名,在DichotomiesCountedvalue中输入1。第二步在MultipleResponse……Frequencies中做频数分析。
统计分析(续)交叉频数分析:Crosstabs过程解决对多变量的各水平组合的频数分析的问题 适用范围:,适用于由两个或两个以上变量进行交叉分类形成的列联表,对变量之间的关联性进行分析。比如要知道不同工作性质的人上班使用交通工具的情况,可以通过交叉分析得到一个二维频数表,则一目了然。 实现:第一步根据分析的目的来确定交叉分析的选项,确定控制变量和解释变量(如上例中不同工作性质的人是控制变量,使用交通工具是解释变量)。第二步选择Descriptivestatistics……Crosstabs.
统计分析(续)均值的比较与检验Means过程对指定变量综合描述分析,分组计算计算均值再比较。比如可以按性别变量分为男和女来研究二者收入是否存在差距。T检验独立样本t检验用于不相关的样本是否开来自具有相同均值的总体的检验。比如,研究购买该产品的顾客和不购买的顾客的收入是否有明显差异。如果样本不独立则要用配对t检验。比如研究参加职业培训后工作效率是否提高。
统计分析(续)聚类分析相关分析回归分析
统计制图饼图(piechart)直方图(histogram)条形图(barchart)曲线图(curve)面积图(area)