SPSS常用统计图 112页

  • 3.45 MB
  • 2023-01-18 11:43:10 发布

SPSS常用统计图

  • 112页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
统计软件与模型第7章SPSS常用统计图 一、概述二、统计图的分类三、常用统计图四、小结SPSS统计图形的绘制 统计描述:包括统计指标和统计图、表统计图的特征:(1)形象化:变抽象的文字为形象的视觉再现;(2)直观性:重点突出,对照鲜明,易于理解,便于比较;省去长篇熬述或语言限制,一目了然。一、概述 统计分析中,统计图是数据描述的重要方法之一通过点的位置、线段的升降、直条的长短或面积的大小等方法来表现或说明所研究问题的变化及其规律特点:简明生动、形象具体和通俗易懂介绍 1.建立数据文件;2.选择适当的统计图;3.生成图形;4.对图形进行编辑;步骤 EXCEL图形美观,易于操作,与Word兼容性好。但只能绘制较常用的统计图;SAS默认图形较粗糙,但通过丰富的编程语句可以绘制出相当精美的图形,甚至可以创新;Stata、S-plus、R图形精美,需要编程;SPSS图形美观,易于操作,可满足绝大多数用户需求各种常用统计软件绘图功能比较 二、统计图的分类1.统计图一览表2.条图3.线图4.面积图5.饼图6.高低图7.帕累托图8.质量控制图9.箱图10.误差条图11.散点图12.直方图13.P-P图&Q-Q图14.金字塔图15.普通序列图16.时间序列图17.ROC曲线 工具条 7.1SPSS统计图一览表(1)图形名符号适用范围条形图BarCharts描述定类或定序变量的分布,用长条的高度来表示变量不同取值下的频数。线图LineCharts描述连续性变量的变化趋势,非连续性变量通常不宜采用。面积图AreaCharts描述连续性变量的分布。用面积来表示变量在不同取值下的频数饼图PieCharts描述定类变量的分布,用圆中扇形面积大小表示不同类别变量所占的频数。高低图High-LowCharts用于同时描述股(物)价等数据长期和短期变化趋势帕累托图(ParetoCharts描述生产控制过程中各类指标对生产的影响大小。质量控制图ControlCharts质量控制的常用工具,主要用于提示生产过程中发生的变化和趋势箱图Boxplots显示变量的中位数、四分位数、极值,显示数据的实际分布。 7.1SPSS统计图一览表(2)图形名符号适用范围误差条图ErrorBarCharts显示数据的均值、标准差、置信区间等信息。散点图Scatterplots直观反映两或两个以上变量的聚会大小及相互关系直方图Histogram描述定距变量的分布。与条形图不同的是直方图不是用长条的高度来表示变量出现的频数,而是通过长条的面积来表示的。P-P图P-Pplots用来直观表示数据是否服从特定分布Q-Q图Q-Qplots用来直观表示数据是否服从特定分布普通序列图SequenceCharts描述一组或几组数据随另一序列性变量变化的趋势。时间序列图TimeSeriesCharts描述与时间相关的变量随着时间变化的趋势。 7.2条形图条图简单条图分段条图分组条图条图用于描述定类或定序变量的分布,有3种:简单条图、分组条图、分段条图。 简单条图简单条图分组条图分段条图数据描述方式: 观测量分类,对应简单条图变量分类,对应分组条图单个观测量描述 统计量选项框候选变量框长条代表的含义:○记录数○记录数百分比○累积记录数○累积记录百分比○其他统计量,默认为均值分类轴变量按所选变量在同一横轴或纵轴绘制多张条图选择绘图模板单击设置图题单击设置选项单击改变统计量 条图统计量选择框单击Continue,返回主对话框 图题主标题副标题脚注单击Continue,返回主对话框 选项对话框单击Continue,返回主对话框 简单条图 分组条图类型:选择Clustered数据描述方式:选择Summariesofseparatevariables单击Define进行定义 分组条图定义对话框候选变量框要绘制图形的变量横轴标志行或列分组变量例 分组条图例对左表(条图.sav)数据,要求:绘制分年级各班语文、数学、英语平均成绩的条图。 分组条图 分段条图类型:选择Stacked数据描述方式:选择Summariesofseparatevariables其定义方法与分组条图相同。定义完毕后单击OK。 分段条图 7.3线图SPSS的线图描述连续性变量的变化趋势,非连续性变量通常不宜采用。其定义方法与条图完全对应。三种:简单线图、复式线图垂线图。 简单线图 复式线图 垂线图 7.4面积图面积图与条图、线图操作方法完全对应,有两种:简单面积图和堆积面积图。 面积图 线图、条图和面积图都是描述变量在不同取值下的分布,饼图则是用来表示部分与整体之间的关系。例:(超市.sav)商品类别营业额食品5660生活用品2148家电12400办公用品645服饰6521其他5427.5饼图 操作 饼图 7.6高低图一种说明某些现象在单位时间内变化情况的统计图。适合描述每小时、每天、每周等时间内不断波动的市场信息资料,如股票、商品价格、货币牌价等高低图既能说明某些现象在短时间内的变化,也可说明他们长期的变化趋势。 高低图用于同时描述数据长期和短期的变化趋势。仅介绍简单高低图。7.6高低图观测量分类描述模式:只能显示最高与最低,最高与最低在一个变量中输入,分类采用二元变量。变量描述模式:以变量的值显示最高、最低与收盘价,用的最多。观测值模式:以观测值显示最高、最低与收盘价,与变量描述模式相似。 名称图形说明简单高低图Simplehigh-low-close主要用于单位证券,通常以日期作为横坐标,每条线上3点分别代表证券价格的最高价、最低价和收盘价分组高低图Clusteredhigh-low-close与简单高低图类似,但是它可以同时描述两种或两种以上证券的价格情况简单极差图Simplerangebar主要用于单位证券,用长条的长度代表每个时间段最高值与最低值之差分组极差图Clusteredrangebar与简单极差图类似,但是可以描述两个或两个以上证券的情况对比面积图Differencearea描述两个现象在同一时间内相互变化的对比关系高低图主要类型 7.7质量控制图主要用于监测生产过程中的变化趋势,从而提示生产者发现问题,并采用措施来及时纠正某些不良趋势。SPSS中质量控制图包括4类:均值-极差控制图(均值-标准差控制图)个值-移动极差控制图不合格品率和不合格品控制图缺陷数和单位缺陷数控制图我们仅以均值-极差控制图为例。 质量控制图1928年沃特·休哈特(WalterShewhart)博士率先提出。指出:每一个方法都存在着变异,都受到时间和空间的影响,即使在理想的条件下获得的一组分析结果,也会存在一定的随机误差。但当某一个结果超出了随机误差的允许范围时,运用数理统计的方法,可以判断这个结果是异常的、不足信的。 例:绘制质量控制图 质量控制图类型选择各观测样本只有一个值各观测样本是一组值缺陷数和单位缺陷数控制图不合格品率和不合格品控制图个值-移动极差控制图。当控制图每个小类的数据样本只有一个,则采用这种图形反映数据波动情况包括均值-极差控制图、均值-标准差控制图。当控制图每小类样本小于10,默认前者,否则默认后者。本例有5小类,每类2个样本,采用第一种类型控制图。 质量控制图定义定义零件质量为监测变量;定义零件号为分类变量。 均值控制图极差控制图质量控制图 均数控制图的使用方法(1)如此点在上、下警告限之间区域内,则测定过程处于控制状态,环境样品分析结果有效;(2)如果此点超出上、下警告限,但仍在上、下控制限之间的区域内,提示分析质量开始变劣,可能存在“失控",倾向,应进行初步检查,并采取相应的校正措施:(3)若此点落在上、下控制限之外,表示测定过程“失控",应立即检查原因,予以纠正。环境样品应重新测定; 帕累托图帕累托图又叫排列图、主次图按照发生频率大小顺序绘制的直方图,表示有多少结果是由已确认类型或范畴的原因所造成。可以用来分析质量问题,确定产生质量问题的主要因素。帕累托图是ABC管理法的直观表示。 类别甲地区 营业额乙地区 营业额食品56604000生活用品21481500家电1240014000办公用品645700服饰65215000其它542500例(超市.sav)1.绘制甲地区Pareto图2.绘制甲乙分段图 简单帕累托图 注意:分段Pareto图数据类型要选第2项Sumsofseparatevariables分段帕累托图 分段帕雷托图 7.8箱图箱图和误差条图都用于描述数据的分布信息。箱图主要描述数据的中位数、四分位数及极值。误差条图主要描述均值、标准差、置信区间等。箱图从视觉观察变量值的分布情况误差图从视觉角度观察样本的离散度情况。二都具体的绘制过程都与条图类似。 例:学生成绩.sav求10个班级语文成绩箱图(1)建立数据文件(2)调用SPSS过程 箱图类型选择对话框按变量类别呈现资料,可呈现多个变量按观测组呈现资料,只呈现1个变量 简单箱图分组定义对话框 简单箱图按观测量百分比呈现的四分位数及中位数简单箱图。 误差条图主要描述均值、标准差、置信区间等。其绘制过程箱图类似。误差条形图 散点图是用来表示两个或两个以上变量之间相互关系的图形。在做统计分析时,要选择恰当的统计方法,通常都离不开散点图。7.9散点图 分类介绍简单散点图:描述两个变量之间的相互关系矩阵散点图:在一张图上同时描述多个变量之间的两两关系简单点图:描述一个变量各个值的分布情况重叠散点图:将两幅简单散点图叠加到一张图上,描述多个变量之间的两两关系3D散点图:描述三个变量的相互关系 [例]:在19世纪,苏格兰物理学家JamesD.Forbes试图通过水的沸点来估计海拔高度,在阿尔卑斯山及苏格兰收集了沸点及海拔的数据如表所示。试绘制沸点与气压关系的散点图。(华氏F=9/5℃+32)序号沸点F气压(InchHg)序号沸点F气压(InchHg)1194.520.7910201.324.012194.320.7911203.625.143197.922.4012204.626.574198.422.6713209.528.495199.423.1514208.627.766199.923.3515210.629.047200.923.8916211.929.888201.123.9917212.230.069201.424.02简单散点图例 散点图数据文件(散点图.sav) 散点图定义对话框以气压为Y轴以沸点为X轴可以设置图题,此处未设选择项采取默认单击OK输出结果 散点图绘制结果 直方图主要用于描述变量的分布情况。它是SPSS中一种很常用的图形,但定义十分简单。例:(直方图.sav)电缆耐压值直方图7.10直方图(Histogram) 7.11P-P图&Q-Q图都是用来检验数据是否服从某种分布区别:P-P图比较的是真实数据和待检验分布的累计概率,而Q-Q图比较的是真实数据与待检验分布的分位点值 上列各式中,n为观察单位数,r为1~n的秩次。方法推算公式BlomRankitTukeyVanderWaerden相同数值秩估算公式 例:某金属含碳量如下:绘制P-P图,判断是否服从正态分布。 P-P图模型描述 P-P图 7.12人口金字塔图populationpyramid定义:一种表示人口性别与年龄构成的条形统计图。可反映某一地区过去和现在的人口统计趋势。在经济学中,常常出现这样一种现象,即低收入者占人口较大比例,高收入者占人口较小比例。这就是通常所说的金字塔。 人口金字塔三类:年轻型、成年型和年老型增长型:塔顶尖、塔底宽稳定型:塔顶、塔底宽度基本一致,在塔尖处才逐渐收缩。缩减型:塔顶宽,塔底窄从人口年龄结构对今后人口增长速度影响的角度,又可将人口金字塔分为增长型、稳定型和缩减型 人口金字塔图例:收入.sav 普通序列图主要用于描述一个或几个变量随着另一个变量变化的趋势。7.13普通序列图例:重庆2007年降雨量.sav绘制降雨量与月份的序列图 普通序列图设置对话框是否多个变量绘在一张图上 普通序列图 时间序列图是研究与序列相关的数据特征的图形。包括3类:Autocorrelations自相关时间序列图:用于研究同一变量的前一时间周期与后一时间周期对应观测点之间的相关关系。Cross-correlations交叉相关时间序列图:主要用于研究多个变量在对应观测点之间的相互关系。SpectralPlot光谱图:主要用于研究整个时间过程的周期性。时间序列图 例:重庆2007年降雨量.sav 自相关时间序列图对话框□自相关系数□部分自相关系数待绘图变量□自然对数转换□差分转换□季节差分转换最大滞后时间□依据模型□巴特莱特近似 自相关时间序列输出结果杨-博客斯残差平方卡方检验自相关系数标准误收尾概率,<0.05自相关显著 ROC曲线受试者工作特征曲线(receiveroperatingcharacteristiccurve,简称ROC曲线),又称为感受性曲线(sensitivitycurve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。ROC曲线是二元判决中用来比较判决方法优劣的一种曲线。它以pf做横轴,pd做纵轴所生成。其中pf表示假误判为真的概率,即虚警概率;pd表示真误判为假的概率,即漏检概率的补。 例:仪器观测准确度的比较。下表中sensor1、sensor2表示两个传感器关于真实数据在某一指标下的观测值,通过绘制ROC曲线比较两个传感器的优劣。(ROC.sav) ROC曲线 定义边界值分类:○包括分类临界值○不包括分类临界值定义检测方向:○结果越大越趋于真○结果越小越趋于真定义曲线下面积的标准误:方法:非参数、负指数双边置信水平缺失值处理:○有缺失值两变量均剔除○有缺失值剔除另变量有效ROC曲线Options对话框 7.14ROC曲线图 准则1.ROC曲线能很容易地查出任意界限值时的对疾病的识别能力。2.选择最佳的诊断界限值。ROC曲线越靠近左上角,试验的准确性就越高。最靠近左上角的ROC曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数最少。3.两种或两种以上不同诊断试验对疾病识别能力的比较。靠近左上角的ROC曲线所代表的受试者工作最准确。亦可通过分别计算各个试验的ROC曲线下的面积(AUC)进行比较,哪一种试验的AUC最大,则哪一种试验的诊断价值最佳。