- 2.27 MB
- 2023-01-16 11:41:43 发布
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
统计图形
定量变量的图形表示分类变量的图形表示
一、定量变量的图形表示1.直方图对于数值型变量,常用直方图(histogram)来展示变量取值的分布。将变量取值的范围分成若干区间,在等间隔区间的情况,每个区间的长度称为组距。考察数据落入每一区间的频数与频率,在每个区间上画一个矩形,它的宽度是组距,它的高度可以是频数、频率或密度(频率/组距),在高度是密度的情况,每一矩形的面积恰是数据落入区间的频率,这种直方图可以估计总体的概率密度。
图1密度直方图与频数直方图SAS软件会根据样本容量在样本取值范围内自动地确定一个分组方式,另外也提供了设定分组的方法。
2.盒形图盒形图(boxplot,又称箱图、箱线图、盒子图)是用更为简洁的方法表现数据在数轴上的分布及其特点的图形。左边是根据居民家庭的收入情况所绘的盒形图;右边是分地区情况所绘的盒形图。
3.散点图通常得到的数据可能有两个变量,比如家庭的收入和支出情况的数据,这里家庭总收入是一个变量,而家庭总支出是第二个变量。希望通过图形了解收入和支出的关系,这时可以用一个变量为横坐标(如家庭总收入),另一个为纵坐标(这里是家庭总支出)来作图。下面这种图称为散点图(ScatterPlot)。
4.线图线图(LinePlot)用来表示变量间的取值变化情况,有单式和复式两种。在复式线图中可用不同颜色的实线来标志区别,如右图所示。
二、分类变量的图形表示分类变量也可以通过图形直观地描绘出它们各类的数量和所占比例,常用的有条形图、饼图和马赛克图。1.条形图条形图(BarChart)给出分类变量取每个值的频数,如图所示为变量R_ID取值的条形图。
2.饼图通常,饼图(PieChart)可以对分类变量描述其频数取值的比例,对于数值变量,则像直方图那样应先计算各区间取值的频数,再按比例画出。图中给出的是家庭支出分组频数的饼图。要注意的是,如果有太多的分组,那么饼图就不那么好看了。
用SAS绘制统计图形用INSIGHT绘制统计图形用“分析家”绘制统计图形编程绘制统计图图形的调整与输出
一、用INSIGHT绘制统计图形INSIGHT模块可以画出多种统计图形,而且图形清晰、美观。1.绘制直方图选择菜单“Analyze(分析)”→“Histogram/BarChart(Y)(直方图/条形图)”,打开“Histogram/BarChart(Y)”对话框。在数据集的变量列表中,选择变量,然后单击“Y”按钮。
单击“Output(输出)”按钮,在打开的对话框中选择“Labels(标签)”选项,如图所示,以便输出的图形显示中文标签名。单击“OK”按钮返回对话框。
单击“OK”按钮,即可得到直方图如左图所示。单击图形框左下角处的三角形,在打开的菜单中选择“Values(值)”,即可在图中显示频数值,如右图所示。
2.绘制条形图INSIGHT模块对分类变量绘制条形图。首先单击R_Id变量名上边的变量作用按钮,在弹出的菜单中选择“Nominal(列名型)”,如左图所示。选择菜单“Analyze”→“Histogram/BarChart(Y)”,打开“Histogram/BarChart(Y)”对话框。在数据集的变量列表中选择变量,然后单击“Y”按钮,如右图所示。
单击“Output(输出)”按钮,在打开的对话框中选择“Labels(标签)”选项,单击“OK”按钮返回对话框。单击“OK”按钮,即可得到条形图如左图所示。如果选择Income_freq(见2.2.2节)作为分析变量,则可以得到右图所示的条形图。
3.绘制盒形图选择菜单“Analyze”→“BoxPlot/MosaicPlot(Y)”,可以对区间型变量作盒形图,对分类型变量作马赛克图。打开“BoxPlot/MosaicPlot(Y)”对话框。在数据表sryzc的变量列表中,选择income变量,然后单击“Y”按钮,income变量被选定,如图左所示。单击“Output”按钮,在打开的对话框中选择“Labels”选项,取消“YAxisVertical”如图右所示。
单击“OK”按钮,即可得到盒形图如左图所示。
在“BoxPlot/MosaicPlot(Y)”对话框中选定多个分析变量,可以将多个盒形图画在一个坐标系下,这样便于比较变量的取值情况,如图所示。图形分析:从图中可以看到支出数据在均值两边的分布近似对称,说明低于和高于平均支出的家庭几乎各占一半;收入数据的二分之一分位数在均值的左边,说明大部分人的收入低于平均收入。另外,10号家庭的收入是一个极端值,它不具有代表性。
4.绘制散点图选择菜单“Analyze”→“ScatterPlot(YX)”,打开“ScatterPlot(YX)”对话框。在变量列表中,选择Income,单击“Y”按钮,Income变量被选定为Y轴变量,选择Outgo,单击“X”按钮,Outgo变量被选定为X轴变量,如图左所示。单击“OK”按钮,即可得到散点图如右图所示。可以看出收入与支出有一定的线性相关关系。
在数据集窗口选中所有1号地区的观测号,图下是在散点图中区分两个地区的情况,细点为2号地区,粗点为1号地区。从该图可以看出1号地区比2号地区在收入和支出水平上都要高出许多。
若在“LinePlot(YX)”对话框中,将ID变量选定为X轴,选择Income变量和Outgo变量,单击“Y”按钮。单击“Output(输出)”按钮,在打开的对话框中选择“Labels(标签)”选项,如图左所示,以便输出的图形显示中文标签名。两次单击“OK”按钮,得到关于Income变量和Outgo变量的复式线图(图右)。
二、用“分析家”绘制统计图形1.绘制饼图在“分析家”中打开数据集mylib.sryzc。选择主菜单“Graphs”→“PieChart”,打开“PieChart”对话框,选择变量列表中的Income,单击“Chart”按钮,选定分析变量,如图左所示。所得饼图如图右所示。
2.绘制条形图选择主菜单“Graphs”→“BarChart”→“Horizontal”,打开“HorizontalBarChart”对话框,选择变量列表中的INCOME,单击“Chart”按钮,选定分析变量,选择R_ID变量,单击“StackBy”按钮,再选中3-D选项,如图左所示。单击“OK”按钮,得到水平条形图,如图右所示。
Thankyou!