- 455.00 KB
- 2023-01-18 11:38:25 发布
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
考纲解读1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
考向预测1.本节是用样本估计总体,是统计学的基础.以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解.2.本节在高考题中主要是以选择题和填空题为主,属于中低档题目.3.常以频率分布直方图为工具结合现实生活出一道应用大题,属于中档题目.
知识梳理1.茎叶图的优点当样本数据较少时,茎叶图表示数据的效果较好,一是统计图上没有原始数据的损失,二是方便记录与表示,但茎叶图只便于表示两位有效数字的数据.
2.众数、中位数、平均数(1)在一组数据中,出现次数较多的数据叫做这组数据的众数.(2)将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.(3)如果有n个数x,x,……,x,那么=12n叫做这n个数的平均数.
3.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s=.(3)方差:s2=.(x是样本数据,n是样本容量,是样本平均数.)n
4.在频率分布直方图中,纵轴表示频率与组距的比值,数据落在各小组内的频率用小长方形的面积表示,所有长方形面积之和等于1.5.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.
6.频率折线图和总体密度曲线(1)频率折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.(2)总体密度曲线:随着样本量的增大,作图时所划分的区间数增多,每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线,即总体密度曲线.
基础自测1.(2010·福建文)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()
A.91.5和91.5B.91.5和92C.91和91.5D.92和92[答案]A
2.(2009·山东理8)某工厂对一批产品进行了抽样检测,右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品个数是()A.90B.75C.60D.45[答案]A
3.如图,是2010年中央电视台举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.84,4.84B.84,1.6C.85,1.6D.85,4[答案]C
4.(2011·福建师大附中)如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是()A.161cmB.162cmC.163cmD.164cm
[答案]B[解析]通过茎叶图可知这10位同学的身高是155cm,155cm,157cm,158cm,161cm,163cm,163cm,165cm,171cm,172cm.这10个数据的中位数是将这些数据从小到大(或从大到小)排列后中间两个数据的平均数,即为161cm和163cm这两个数据的平均数,所以应选B.
5.(2010·江苏卷)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如右图所示,则在抽样的100根中,有________根棉花纤维的长度小于20mm.
[答案]30[解析]本题主要考查频率分布直方图的应用,从而考查考生的识图与用图能力,同时也考查了考生的数据处理能力和分析解决问题的能力.由题意知,棉花纤维的长度小于20mm的频率为(0.01+0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长度小于20mm的有0.3×100=30(根).
6.从某自动包装机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g):492496494495498497501502504496497503506508507492496500501499根据用频率分布估计总体分布的原理,该自动包装机包装的袋装食盐质量在497.5g~501.5g之间的概率约为________.[答案]0.25
7.为了了解高一女生的体能情况,我校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为128743,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?(2)若次数在120以上(含120次)为优秀,试估计该学校全体高一学生的优秀率是多少?
[例1]对某电子元件进行寿命追踪调查,情况如下:100~200~300~400~500~寿命(h)200300400500600个数2030804030
(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h~400h以内的概率;(4)估计电子元件寿命在400h以上的概率.[解析](1)样本频率分布表如下:寿命(h)频数频率100~200200.10200~300300.15300~400800.40400~500400.20500~600300.15合计2001
(2)频率分布直方图
(3)由频率分布表可以看出,寿命在100h~400h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100h~400h的概率为0.65.(4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的概率为0.35.
为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得的数据整理后列出了频率分布表如下:组别频数频率145.5~149.510.02149.5~153.540.08153.5~157.5200.40157.5~161.5150.30161.5~165.580.16165.5~169.5mn合计MN
(1)求出表中m,n,M,N所表示的数分别是多少?(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5以上的概率.
(3)直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1,由此可以估计样本数据落在某个区间的频率或概率或者总体的数字特征.
[例2]某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30min抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定.
[解析](1)因为间隔时间相同,故是系统抽样.(2)茎叶图如下:
[点评]从茎叶图可看出,甲车间产品重量主要集中在98~103之间,而乙车间产品重量分布则较分散,故不计算方差也可直观作出判断:甲车间产品较稳定.
(1)甲、乙两名同学在五次考试中数学成绩统计用茎叶图表示如图所示,则下列说法正确的是()
A.甲的平均成绩比乙的平均成绩高B.甲的平均成绩比乙的平均成绩低C.甲成绩的方差比乙成绩的方差大D.甲成绩的方差比乙成绩的方差小[答案]C
(2)甲乙两个小组各10名同学的英语口语测试成绩的茎叶图如图1所示:甲乙两组的平均数与中位数之差数大的组是________.
[答案]乙组[解析]根据题中所给的数据,可计算出甲组的平均数为84,中位数为84.5,乙组平均数83.2,中位数83,∴甲组:84-84.5=-0.5,乙组:83.2-83=0.2,∴乙组大.
[例3]下列数据为宝洁公司在某年每周销售出的香皂数(单位:百万块):17.119.615.417.415.018.520.618.420.013.919.318.214.717.112.219.918.720.420.315.516.819.120.415.420.317.517.018.313.639.820.721.322.521.523.423.122.821.424.025.226.323.930.625.226.226.932.826.326.624.326.223.8
•(1)把上述数据分组,列出频率分布表;•(2)根据(1)的结果画频率分布直方图和频率分布折线图;•(3)结合上面的描述,分析该年度香皂销售的分布情况.
[解析](1)频率分布表如下:销售量分组频数频率[10,15)47.691.54[15,20)1936.547.31[20,25)1834.626.92[25,30)815.383.08[30,35)23.850.77[35,40]11.920.38
(2)频率分布直方图和频率分布折线图如图所示.(3)该年度每周的肥皂销售量主要在1500万块到3000万块之间.[点评](1)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.(2)用样本的频率分布可以估计相应的概率分布.
某公司在过去几年内使用某种型号的灯管1000支.该公司对这些灯管的使用寿命(单位:小时)进行了统计,统计结果如下表所示.[1100[1300[1500[1700[1900分[500,[900,,,,,,组900)1100)1300)1500)1700)1900)+∞)频4812120822319316542数频率
(1)将各组的频率填入表中;(2)根据上述统计结果,计算灯管使用寿命不足1500小时的频率.[解析](1)[500[900[1100[1300[1500[1700[1900分,,,,,,,组900)1100)1300)1500)1700)1900)+∞)频4812120822319316542数频0.0480.1210.2080.2230.1930.1650.042率
(2)由(1)可得0.048+0.121+0.208+0.233=0.6,所以灯管使用寿命不足1500小时的频率为0.6.
[例4]从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):甲:25414037221419392142乙:27164427441640401640问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得整齐?
[分析]看哪种玉米的苗长得高,只要比较甲、乙两种玉米苗的均高即可;要比较哪种玉米的苗长得整齐,只要看两种玉米苗高的方差即可,因为方差是体现一组数据波动大小的特征数.
[点评]平均数与方差都是重要的数字特征数,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,所以不仅需要掌握其计算公式和方法,还要学会通过这些数据分析其含义,从而为正确决策提供依据.
据报道,某公司的33名职工的月工资(以元为单位)如下:职务董事长副董事长董事总经理经理管理员职员人数11215320工资5500500035003000250020001500
(1)求该公司职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是多少?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.[分析]由数据代入公式计算,通过数据回答问题.
[解析](1)平均数是=1500+
(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.[点评]当数据较大时,求平均数时通常减去某一个常数,如本例中可先减一个1500,而后再求较为简单,由于平均数受极端值影响很大,故有时平均数不一定能客观地反映总体情况,深刻理解平均数、众数、中位数的特点,结合实际情况灵活运用.
1.不要把直方图错画为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,这是密度.连续随机变量在某一点上是没有频率的.2.用样本频率分布来估计总体分布的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
3.几种表示频率分布的方法的优点与不足;(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
(3)频率折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.(4)用茎叶图优点是原有信息不会抹掉,能够展示数据的分布情况,但当样本数据较多或数据数较多时,茎叶图显得不太方便了.
4.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,标准差、方差越小,数据的离散程度越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.