- 50.25 KB
- 2023-01-18 11:32:02 发布
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
2018版高考数学大一轮复习第十章统计与统计案例10.2统计图表、用样本估计总体教师用书文北师大版1.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等.2•数据的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平28
均数)叫作这组数据的中位数.28
—1平均数:样本数据的算术平均数,即Y=-(Xl+X2+…+Xn)•n在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(1)样本方差、标准差标准差S=X1-X2+X2-X2+…+Xn-X2],其中Xn是样本数据的第n项,n是样本容量,7是平均数.标准差是刻画数据的离散程度的特征数,样本方差是标准差的平方•通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.2•用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.(2)在频率分布直方图中,纵轴表示组率,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(2)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.(3)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且可以随时记录,方便表示与比较.【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距x频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据X1,X2,…,Xn的平均数为x,那么mX+a,mX+a,mx+a,…,mX+a的平均数是mx+a.⑵数据X1,X2,…,Xn的方差为s2.28
2①数据xi+a,X2+a,…,xn+a的方差也为s;②数据axi,ax2,…,axn的方差为as.【思考辨析】判断下列结论是否正确(请在括号中打“V”或“x”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(V)(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.(x)(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(V)(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.(x)(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(V)(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.(x)1.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()28
A.91.5和91.5C.91和91.5B.91.5和92D.92和92解析这组数据由小到大排列为87,89,90,91,92,93,94,96•••中位数是91+922__=91.5答案A平均数-=87+89+90+91+92+93+94+96=91.5.2.(2015•陕西)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.167答案C28
[31.5,43.5)的概率约是(解析由题干扇形统计图可得该校女教师人数为110X70%^150X(1—60%)=137.故选C.[11.5,15.5)2;[15.5,19.5)4;[19.5,23.5)9;[23.5,27.5)18;[27.5,31.5)11;[31.5,35.5)12;[35.5,39.5)7;[39.5,43.5)3.3•一个容量为66的样本,数据的分组及各组的频数如下:根据样本的频率分布估计,数据落在1112A.6B.3C.2D.3答案B解析由已知,样本容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故所求概率为226613.28282•(2016•江苏)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是答案0.1解析—4.7+4.8+5.1+5.4+5.5x=5=5.1,则方差2122222S=RM—切+件8—5.1)+®—切+⑸4—切+⑸5—切]=0".5•为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所60株树木中,有得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的株树木的底部周长小于100cm.答案24解析底部周长在[80,90)的频率为0.015X10=0.15,底部周长在[90,100)的频率为0.025X10=0.25,28
样本容量为60,所以树木的底部周长小于100cm的株数为(0.15+0.25)X60=24.题型一频率分布直方图的绘制与应用例1(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解(1)如图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)X0.5=0.85.28
•••用水量小于等于3立方米的频率为0.85,又w为整数,•••为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为(0.1X1+0.15X1.5+0.2X2+0.25X2.5+0.15X3)X4+0.15X3X4+[0.05X(3.5—3)+0.05X(4—3)+0.05X(4.5—3)]X10=7.2+1.8+1.5=10.5(元).即该市居民该月的人均水费估计为10.5元.思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(2015•课标全国n)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均数及分散程度(不要求计算出具体值,给出结论即可)•28
B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分28
满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均数高于A地区用户满意度评分的平均数;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记CA表示事件:“A地区用户的满意度等级为不满意”;Cb表示事件:“B地区用户的满意度等级为不满意”.由直方图得F(CA)的估计值为(0.01+0.02+0.03)X10=0.6,F(Cb)的估计值为(0.005+0.02)X10=0.25.所以A地区用户的满意度等级为不满意的概率大.题型二茎叶图的应用例2(1)(2015•山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:C)制成如图所示的茎叶图•考虑以下结论:甲乙9S62891130]2①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;28
①甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;28
①甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()(单位:分).A.①③B.①④C.②③D.②④(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5B.5,5C.5,8D.8,8答案(1)B(2)C解析(1)甲地5天的气温为26,28,29,31,31,其平均数为7甲=26+如号+31+31=29;12I22222方差为s^a=[(26—29)+(28—29)+(29—29)+(31—29)+(31—29)]=3.6;5标准差为s甲=•』‘36乙地5天的气温为28,29,30,31,32,其平均数为7乙=如29+严31+32=30;1方差为Szi=[(28—30)+(29—30)+(30—30)+(31—30)+(32—30)]=2;5标准差为s乙=叮2.x甲vx乙,s甲>s乙.9+15+10+v+18+24⑵由茎叶图及已知得x=5,又乙组数据的平均数为16.8,即9+15+10+y+18+24=16.8,解得y=8.引申探究28
1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好?解由原题可知x=5,9+12+15+24+27则甲组平均数为=1745而乙组平均数为16.8,所以甲组成绩较好.2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差.解①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24.故中位数为18,众数为18.212222②s=耳(9-16.8)+(15-16.8)+(18-16.8)X2+(24-16.8)]=23.76.思维升华茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似•它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示•其缺点是当样本容量较大时,作图较烦琐.(1)某学校随机抽取20个班,调查各班中5将数据分组成[0,5),有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()28
0123737644307554320(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:8774010xS)1则7个剩余分数的方差为()8543028
A.116~9B.36C.36D.6J~^T答案⑴A(2)B解析(1)由于频率分布直方图的组距为5,排除CD,又[0,5),[5,10)两组各一人,排除B,应选A.87+94+90+91+90+90+x+91”口212⑵由题意知7=91,解得x=4.所以s=-[(87—91)+(94222222—91)+(90—91)+(91—91)+(90—91)+(94—91)+(91—91)]136=7(16+9+1+0+1+9+0)=题型三用样本的数字特征估计总体的数字特征例3(1)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为.答案21解析x甲=(87+91+90+89+93)=90,5—1x乙=(89+90+91+88+92)=90,52122222$甲=[(87—90)+(91—90)+(90—90)+(89—90)+(93—90)]=4,51s乙=一[(89—90)2+(90—90)2+(91—90)2+(88—90)2+(92—90)2]=2.5(1)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.28
①分别求出两人得分的平均数与方差;②根据图和上面算得的结果,对两人的训练成绩作出评价.解①由图像可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.10+13+12+14+16X甲=—13+14+严+12+14=13,2122222$甲=一[(10—13)+(13—13)+(12—13)+(14—13)+(16—13)]=4;521s乙=1[(13—13)+(14-13)+(12-13)+(12-13)+(14—13)]=°8②由s甲>s乙,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(2016•全国乙卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得以下柱状图:28
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.(1)若n=19,求y与x的函数解析式;⑵若要求"需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(1)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台28
机器的同时应购买19个还是20个易损零件?解⑴当x<19时,y=3800;当x>19时,y=3800+500(x-19)=500x—5700.所以y与x的函数解析式为3800,x<19,y=(x€N).500x-5700,x>19⑵由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(3)若每台机器在购机的同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800元,20台的费用为4300元,10台的费用为4800元,因此这100台机器在购买易损零件上所需费用的平均数为1一而(3800X70+4300X20+4800X10)=4000(元),若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000元,10台的费用为4500元,因此这100台机器在购买易损零件上所需费用的平均数为1一而(4000X90+4500X10)=4050(元).比较两个平均数可知,购买1台机器的同时应购买19个易损零件.高频小考点9•高考中频率分布直方图的应用考点分析频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用•在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致•通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.典例(12分)(2016•四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,28
对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.规范解答解(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08X0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.[3分]由1—(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5Xa+0.5Xa,解得a=0.30.[5分](1)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000X0.12=36000.[8分](2)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2Wx<2.5.由0.50X(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.[12分]28
1.(2017•铁岭月考)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则AB两样本的下列数字特征对应相同的是()A.平均数B.标准差C.众数D.中位数答案B解析由B样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变,故选B.2.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()28
28A.56B.60C.120D.140答案D解析设所求人数为N,贝UN=2.5X(0.16+0.08+0.04)X200=140,故选D.3.(2017•北京西城区质检)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()1892122793003A.0.2B.0.4C.0.5D.0.6答案B4解析10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为和=0.4.故选B.4.(2016•西安模拟)某公司10位员工的月工资(单位:元)为X1,X2,…,X10,其平均数和方差分别为7和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为()22B.x+100,s+10022A.x,s+1002C.x,s2D.x+100,s28
答案D解析X1+x?+Xio=x,y=Xi+100,所以yi,y2,…,yio的平均数为x+100,方差不变,故选D.5•如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0〜9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为ai、a2,则一定有()A.ai>a2B.a2>aiC.ai=a2D.ai,a2的大小与m的值有关答案B解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>ai.故选B.6.(20i6•北京朝阳区期末)在一段时间内有2000辆车通过高速公路上的某处,现随机抽取其中的200辆进行车速统计,统计结果如下面的频率分布直方图所示.若该处高速公路规定28
正常行驶速度为90km/h〜i20km/h,试估计2000辆车中,在这段时间内以正常速度通过该处的汽车约有()28
A.30辆B.300辆C.170辆D.1700辆答案D解析以正常速度通过该处的汽车频率为1-(0.01+0.005)X10=0.85,所以以正常速度通过该处的汽车约有0.85X2000=1700(辆).7•样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本方差为答案2解析由题意可知样本的平均数为1,所以a+0+1+2+35解得a=-1,所以样本的方差为122222[(—1-1)+(0—1)+(1—1)+(2—1)+(3—1)]=2.58.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为.28
答案0.0303解析•••小矩形的面积等于频率,.••除[120,130)外的频率和为0.700,二a=1—0.7001028280.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,.••由分层抽样可知抽样比为18=_360=10,2828•••在[140,150]中选取的学生应为3人.9.若样本数据X1,X2,…,X10的标准差为8,则数据2x1—1,2X2—1,…,2x10—1的标准差答案16解析若X1,X2,…,Xn的标准差为s,则ax1+b,ax?+b,…,axn+b的标准差为as.由题意s=8,则上述标准差为2X8=16.10.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].贝U28
(1)图中的x=;(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有名学生可以申请住宿.答案(1)0.0125(2)72解析⑴由频率分布直方图知20x=1—20X(0.025+0.0065+0.003+0.003),解得x=0.0125.⑵上学时间不少于1小时的学生的频率为0.12,因此估计有0.12X600=72(人)可以申请住宿.11.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;28
⑵求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.解⑴分数在[50,60]的频率为0.008X10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,2所以全班人数为=25.0.08⑵分数在[80,90]之间的频数为25-2-7-10—2=4,频率分布直方图中[80,90]间的矩形4的高为亡十10=0.016.2512.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得到如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125]频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%的规定?解(1)如图所示:28
(2)质量指标值的样本平均数为x=80X0.06+90X0.26+100X0.38+110X0.22+120X0.08=100.质量指标值的样本方差为22222s=(—20)X0.06+(—10)X0.26+0X0.38+10X0.22+20X0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.⑶质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%的规定.28