• 549.33 KB
  • 2023-01-16 11:37:02 发布

2018版高考数学大一轮复习第十一章统计与统计案例11.2统计图表、用样本估计总体试.

  • 19页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
第十一章统计与统计案例11.2统计图表、用样本估计总体试题理北师大版扌知识主学习If知识梳理1.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等.2.数据的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.中位数:将一组数据按大小依次排列,把处在融回位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.——1平均数:样本数据的算术平均数,即才=:5+疋+・・・+/).在频率分布直方图中,中位数左边和右边的直方图的面积应该桓汇(2)样本方差、标准差标准寿&一V”X—.V■+X_i.V~-1-A;—.V,其中/是样本数据的第刀项,刀是样本容量,"7是平均数.桩准差是刻画数据的离散程度的特征数,样本方差是标准差的壬方」通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.3.用样本估计总体(1)通常我们对总体作出的估汁一般分成两种,一种是用样本的频率分布估汁总体的频率分車,另一种是用样木的数字特征估计总体的数字特征.频率(2)在频率分布直方图中,纵轴表示鱸,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的而积总和等于丄.(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且可以随时记 丞,方便表示与比较.【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,一频率纵坐标表示麺亍频率频率=组距(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据才1,xi,…,弘的平均数为/,那么mx+a,mx-i+a,/nxs+af…,nix,,+a的平均数是mx+乩(2)数据;n,X2,…,几的方差为si①数据xi+m,x2+a,…,Xn+a的方差也为si②数据臼船,…,方兀的方差为/si【思考辨析】判断下列结论是否正确(请在括号中打“厂或“X”)(1)平均数、众数与屮位数从不同的角度描述了一组数据的集中趋势.(V)(2)—组数据的众数可以是一个或几个,那么中位数也具有相同的结论.(X)(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(V)⑷茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.(X)(1)在频率分布直方图屮,最高的小长方形底边中点的横坐标是众数.(V)(2)在频率分布直方图小,众数左边和右边的小长方形的面积和是相等的.(X)考点自测1.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()B.91.5和92D.92和92A.91.5和91.5C.91和91.5答案A解析这组数据由小到大排列为87,89,90,91,92,93,94,96, 91+92••冲位数是^^=91.5,平均数二^87+89+904-91+92+934-94+96^9l2.(2015・陕西)某中学初中部共有110名教师,高屮部共有150名教师,其性别比例如图所示,则该校女教师的人数为()(初屮部)(高中部)A.93B.123C.137D.167答案0解析由题干扇形统计图可得该校女教师人数为11OX7O96+15OX(1-60%)=137.故选C.1.(2016•宜宾模拟)若数据山,xu上,…,几的平均数为x=5,方差52=2,则数据3刃+1,3曲+1,3朋+1,…,3必+1的平均数和方差分别为()A.5,2B.16,2C.16,18D.16,9答案C解析*.*x,捡,用,…,几的平均数为5,.Xi+x2+x^-X„L••=5,刀1=3X5+1=16,D,Xi,xs,…,匕的方差为2,・・・3山+1,3疋+1,3启+1,…,3乂+1的方差是32X2=18.2.(2016•江苏)己知一组数据4.7,4.&5.1,5.4,5.5,则该组数据的方差是答案0.1—4.7+4.8+5.1+5.4+5.5n、解析X19O则方差s2=|[(4.7-5.l)2+(4.8-5.l)2+(5.1-5.l)2+(5.4-5.l)2+(5.5-5.l)2]=0.1.□3.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有 株树木的底部周长小于100cm.底部周长/cm答案24解析底部周长在[80,90)的频率为0.015X10=0.15,底部周长在[90,100)的频率为0.025X10=0.25,样本容量为60,所以树木的底部周长小于100cm的株数为(0.15+0.25)X60=24.题型分类深度剖析题型一频率分布直方图的绘制与应用例1(2016・北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过炉立方米的部分按4元/立方米收费,超出炉立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果0为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,炉至少定为多少?(2)假设同组屮的每个数据用该组区间的右端点值代替.当『尸3时,估计该市居民该月的人均水费.解(1)如图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)X0.5=0.85.・••用水量小于等于3立方米的频率为0.85,又炉为整数,・・・为使80%以上的居民在该月的用水价格为4元/立方米,©至少定为3.(2)当3时,该市居民该月的人均水费估计为(0.1X1+0.15X1.5+0.2X2+0.25X2.5+0.15X3)X4+0.15X3X4+[0.05X(3.5-3) +0.05X(4-3)+0.05X(4.5—3)]X10=7.2+1.8+1.5=10.5(元).即该市居民该月的人均水费估计为10.5元.思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题冃,最重要的是认真观察图表,从中提炼有用的信息和数据.跟踪训练1(2015•课标全国II)某公司为了解用户对其产品的满意度,从A,〃两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到外地区用户满意度评分的频率分布直方图和〃地区用户满意度评分的频数分布表.月地区用户满意度评分的频率分布直方图图①〃地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(1)在图②中作出〃地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均数及分散程度(不要求计算出具体值,给出结论即可).〃地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意 估计-哪个地区用八的满意度等级为不满意的概率大?说明理由.解(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均数高于力地区用户满意度评分的平均数;〃地区用户满意度评分比较集中,而力地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记G表示事件:“/地区用户的满意度等级为不满意”;Q表示事件:“〃地区用户的满意度等级为不满意”.由直方图得P(G)的估计值为(0.01+0.02+0.03)X10=0.6,"(G)的估计值为(0.005+0.02)X10=0.25.所以力地区用八的满意度等级为不满意的概率大.题型二茎叶图的应用例2(1)(2015•山东)为比较甲、乙两地某月14时的气温情况,随机选取该月屮的5天,将这5天中14时的气温数据(单位:。C)制成如图所示的茎叶图.考虑以下结论:甲乙98628911012①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14吋的平均气温高于乙地该月14吋的平均气温;③甲地该月14时的气温的标准差小于乙地该月14吋的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③B.①④C.②③D.②④(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).甲组乙组909x215y«7424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则尢y的值分别为() A.2,5B.5,5C.5,8D.&8答案(1)B(2)C解析(1)甲地5天的气温为26,28,29,31,31, =29;—26+28+29+31+31其平均数为x甲="方差为和*(26—29)2+(28—29)+29—29)2+(31-29)2+(31-29)2]=3.6;标准差为s甲=寸3.6.乙地5天的气温为28,29,30,31,32,其平均数为比乙=28+29+30+3+2=3°;方差为si=k(28-30)2+(29-30)2+(30-30)20+(31-30)2+(32-30)2]=2;标准差为s^=y[i.•:x甲Vx乙,s甲>s乙.(2)由茎叶图及已知得^=5,乂乙组数据的平均数为16.8,即9+15+10+/+18+245=16.8解得y=&引申探究1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好?解由原题可知x=5,则甲组平均数为9+12+1+4+27=17.4.而乙组平均数为16.8,所以甲组成绩较好.2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差.解①由茎叶图知,乙组中五名学生的成绩为9,15,1&18,24.故中位数为18,众数为18.②/=占[(9一16.8)2+(15-16.8)2+(18-16.8)2X2+(24-16.8)2]=23.76.0思维升华茎叶图的优缺点rh茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.跟踪训练2(1)某学校随机抽収20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是() 3854304BEnHH-HM数MD2()4()(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以;r表示:87794010x91则7个剩余分数的方差为()116366^7A.—B.yC.36D.于答案(1)A(2)B解析(1)由于频率分布直方图的组距为5,排除C、D,又[0,5),[5,10)两组各一人,排除B,应选A.⑵由题意知87+94+90+91+90+90+/+917=91,解得x=4.所以?=|[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]I36=”(16+9+1+0+1+9+0)=—题型三用样本的数字特征估计总体的数字特征例3(1)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892 则成绩较为稳定(方差较小)的那位运动员成绩的方差为.答案2——1解析%甲=7(87+91+90+89+93)=90,□—1x乙==(89+90+91+88+92)=90,□5?).=|[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,sL=|[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.o第第第第第一二三四五次次次次次65432次数①分别求出两人得分的平均数与方差;②根据图和上血算得的结果,对两人的训练成绩作出评价.解①由图像可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.-10+13+12+14+16_x甲=;=13;X乙=也土空吐j昴弓(10-13)2+(13—⑶£12-13)2+(14-3+(16-13)24;sk=|[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.5②由h可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提髙,而乙的成绩则无明显提高.思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.跟踪训练3(2016・全国乙卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰•机 器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买儿个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得以下柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),〃表示购机的同时购买的易损零件数.(1)若/?=19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于刀”的频率不小于0.5,求刀的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?解(1)当xW19时,y=3800:当Q19时,y=3800+500(x-19)=500%-5700.所以y与x的函数解析式为3800,Z9,v=(x$N)・"500x-5700,x>19(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故/?的最小值为19.⑶若每台机器在购机的同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800元,20台的费用为4300元,10台的费用为4800元,因此这100台机器在购买易损零件上所需费用的平均数为击(3800X70+4300X20+4800X10)=4000(元),若每台机器在购机同吋都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000元,10台的费用为4500元,因此这100台机器在购买易损零件上所需费用的平均数为击(4000X90+4500X10)=4050(元).比较两个平均数可知,购买1台机器的同时应购买19个易损零件.咼频小考点9.高考中频率分布直方图的应用 考点分析频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布來估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.典例(12分)(2016・四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中白的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的屮位数.规范解答解(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08X0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.0&0.21,0.25,0.06,0.04,0.02.[3分]由1—(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5X&+0.5X&,解得自=0.30.[5分]⑵由⑴知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000X0.12=36000.[8分](3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0,5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2W*2.5. 由0.50XU-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.[12分]课时作业1.(2017•铁岭月考)在某次测量中得到的力样本数据如下:42,43,46,52,42,50,若〃样本数据恰好是样木数据每个都减5后所得数据,则〃两样本的下列数字特征对应相同的是()B.标准差D.中位数A.平均数C.众数答案B解析由〃样本数据恰好是力样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与弭样本不相同,标准差不变,故选B.2.(2016•山东)某高校调査了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120答案D解析设所求人数为M则A-2.5X(0.16+0.08+0.04)X200=140,故选D.3.(2017•北京西城区质检)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2B.0.4C.0.5D.0.6答案B4解析10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为花 =0.4.故选B. 1.(2016•西安模拟)某公司10位员工的月工资(单位:元)为上,曲,…,川),其平均数和方差分别为匚和孑,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为()A.T,5+1002B.T+100,?4-1002C.x,sD.+100,s答案D解析”+吒…+亠匚,y;=x+100,所以口,乃,…,用的平均数为T+100,方差不变,故选D.2.(2016・山西大学附屮诊断测试)已知样本(简,曲,・・・,兀)的平均数为匚,样本5,乃,…,%)的平均数为若样本(的,…,Xn,比,…,几)的平均数z=ax+一1(1—自)y,其屮0/nC.n=mD.不能确定答案A解析由题意可得匚="+書・+=—y】+刃%『=匚,—xi+曲必+口+乃Zn+mnn+mmn+myi+%%mnn+mn+my=ax+仃一$)y,111又0<水*,所以(K故n