- 295.62 KB
- 2023-01-15 11:51:01 发布
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
第三节 统计图表、数据的数字特征、用样本估计总体[考纲传真] 1.了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.(对应学生用书第137页)[基础知识填充]1.统计图表(1)统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等.(2)茎叶图:茎叶图不但可以保留所有的数据信息,而且可以随时记录,这对数据的记录和表示都能带来方便.茎叶图中的“茎”是指中间的一列数,“叶”是从“茎”的旁边生长出来的数,是单个数字.2.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图931).图931横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.(3)频率分布折线图频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图3.数据的数字特征数字特征定义
众数在一组数据中,出现次数最多的数据叫做这组数据的众数中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积相等平均数样本数据的算术平均数,即=方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中s为标准差[知识拓展]1.频率分布直方图的特点(1)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(2)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.计算方差的两种方法(1)s2=[(x1-)2+(x2-)2+…+(xn-)2](2)s2=(x+x+…+x)-23.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+A.(2)数据x1,x2,…,xn的方差为s2.①数据x1+a,x2+a,…,xn+a的方差也为s2;②数据ax1,ax2,…,axn的方差为a2s2.[基本能力自测]1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的方差越大,说明这组数据越集中.( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )[解析] (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.(2)错误.方差越大,这组数据越离散.
(3)正确.小矩形的面积=组距×=频率.(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误.[答案] (1)√ (2)× (3)√ (4)×2.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图932所示,则这组数据的中位数和平均数分别是( )图932A.91.5和91.5 B.91.5和92C.91和91.5D.92和92A [这组数据由小到大排列为87,89,90,91,92,93,94,96.∴中位数是=91.5,平均数==91.5.]3.(2017·南昌二模)如图933所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20)内的频数是( )图933A.50 B.40 C.30 D.14C [因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30,故选C.]4.(2016·江苏高考)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.【导学号:00090327】0.1 [5个数的平均数==5.1,所以它们的方差s2=[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.]
5.(2017·山东高考)如图934所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )图934A.3,5B.5,5C.3,7D.5,7A [甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y=5.又甲、乙两组数据的平均值相等,∴×(56+65+62+74+70+x)=×(59+61+67+65+78),∴x=3.故选A.](对应学生用书第138页)茎叶图及其应用 (2018·沈阳模拟)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如图934:图935(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.[解] (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.3分
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.5分(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=0.1,=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.8分(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.12分[规律方法] 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.(2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.[变式训练1] (2017·雅礼中学质检)已知甲、乙两组数据如茎叶图936所示,若两组数据的中位数相同,平均数也相同,那么m+n=________.图93611 [∵两组数据的中位数相同,∴m==3.又∵两组数据的平均数也相同,∴=,∴n=8,因此m+n=11.]频率分布直方图角度1 利用分布直方图求频率、频数 (2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图937所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
图937A.56B.60 C.120 D.140D [由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.]角度2 用频率分布直方图估计总体 (2016·四川高考)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图938所示的频率分布直方图.【导学号:00090328】图938(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.[解] (1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.5分
(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.8分(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.10分由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.12分[规律方法] 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率.2.(1)例3-2中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.(2)利用样本的频率分布估计总体分布.[变式训练2] (2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图.图939(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.[解] (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,2分所以样本中分数小于70的频率为1-0.6=0.4,3分所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.4分(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,6分分数在区间[40,50)内的人数为100-100×0.9-5=5,7分所以总体中分数在区间[40,50)内的人数估计为400×=20.8分(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,9分
所以样本中分数不小于70的男生人数为60×=30,所以样本中的男生人数为30×2=60,10分女生人数为100-60=40,所以样本中男生和女生人数的比例为60∶40=3∶2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2.12分样本的数字特征 (1)已知样本数据x1,x2,…,xn的均值=5,则样本数据2x1+1,2x2+1,…,2xn+1的均值为________.(2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b).其中a,分别表示甲组研发成功和失败;b,分别表示乙组研发成功和失败.①若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平;②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.(1)11 [由条件知==5,则所求均值0===2+1=2×5+1=11.](2)①甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为甲==.3分方差s==.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为乙==.方差s==.因为甲>乙,s<s,所以甲组的研发水平优于乙组.6分②记E={恰有一组研发成功}.
在所抽得的15个结果中,恰有一组研发成功的结果是(a,),(,b),(a,),(,b),(a,),(a,),(,b),共7个.因此事件E发生的概率为.用频率估计概率,即得所求概率为P(E)=.12分[规律方法] 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式.2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择.[变式训练3] (2018·洛阳模拟)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图9310所示的茎叶图.考虑以下结论:【导学号:00090329】图9310①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的序号为( )A.①③ B.①④ C.②③ D.②④B [甲地5天的气温为:26,28,29,31,31,其平均数为甲==29;方差为s=[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s甲=.乙地5天的气温为:28,29,30,31,32,其平均数为乙==30;方差为s=[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;
标准差为s乙=.∴甲<乙,s甲>s乙.]