文档内容
第 3 节 用样本估计总体
考试要求 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频
率分布折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和
作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、
标准差),并作出合理的解释;4.会用样本的频率分布估计总体的频率分布,会
用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
1.频率分布直方图
(1)频率分布表的画法:
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.
2.茎叶图
统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的
旁边生长出来的数.
3.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把称为a ,a ,…,a 这n个数的平均数.
1 2 n
(4)标准差与方差:设一组数据x ,x ,x ,…,x 的平均数为x,则这组数据的标
1 2 3 n
准差和方差分别是
s=,
s2=[(x -x)2+(x -x)2+…+(x -x)2].
1 2 n
1.频率分布直方图与众数、中位数、平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形
的面积乘以小长方形底边中点的横坐标之和.
2.平均数、方差的公式推广
(1)若数据x ,x ,…,x 的平均数为x,那么mx +a,mx +a,mx +a,…,mx
1 2 n 1 2 3 n
+a的平均数是mx+a.
(2)数据x ,x ,…,x 的方差为s2.
1 2 n
①数据x +a,x +a,…,x +a的方差也为s2;
1 2 n
②数据ax ,ax ,…,ax 的方差为a2s2.
1 2 n
1.思考辨析(在括号内打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的方差越大,说明这组数据越集中.( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越
大.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,
相同的数据可以只记一次.( )
答案 (1)√ (2)× (3)√ (4)×
解析 (2)错误.方差越大,这组数据越离散.
(4)错误.在茎叶图中,相同的数据叶要重复记录,故(4)错误.
2.(2021·天津卷)从某网络平台推荐的影视作品中抽取 400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得
到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )
A.20 B.40 C.64 D.80
答案 D
解析 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为
400×0.05×4=80.
3.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中
位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
答案 A
解析 这组数据由小到大排列为87,89,90,91,92,93,94,96,
∴中位数是=91.5,
平均数x=
=91.5.
4.(易错题)已知一组数据的频率分布直方图如图,则众数是________,平均数是
________.答案 65 67
解析 因为最高小长方形中点的横坐标为65,
所以众数为65;
平均数x=(55×0.030+65×0.040+75×0.015+85×0.010+95×0.005)×10=67.
5.(2021·新高考全国Ⅱ卷改编)下列统计量中,能度量样本 x ,x ,…,x 的离散
1 2 n
程度的所有正确编号有________.
①样本x ,x ,…,x 的标准差;
1 2 n
②样本x ,x ,…,x 的中位数;
1 2 n
③样本x ,x ,…,x 的极差;
1 2 n
④样本x ,x ,…,x 的平均数.
1 2 n
答案 ①③
解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义
可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据
的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故①③正
确.
6.(易错题)若数据x ,x ,x ,…,x 的平均数x=5,方差s2=2,则数据3x +1,
1 2 3 n 1
3x +1,3x +1,…,3x +1的平均数和方差分别为________.
2 3 n
答案 16,18
解析 ∵x ,x ,x ,…,x 的平均数为5,
1 2 3 n
∴3x +1,3x +1,3x +1,…,3x +1的平均数是3×5+1=16,
1 2 3 n
∵x ,x ,x ,…,x 的方差为2,
1 2 3 n
∴3x +1,3x +1,3x +1,…,3x +1的方差是32×2=18.
1 2 3 n
考点一 频率分布直方图例1 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个
用户,根据用户对产品的满意度评分,得到 A地区用户满意度评分的频率分布
直方图和B地区用户满意度评分的频数分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频数分布表
满意度评
[50,60) [60,70) [70,80) [80,90) [90,100]
分分组
频数 2 8 14 10 6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较
两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户和满意度分为三个等级:
满意度评分 低于70分 70分到89分 不低于90分
满意度等级 不满意 满意 非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
解 (1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分
的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,
而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记C 表示事件:“A地区用户的满意度等级为不满意”;
A
C 表示事件:“B地区用户的满意度等级为不满意”.
B
由直方图得P(C )的估计值为
A
(0.01+0.02+0.03)×10=0.6,
P(C )的估计值为(0.005+0.02)×10=0.25.
B
所以A地区用户的满意度等级为不满意的概率大.
感悟提升 1.频率分布直方图的性质.
(1)小长方形的面积=组距×=频率;
(2)各小长方形的面积之和等于1;
(3)小长方形的高=.
2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.
训练1 (2021·江西省重点中学联考)江西省重点中学协作体于2021年进行了一次
校际数学竞赛,共有100名同学参赛,经过评判,这 100名参赛者的得分都在
[40,90]之间,其得分的频率分布直方图如图,则下列结论错误的是( )
A.得分在[40,60)之间的共有40人B.从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5
C.这100名参赛者得分的中位数为65
D.可求得a=0.005
答案 C
解析 对于A,得分在[40,60)之间的有100×[1-(0.030+0.020+0.010)×10]=
40(人),故A正确;
对于B,从这100名参赛者中随机选取1人,其得分在[60,80)的概率为(0.030+
0.020)×10=0.5,故B正确;
对于D,由(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,故D正确;
对于C,得分在[40,60)的频率为(0.005+0.035)×10=0.4,
得分在[60,70)的频率为0.030×10=0.3,
∴这100名参赛者得分的中位数为60+×10≈63.3,故C错误.
考点二 统计图表及应用
角度1 扇形图
例2 (2022·郑州模拟)某高中为了解学生课外知识的积累情况,随机抽取200名同
学参加课外知识测试,测试共 5题道,每答对一题得20分,答错得0分.已知每
名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记为优秀,
测试成绩百分比分布图如图所示,则下列说法正确的是( )
A.该次课外知识测试及格率为90%
B.该次课外知识测试得满分的同学有30名
C.该次测试成绩的中位数大于测试成绩的平均数
D.若该校共有3 000名学生,则课外知识测试成绩能得优秀的同学大约有1 440
名
答案 C解析 由题图可知及格率为1-8%=92%,故A错误.
该次课外知识测试得满分同学占的百分比为 1-8%-32%-48%=12%,则得满
分的同学有12%×200=24(名),故B错误.
中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分,
故C正确.
3 000×(48%+12%)=1 800(名),故D错误.
角度2 折线图
例3 (2021·昆明诊断)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次
数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,
对该关键词相关的信息关注度也越高.如图是2019年9月到2020年2月这半年来
某个关键词的搜索指数变化的统计图.
根据该统计图判断,下列结论正确的是( )
A.这半年来,网民对该关键词相关的信息关注度呈周期性变化
B.这半年来,网民对该关键词相关的信息关注度不断减弱
C.从该关键词的搜索指数来看,2019年10月的方差小于11月的方差
D.从该关键词的搜索指数来看,2019年12月的平均值大于2020年1月的平均值
答案 D
解析 由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显著,
排除A;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋势不显著,
排除B;由统计图可知,2019年10月该关键词的搜索指数波动较大,11月的波
动较小,所以2019年10月的方差大于11月的方差,排除C;由统计图可知,
2019年12月该关键词的搜索指数大多高于 10 000,该月平均值大于 10 000,
2020年1月该关键词的搜索指数大多低于 10 000,该月平均值小于10 000,选
D.
角度3 茎叶图例4 (2022·西安模拟)中国数学奥林匹克由中国数学会主办,是全国中学生级别最
高、规模最大、最具影响力的数学竞赛.某重点高中为参加中国数学奥林匹克做
准备,对该校数学集训队进行一次选拔赛,所得分数的茎叶图如图所示,则该集
训队考试成绩的众数与中位数分别为( )
A.85,75 B.85,76
C.74,76 D.75,77
答案 B
解析 由茎叶图知,出现的数据最多的是85,故众数为85;
由于数据总数为14个,故中位数为排序后第七个和第八个数据的平均数,即=
76,故选B.
感悟提升 1.通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.
2.折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用
于显示在相等时间间隔下数据的趋势.
3.茎叶图的三个关注点
(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.
(2)重复出现的数据要重复记录,不能遗漏.
(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般
“重心”下移者平均数较大,数据集中者方差较小.
训练2 (1)由于受疫情的影响,学校停课,同学们通过三种方式在家自主学习,
现学校想了解同学们对假期学习方式的满意程度,收集如图 1所示的数据;教务
处通过分层抽样的方法抽取 4%的同学进行满意度调查,得到的数据如图 2.下列
说法错误的是( )A.样本容量为240
B.若m=50,则本次自主学习学生的满意度不低于四成
C.总体中对方式二满意的学生约为300人
D.样本中对方式一满意的学生为24人
(2)(2022·南昌测试)爱美之心,人皆有之,健身减肥已成为很多肥胖者业余选择
的项目.为了了解运动健身减肥的效果,某健身房调查了 40名肥胖者,健身之前
他们的体重(单位:kg)情况如柱状图1所示,经过四个月的健身后,他们的体重
情况如柱状图2所示,对比健身前后,关于这40名肥胖者,下面结论不正确的
是( )
A.他们健身后,体重在区间[90,100)内的人数增加了4
B.他们健身后,体重在区间[100,110)内的人数没有改变
C.因为健身前后体重在区间[100,110)内的人数所占的比例没有发生变化,所以健身对体重没有任何影响
D.他们健身后,原来体重在区间[110,120)内的肥胖者的体重都有减少
答案 (1)B (2)C
解析 (1)选项A,样本容量为6 000×4%=240,该选项正确;
选项B,根据题意得自主学习的满意率为≈0.358<0.4,该选项错误;
选项C,样本可以估计总体,但会有一定的误差,总体中对方式二满意人数约为
1 500×20%=300,该选项正确;
选项D,样本中对方式一满意人数为2 000×4%×30%=24,该选项正确.
(2)健身前体重在区间[90,100),[100,110),[110,120)内的人数分别为
40×30%,40×50%,40×20%,
即12,20,8,健身后体重在区间[80,90),[90,100),[100,110)内的人数分
别为40×10%,40×40%,40×50%,
即4,16,20.
所以健身后,体重在区间[90,100)内的人数增加了16-12=4,故A选项正确;
健身后,体重在区间[100,110)内的人数与健身前一样,同为20,故B选项正确;
虽然健身前后体重在区间[100,110)内的人数所占的比例没有发生变化,但是健
身后没有体重在区间[110,120)内的人,所以健身对体重有影响,故C选项错误;
健身前,体重在区间[110,120)内的有8人,健身后没有体重在区间[110,120)
内的人,故D选项正确.故选C.
考点三 样本的数字特征
例5 (1)(2021·太原模拟)已知一组数据1,2,a,b,5,8的平均数和中位数均为
4,其中a,b∈N*,在去掉其中的一个最大数后,该组数据的( )
A.平均数不变 B.中位数不变
C.众数不变 D.标准差不变
(2)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了 5次,
成绩如下表(单位:环):
甲 10 8 9 9 9
乙 10 10 7 9 9
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.
答案 (1)C (2)甲解析 (1)由平均数为4知,a+b=8;由中位数为4,得a=b=4或a=3,b=5.
去掉最大数8后,根据平均数与标准差的意义,知平均数和标准差均变小,中位
数可能是4,也可能是3,当a=b=4时,众数与原来一致,都为4;当a=3,b
=5时,众数也与原来一致,都为5,故选C.
(2)由题意可得x =x =9,
甲 乙
又∵s=×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=,
s=×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=>s,
∴甲更稳定,故最佳人选应是甲.
感悟提升 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数
据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;
标准差、方差越小,数据的离散程度越小,越稳定.
2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
训练3 (1)(2020·全国Ⅲ卷)设一组样本数据x ,x ,…,x 的方差为0.01,则数据
1 2 n
10x ,10x ,…,10x 的方差为( )
1 2 n
A.0.01 B.0.1 C.1 D.10
(2)(2022·成都诊断)构建德智体美劳全面培养的教育体系是我国教育一直以来努
力的方向.某中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活
动.如图所示的是该校高三(1)(2)班两个班级在某次活动中的德智体美劳的评价得
分对照图(得分越高,说明该项教育越好).下列说法正确的是( )
A.高三(2)班五项评价得分的极差为1.5
B.除体育外,高三(1)班的各项评价得分均高于高三(2)班对应的得分
C.高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高
D.各项评价得分中,这两班的体育得分相差最大
答案 (1)C (2)C解析 (1)10x ,10x ,…,10x 的方差为102×0.01=1.故选C.
1 2 n
(2)高三(2)班德智体美劳各项得分依次为9.5,9,9.5,9,8.5,
所以极差为9.5-8.5=1,A错误;
对于B,两班的德育分相等,B错误;
对于D,两班的劳育得分相差最大,D错误.故选C.
1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为(
)
A.4 B.8 C.12 D.16
答案 B
解析 设频数为n,则=0.25,
∴n=32×0.25=8.
2.(2021·洛阳模拟)已知某地区中小学生人数和近视情况分别如图①和图②所示.为
了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行
调查,则样本容量和抽取的高中生近视人数分别为( )
A.200,20 B.100,20
C.200,10 D.100,10
答案 A
解析 由图①得样本容量为(3 500+2 000+4 500)×2%=10 000×2%=200,
抽取的高中生人数为2 000×2%=40(人),
则近视人数为40×0.5=20(人),故选A.
3.从某小学随机抽取100名学生,将他们的身高(单位:厘米)分布情况汇总如下:
身高 [100,110] (110,120] (120,130] (130,140] (140,150]
频数 5 35 30 20 10由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)( )
A.119.3 B.119.7 C.123.3 D.126.7
答案 C
解析 由题意知身高在[100,110],(110,120],(120,130]的频率依次为0.05,
0.35,0.3,前两组频率和为 0.4,组距为 10,设中位数为 x,则(x-120)×=
0.1,解得x≈123.3.故选C.
4.(2021·贵阳诊断)如图是某赛季甲、乙两名篮球运动员 9场比赛所得分数的茎叶
图,则下列说法错误的是( )
A.甲所得分数的极差为22
B.乙所得分数的中位数为18
C.两人所得分数的众数相等
D.甲所得分数的平均数低于乙所得分数的平均数
答案 D
解析 甲所得分数的极差为33-11=22,A正确;
乙所得分数的中位数为18,B正确;
甲所得分数的众数为22,乙所得分数的众数为22,C正确,故选D.
5.某运动健康App可以记录跑步(里程数)或行走情况(步数),用户通过该App可
查看自己某时间段的运动情况.某人根据2022年1月至2022年11月期间每月跑
步的里程(单位:十公里)的数据绘制了下面的折线图.根据该折线图,下列结论不
正确的是( )A.月跑步里程逐月增加
B.月跑步里程最大值出现在10月
C.月跑步里程的中位数为5月份对应的里程数
D.相对6月至11月,1月至5月的月跑步里程波动性更小、变化比较平稳
答案 A
解析 由折线图可知,月跑步里程并不是逐月增加,A错误;月跑步里程最大值
出现在10月,B正确;月跑步里程的中位数为5月份对应的里程数,C正确;
相对6月至11月,1月至5月的月跑步里程波动性更小、变化比较平稳,D正确.
6.(2022·银川质检)甲、乙、丙、丁四位同学组成的数学学习小组进行了一次小组
竞赛,共测试了5道题,每位同学各题得分情况如下表所示:
题目
第1题 第2题 第3题 第4题 第5题
学生
甲 10 10 10 20 0
乙 10 10 5 15 10
丙 10 10 15 15 10
丁 0 10 10 20 20
下列说法正确的是( )
A.甲的平均得分比丙的平均得分高
B.乙的得分极差比丁的得分极差大
C.对于这4位同学,因为第4题的平均得分比第2题的平均得分高,所以第4题
相关知识一定比第2题相关知识掌握的好
D.对于这4位同学,第3题得分的方差比第5题得分的方差小
答案 D
解析 选项A中,甲的平均得分为=10,丙的平均得分为=12,故甲的平均得
分比丙的平均得分低,故错误;
选项B中,乙的得分极差为15-5=10,丁的得分极差为20-0=20,故乙的得分极差比丁的得分极差小,故错误;
选项C中,不清楚两题的具体分值是否相同,所以不能通过平均分判断这4位同
学第4题相关知识一定比第2题相关知识掌握的好,故错误;
选项D中,第3题得分的平均分为=10,
故方差为
=12.5,
第5题得分的平均分为=10,
故方差为
=50,
所以对于这4位同学,第3题得分的方差比第5题得分的方差小.
7.我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车
次的正点率为 0.97,有 20 个车次的正点率为 0.98,有 10 个车次的正点率为
0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.
答案 0.98
解析 经停该站高铁列车所有车次的平均正点率的估计值为
x==0.98.
8.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组
依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该
班的学生人数是____________.
答案 50
解析 由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.
∴该班学生人数n==50.
9.若样本数据x ,x ,…,x 的标准差为8,则数据2x -1,2x -1,…,2x -1
1 2 10 1 2 10
的标准差为________.答案 16
解析 依题意,x ,x ,x ,…,x 的方差s2=64.则数据2x -1,2x -1,…,
1 2 3 10 1 2
2x -1的方差为22s2=22×64,所以其标准差为=2×8=16.
10
10.(2022·哈尔滨调研节选改编)某城市交通部门为了对该城市共享单车加强监管,
随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这
100人根据其满意度评分值(百分制)按照[50,60),[60,70),…,[90,100]分成
5组,制成如图所示的频率分布直方图.
(1)求图中x的值;
(2)估计这组数据的众数、平均数和中位数.
解 (1)由频率分布直方图得
(0.005+x+0.035+0.030+0.010)×10=1,解得x=0.020.
(2)因为最高小长方形中点的横坐标为75,
所以估计这组数据的众数为75.
估计这组数据的平均数为
x = 55×0.005×10 + 65×0.020×10 + 75×0.035×10 + 85×0.030×10 +
95×0.010×10=77.
满意度评分值在[50,70)内的频率为(0.005+0.020)×10=0.25,满意度评分值在
[70,80)内的频率为0.035×10=0.35,
∴中位数为70+×10=.
11.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产
品的某项指标有无提高,用一台旧设备和一台新设备各生产了 10件产品,得到
各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别
记为s和s.
(1)求x,y,s,s;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-
x≥2,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认
为有显著提高).
解 (1)由表格中的数据易得:
x=+10.0=10.0,
y=+10.0=10.3,
s=×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-
10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,
s=×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+
2×(10.5-10.3)2+(10.6-10.3)2]=0.04.
(2)由(1)中数据可得y-x=10.3-10.0=0.3,
而2==,
显然有y-x>2成立,
所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.
12.(2021·绵阳诊断)对全班45名同学的数学成绩进行统计,得到平均数为80,方
差为25,现发现数据收集时有两个错误,其中一个95分记录成了75分,另一个
60分记录成了80分.纠正数据后重新计算,得到平均数为x,方差为s2,则( )
A.x=80,s2<25 B.x=80,s2=25
C.x=80,s2>25 D.x<80,s2<25
答案 C
解析 由95+60=75+80知,这组数据的总和不变,
所以在对错误的数据进行更正后,重新求得样本的平均数不变,
即x=80,
(95-80)2+(60-80)2>(75-80)2+(80-80)2,
所以数据的波动变大了,即s2>25.13.已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间
一个小矩形的面积等于其余(n-1)个小矩形面积和的,则该组的频数为________.
答案 50
解析 设除中间一个小矩形外的(n-1)个小矩形面积的和为p,
则中间一个小矩形面积为p,p+p=1,p=,
则中间一个小矩形的面积等于p=,200×=50,即该组的频数为50.
14.从某企业生产的某种产品中抽取 100件,测量这些产品的一项质量指标值,
由测量结果得如下频数分布表:
质量指
[75,85) [85,95) [95,105) [105,115) [115,125]
标值分组
频数 6 26 38 22 8
(1)作出这些数据的频率分布直方图:
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点
值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值
不低于95的产品至少要占全部产品80%的规定?
解 (1)样本数据的频率分布直方图如图所示:(2)质量指标值的样本平均数为
x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不
低于95的产品至少要占全部产品80%”的规定.