文档内容
强化训练 11 统计中的综合问题
1.为确保食品安全,某市质检部门检查了1 000袋方便面的质量,抽查总量的2%,在这个
问题中,下列说法正确的是( )
A.总体是指这1 000袋方便面
B.个体是1袋方便面
C.样本是按2%抽取的20袋方便面
D.样本容量为20
答案 D
解析 总体是指这1 000袋方便面的质量,A中说法错误;个体是指1袋方便面的质量,B
中说法错误;样本是指按照2%抽取的20袋方便面的质量,C中说法错误;样本容量为20,
D中说法正确.
2.总体由编号为01,02,…,39,40的40个个体组成.利用下面的随机数表选取5个个体,
选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选
出来的第5个个体的编号为( )
50 44 66 44 21 66 06 58 05 62 61 65 54 35 02 42 35 48 96 32
14 52 41 52 48 22 66 22 15 86 26 63 75 41 99 58 42 36 72 24
58 37 52 18 51 03 37 18 39 11
A.23 B.21 C.35 D.32
答案 B
解析 随机数表第1行的第6列和第7列数字为6,4,所以从这两个数字开始,由左向右依
次选取两个数字如下,64,42,16,60,65,80,56,26,16,55,43,50,24,23,54,89,63,21,45,…,其中落
在编号01,02,…,39,40内的有16,26,24,23,21,…,故第5个编号为21.
3.设样本数据x ,x ,x ,…,x ,x 的平均数和方差分别为2和8,若y=2x+m(m为非
1 2 3 19 20 i i
零常数,i=1,2,3,…,19,20),则y,y,y,…,y ,y 的平均数和标准差为( )
1 2 3 19 20
A.2+m,32 B.4+m,4
C.2+m,4 D.4+m,32
答案 B
解析 设样本数据x的平均数为,方差为s2,标准差为s,则新样本y=2x+m的平均数为2
i i i
+m,方差为22s2,标准差为2s,所以=2+m=4+m,s2=8,所以标准差为s=2,所以2s
=2×2=4.
4.为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的 1 000人,其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示.若将
直方图中分组区间的中点值设为解释变量x(分钟),这个区间上的人数为y(人),易见两变量
x,y线性相关,那么一定在其线性回归直线上的点为( )
A.(1.5,0.10) B.(2.5,0.25)
C.(2.5,250) D.(3,300)
答案 C
解析 由频率分布直方图可知,第一个区间中点坐标,x =1.0,y =0.10×1 000=100,第二
1 1
个区间中点坐标,x =2.0,y =0.21×1 000=210,第三个区间中点坐标,x =3.0,y =
2 2 3 3
0.30×1 000=300,第四个区间中点坐标,x =4.0,y =0.39×1 000=390,则=(x +x +x
4 4 1 2 3
+x)=2.5,=(y+y+y+y)=250,则一定在其线性回归直线上的点为(,)=(2.5,250).
4 1 2 3 4
5.(多选)每年的台风都对泉州地区的渔业造成较大的经济损失.某保险公司为此开发了针
对渔船的险种,并将投保的渔船分为Ⅰ,Ⅱ两类,两类渔船的比例如图所示.经统计,2019
年Ⅰ,Ⅱ两类渔船的台风遭损率分别为15%和5%.2020年初,在修复遭损船只的基础上,
对Ⅰ类渔船中的20%进一步改造.保险公司预估这些经过改造的渔船2020年的台风遭损率
将降为3%,而其他渔船的台风遭损率不变.假设投保的渔船不变,则下列叙述中错误的是(
)
A.2019年投保的渔船的台风遭损率为10%
B.2019年所有因台风遭损的投保的渔船中,Ⅰ类渔船所占的比例不超过80%
C.预估2020年Ⅰ类渔船的台风遭损率会小于Ⅱ类渔船的台风遭损率的两倍
D.预估2020年经过进一步改造的渔船因台风遭损的数量少于Ⅱ类渔船因台风遭损的数量
答案 ABC
解析 设全体投保的渔船为t艘.2019年投保的渔船的台风遭损率为60%·15%+40%·5%=
11%,故A错;2019年所有因台风遭损的投保的渔船中,Ⅰ类渔船所占的比例为=>,故B
错;预估2020年Ⅰ类渔船的台风遭损率为20%·3%+80%·15%=12.6%>2×5%,故C错;
预估2020年经过进一步改造的渔船因台风遭损的数量t·60%·20%·3%少于Ⅱ类渔船因台风遭
损的数量t·40%·5%,故D正确.6.(多选)某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元) 2 3 4 5 6
销售额y(万元) 19 25 34 38 44
根据上表可得线性回归方程为y=6.3x+a,下列说法错误的是( )
A.回归直线y=6.3x+a必经过样本点(2,19),(6,44)
B.这组数据的样本点中心(,)未必在回归直线y=6.3x+a上
C.回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元
D.据此模型预报广告费用为7万元时销售额为50.9万元
答案 ABC
解析 回归直线y=6.3x+a,不一定经过任何一个样本点,故A错;由最小二乘法可知,这
组数据的样本点中心(,)一定在回归直线y=6.3x+a上,故B错;回归系数6.3的含义是广
告费用每增加1万元,预测销售额增加6.3万元,故C错;=(2+3+4+5+6)=4,=(19+
25+34+38+44)=32,将(4,32)代入y=6.3x+a可得a=6.8,则回归方程为y=6.3x+6.8,当
x=7时,y=6.3×7+6.8=50.9,故D正确.
7.登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气
温,并制作了对照表:
气温x(℃) 18 13 10 -1
山高y(km) 24 34 38 64
由表中数据,得到线性回归方程y=-2x+a(a∈R),由此估计出山高为72(km)处的气温为
________ ℃.
答案 -6
解析 由题意可得=10,=40,所以a=+2=40+2×10=60,所以y=-2x+60,当y=72
时,-2x+60=72,解得x=-6.
8.检测600个某产品的质量(单位:g),得到的频率分布直方图中,前三组的长方形的高度
成等差数列,后三组所对应的长方形的高度成公比为 0.5的等比数列,已知检测的质量在
100.5~105.5之间的产品数为150,则质量在115.5~120.5的长方形高度为________.
答案
解析 由题意知,产品质量在100.5~105.5之间的频率为=,则前3个矩形的面积和为,后
两个矩形的面积和为.设中间矩形的面积为x,则后两个矩形的面积为x,x,则x+x=,所
以x=,最后一个矩形的面积为,所以长方形的高度为.9.已知一组数据10,5,4,2,2,2,x,且这组数据的平均数与众数的和是中位数的2倍,则x所
有可能的取值为________.
答案 -11或3或17
解析 由题意可得这组数据的平均数为=,
众数为2,若x≤2,可得+2=4,可得x=-11;
若2≤x≤4,则中位数为x,可得2x=+2,可得x=3;
若x≥4,则中位数为4,可得2×4=+2,可得x=17.
10.某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,40岁以上
调查了50人,不高于40岁调查了50人,所得数据制成如下列联表:
不喜欢西班牙队 喜欢西班牙队 总计
40岁以上 p q 50
不高于40岁 15 35 50
总计 a b 100
已知工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为,则有超过
________的把握认为年龄与西班牙队的被喜欢程度有关.
参考公式与临界值表:K2=.
P(K2≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
0
答案 95%
解析 设“从所有人中任意抽取一个取到喜欢西班牙队的人”为事件A,
由已知得P(A)==,
所以p=25,q=25,a=40,b=60,
K2==≈4.167>3.841,
故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关.
11.成都是全国闻名的旅游城市,有许多很有特色的旅游景区.某景区为了提升服务品质,
对过去100天每天的游客数进行了统计分析,发现这100天每天的游客数都没有超出八千人,
统计结果见下面的频率分布直方图:
(1)估计该景区每天游客数的中位数和平均数;(2)为了研究每天的游客数是否和当天的最高气温有关,从这一百天中随机抽取了5天,统
计出这5天的游客数(千人)分别为0.8,3.7,5.1,5.6,6.8,已知这 5天的最高气温(℃)依次为
8,18,22,24,28.
(ⅰ)根据以上数据,求游客数y关于当天最高气温x的线性回归方程(系数保留一位小数);
(ⅱ)根据(ⅰ)中的回归方程,估计该景区这100天中最高气温在20~26 ℃内的天数(保留整
数).
参考公式:由最小二乘法所得回归直线的方程是y=bx+a;
其中,b== ,a=-b.
参考数据:(x-)(y-)=70,(x-)2=232.
i i i
解 (1)左边三个矩形的面积之和为0.32,左边四个矩形的面积之和大于0.5,故中位数在第
四个矩形中,
所以中位数为3+×1=3.75.
平均数为0.5×0.07+1.5×0.09+2.5×0.16+3.5×0.24+4.5×0.18+5.5×0.14+6.5×0.07+
7.5×0.05=3.82,
所以,该景区这一百天中每天游客数的中位数约为3 750人,平均数约为3 820人.
(2)(ⅰ)=20,=4.4,b=≈0.3,a=-b=4.4-0.3×20=-1.6,
所以y=0.3x-1.6.
(ⅱ)当最高气温在20~26 ℃内时,
当x=20时,y=0.3×20-1.6=4.4;
当x=26时,y=0.3×26-1.6=6.2.
根据y=0.3x-1.6得游客数在4.4~6.2内,
直方图中这个范围内方块的面积为(5-4.4)×0.18+0.14+(6.2-6)×0.07=0.262,
天数为0.262×100≈26,
所以,这100天中最高气温在20~26 ℃内的天数约为26天.
12.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应
或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期.各种传染疾病的潜伏期不同,数
小时、数天、甚至数月不等.某市疾病预防控制中心统计了该市200名传染病患者的相关信
息,得到如下表格:
潜伏期(单位:天) [0,2] (2,4] (4,6] (6,8] (8,10] (10,12] (12,14]
人数 17 43 60 50 26 3 1
(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据
将如下列联表补充完整,并根据列联表判断是否有99%的把握认为该传染病的潜伏期与患
者年龄有关.
潜伏期≤6天 潜伏期>6天 总计50岁以上(含50岁) 100
50岁以下 55
总计 200
(2)将200名患者的潜伏期超过6天的频率视为该市每名患者潜伏期超过6天发生的概率,每
名患者的潜伏期是否超过6天相互独立.为了深入研究,该市疾病预防控制中心随机调查了
该地区30名患者,其中潜伏期超过6天的人数为X,求随机变量X的均值和方差.
附:
P(K2≥k) 0.05 0.025 0.010
0
k 3.841 5.024 6.635
0
K2=,其中n=a+b+c+d.
解 (1)由题意得列联表:
潜伏期≤6天 潜伏期>6天 总计
50岁以上(含50岁) 75 25 100
50岁以下 45 55 100
总计 120 80 200
由上表可得K2==18.75>6.635,
所以有99%的把握认为该传染病的潜伏期与患者年龄有关.
(2)由题意可知,一名患者潜伏期超过6天的概率为P==,
随机变量服从X~B,
所以E(X)=30×=12.
D(X)=30××=.
13.如图是2020年2月15日至3月2日武汉市新冠肺炎新增确诊病例的折线统计图.则下
列说法不正确的是( )
A.武汉市新冠肺炎疫情防控取得了阶段性的成果,但防控要求不能降低
B.2020年2月19日武汉市新增新冠肺炎确诊病例大幅下降至三位数C.2020年2月15日到3月2日武汉市新冠肺炎新增确诊病例最多的一天比最少的一天多
1 549人
D.2020年2月19日至3月2日武汉市新增新冠肺炎确诊病例低于400人的有8天
答案 C
解析 由折线图数据分析得知ABD正确,1 690-111=1 579,故C不正确.
14.邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城 5家商场的
某件商品在7月15号一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间
的一组数据如下表所示:
售价x 8.5 9 m 11 11.5
销售量y 12 n 6 7 5
已知销售量y与售价x之间有较强的线性相关关系,其线性回归方程是y=-3.2x+40,且m
+n=20,则其中的m=________.
答案 10
解析 依题意得=,=,
代入线性回归方程得=-3.2×+40,①
根据题意知m+n=20,②
解①②组成的方程组得m=n=10.
15.已知一组数据丢失了其中一个,另外六个数据分别是10,8,8,11,16,8,若这组数据的平均
数、中位数、众数依次成等差数列,则丢失数据的所有可能值的和为( )
A.12 B.20 C.25 D.27
答案 D
解析 设这个数字是x,则平均数为,众数是8,
若x≤8,则中位数为8,此时x=-5,
若8E(Y),所以该县城选择购买一台甲款垃圾处理机器更划算.