文档内容
必刷大题 18 统 计
1.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这
200名学生的某次数学考试成绩(满分100分),得到了样本的频率分布直方图(如图).
一般学校认为成绩大于等于80分的学生为优秀.
(1)根据频率分布直方图,估计3 000名学生在该次数学考试中成绩优秀的学生数;
(2)依据样本的频率分布直方图,估计总体成绩的众数和平均数(每组数据以所在区间的中点
值为代表).
解 (1)由样本的频率分布直方图可知,
在该次数学考试中成绩优秀的频率是
(0.020+0.008)×10=0.28,
则估计3 000名学生在该次数学考试中成绩优秀的学生有3 000×0.28=840(名).
(2)由样本的频率分布直方图可知,估计总体成绩的众数为=75,
平均数为0.002×10×35+0.006×10×45+0.012×10×55+0.024×10×65+0.028×10×75
+0.020×10×85+0.008×10×95=71.2.
所以估计总体成绩的众数为75,平均数为71.2.
2.(2024·海南模拟)实验发现,猴痘病毒与天花病毒有共同抗原,两者之间有很强的血清交
叉反应和交叉免疫,故猴痘流行的时候可接种牛痘疫苗预防.某医学研究机构对 120个接种
与未接种牛痘疫苗的密切接触者进行医学观察后,统计了感染病毒情况,得到下面的 2×2
列联表:
感染猴痘病毒 未感染猴痘病毒
未接种牛痘疫苗 20 30
已接种牛痘疫苗 10 60
(1)根据上表,分别估计在未接种牛痘疫苗和已接种牛痘疫苗的情况下,感染猴痘病毒的概
率;
(2)是否有99%的把握认为密切接触者未感染猴痘病毒与接种牛痘疫苗有关?
附:χ2=,n=a+b+c+d.α=P(χ2≥k) 0.1 0.05 0.01
k 2.706 3.841 6.635
解 (1)由题意可知,估计未接种牛痘疫苗者感染猴痘病毒的概率为P==,
1
已接种牛痘疫苗者感染猴痘病毒的概率为
P==.
2
(2)列联表如表所示:
感染猴痘病毒 未感染猴痘病毒 总计
未接种牛痘疫苗 20 30 50
已接种牛痘疫苗 10 60 70
总计 30 90 120
χ2=≈10.286,
所以有99%的把握认为密切接触者未感染猴痘病毒与接种牛痘疫苗有关.
3.(2024·沧州模拟)“绿水青山就是金山银山”的口号已经深入民心,人们对环境的保护意
识日益增强,质检部门也会不时地对一些企业的生产污染情况进行排查,并作出相应的处理,
本次排查了30个企业,共查出510个污染点,其中造成污染点前10名的企业分别造成的污
染点数为58,36,36,35,33,32,28,26,24,22.
(1)求这30个企业造成污染点的80%分位数;
(2)已知造成污染点前10名的企业的方差为92.4,其他20个企业造成污染点的方差为44.7,
求这30个企业造成污染点的总体方差.
解 (1)根据定义可得,此30个数据从小到大排列,且30×80%=24,
所以这30个企业造成污染的80%分位数是第24个数据与第25个数据的平均数,即前10名
中第六名与第七名数据的平均数,即=30.
(2)按照企业造成的污染点数从小到大排列,记为x,x,…,x ,其平均数记为,方差记为
1 2 20
s;
把剩下10个数据记为y,y,…,y ,其平均数记为,方差记为s;
1 2 10
把总样本数据的平均数记为,方差记为s2.
由题意可知,==17,
=×(58+36+36+35+33+32+28+26+24+22)=×330=33,
则=×(510-330)=9,
由题知s=44.7,s=92.4,
s2=×{20[s+(-)2]+10[s+(-)2]}
代入数据可得s2=×{20×[44.7+(9-17)2]+10×[92.4+(33-17)2]}=188.6,所以这30个企业造成污染点的总体方差为188.6.
4.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改
电用户大幅度增加.图1所示的条形图反映了某省某年1~7月份煤改气、煤改电的用户数
量.
图1
图2
(1)在图2给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图
和相关系数说明y与t之间具有线性相关性;
(2)建立y关于t的回归直线方程(系数精确到0.01),预测该年11月份该省煤改气、煤改电的
用户数量.
参考公式:对于一组数据(u,v),(u,v),…,(u,v),其回归直线方程v=βu+α的斜率
1 1 2 2 n n
和截距的最小二乘估计公式分别为β==,α=-β.
相关系数r=.
参考数据:=9.24,y=39.75,
i i i
≈0.53,≈2.646.
解 (1)作出散点图如图所示.
由条形图数据和参考数据得,
=4,(t-)2=28,≈0.53,
i
(t-)(y-)=y-=39.75-4×9.24=2.79,
i i i i i
所以r≈≈0.99.y与t的相关系数近似为0.99,说明y与t的线性相关性相当高,
从而可以用线性回归模型拟合y与t的关系.
(2)由==1.32,
又由(1)得b==≈0.10,
a=-b≈1.32-0.10×4=0.92,
所以y关于t的回归直线方程为y=0.92+0.10t.
将t=11代入回归直线方程得y=0.92+0.10×11=2.02.
所以预测该年11月份该省煤改气、煤改电的用户数量达到2.02万户.
5.(2023·福州模拟)国内某大学想了解本校学生的运动状况,采用简单随机抽样的方法从全
校学生中抽取2 000人,调查他们平均每天运动的时间(单位:小时),统计表明该校学生平
均每天运动的时间范围是[0,3],记平均每天运动的时间不少于2小时的学生为“运动达人”,
少于2小时的学生为“非运动达人”.整理分析数据得到的列联表如表所示(单位:人):
运动时间
性别 总计
“运动达人” “非运动达人”
男生 1 100 300 1 400
女生 400 200 600
总计 1 500 500 2 000
根据列联表中的数据,算得χ2≈31.746,则有99.9%的把握认为运动时间与性别有关.
(1)如果将表中所有数据都缩小为原来的,在相同的检验标准下,再用独立性检验推断运动
时间与性别之间的关联性,结论还一样吗?请用统计语言解释其中的原因;
(2)采用按样本性别分层抽样的方法抽取20名同学,并统计每位同学的运动时间,统计数据
为男生运动时间的平均数为2.5,方差为1;女生运动时间的平均数为1.5,方差为0.5,求
这20名同学运动时间的均值与方差.
附:χ2=,其中n=a+b+c+d.
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
解 (1)方法一 改变数据之后的列联表为
运动时间
性别 总计
“运动达人” “非运动达人”
男生 110 30 140
女生 40 20 60
总计 150 50 200则调整后的χ2==≈3.175.
所以没有99.9%的把握认为运动时间与性别有关.
与之前结论不一样,
原因是每个数据都缩小为原来的,相当于样本容量缩小为原来的,导致推断结论发生了变化,
当样本容量越大,用样本估计总体的准确性会越高.
方法二 调整后的χ2=
=·=≈3.175,
所以没有99.9%的把握认为运动时间与性别有关.
与之前结论不一样,原因是每个数据都缩小为原来的,相当于样本容量缩小为原来的,导致
推断结论发生了变化,
当样本容量越大,用样本估计总体的准确性会越高.
(2)男生抽取×20=14(人),女生抽取×20=6(人),
由已知男生运动时间的平均数为=2.5,样本方差为s=1;女生运动时间的平均数为=1.5,
样本方差为s=0.5.
记样本均值为,则==2.2,
记样本方差为s2,则s2==1.06,
所以这20名同学运动时间的均值为2.2,方差为1.06.
6.在国家大力发展新能源汽车产业的政策下,我国新能源汽车的产销量高速增长.已知某
地区2015年年底到2022年年底新能源汽车保有量的数据统计表如下:
年份(年) 2015 2016 2017 2018 2019 2020 2021 2022
年份代码x 1 2 3 4 5 6 7 8
保有量y/千辆 1.95 2.92 4.38 6.58 9.87 15.00 22.50 33.70
(1)根据统计表中的数据画出散点图(如图),请判断y=bx+a与y=ecx+d哪一个更适合作为y
关于x的回归模型(给出判断即可,不必说明理由),并根据你的判断结果建立y关于x的回
归方程;
(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下
降的百分比相同.若2022年年底该地区传统能源汽车保有量为500千辆,预计到2027年年底传统能源汽车保有量将下降10%.试估计到哪一年年底新能源汽车保有量将超过传统能源
汽车保有量.
参考公式:对于一组数据(u ,v),(u ,v),…,(u ,v),其回归直线方程v=βu+α的斜率
1 1 2 2 n n
和截距的最小二乘估计公式分别为β==,α=-β.
参考数据:=12.1,=2.1,=204,y=613.7,t=92.4,其中t=ln y,lg 2≈0.30,lg
i i ii i i
3≈0.48,lg e≈0.43.
解 (1)根据散点图显示的该地区新能源汽车保有量的增长趋势知,应选择的函数模型是y=
ecx+d,因为t=ln y,则t=cx+d,
因为=×(1+2+3+4+5+6+7+8)=4.5,
=204,t=92.4,=2.1,
ii
所以c====0.4,
d=-c=2.1-0.4×4.5=0.3,
所以t=0.4x+0.3,
即y=e0.4x+0.3.
(2)设传统能源汽车保有量每年下降的百分比为r,依题意得,500(1-r)5=500(1-10%),解
得1-r= ,
设从2022年底起经过x年后的传统能源汽车保有量为y千辆,
则有y=500(1-r)x= ,
设从2022年底起经过x年后新能源汽车的保有量将超过传统能源汽车保有量,
则有e0.4(x+8)+0.3> ,
所以(0.4x+3.5)lg e>3-lg 2+0.2x(2lg 3-1),
解得x>≈6.64,
故从2022年年底起经过7年后,即2029年年底新能源汽车的保有量将超过传统能源汽车保
有量.