文档内容
考点巩固卷 23 统计与统计案例(十大考点)
考点01 随机抽样
1.已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原
因,用分层抽样的方法抽取 的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
资料整理【淘宝店铺:向阳百分百】A.100,10 B.100,20 C.200,10 D.200,20
【答案】D
【分析】由抽取 的学生求出样本容量,再计算出高中生抽取的人数,结合近视率计算出抽取的高中生
近视人数;
【详解】依题意可得样本容量为 ,
其中高中生抽取 人,
因为样本中高中生的近视率为 ,所以抽取的高中生近视人数为 人;
故选:D
2.某高中共有学生2000人,其中高一和高二各有800人,现采用分层抽样的方法抽取容量为25的样本,
那么高二抽取的人数为 .
【答案】
【分析】根据分层抽样的定义和计算方法,求得抽样比,即可求解.
【详解】由题意,高二人数占总人数的比例为 ,所以高二抽取的人数为 .
故答案为: .
3.总体由编号为 、 、 、 、 的 个个体组成,利用随机数表从中抽取 个个体,下面提供随
机数表的第 行到第 行:
若从表中第 行第 列开始向右依次读取,则抽取的第 个个体的编号是 .
【答案】
【分析】根据随机数表法可得出结果.
【详解】由题意,结合随机数表法可知,从中抽取 个个体的编号依次为: 、 、 、 、 ,
故答案为: .
4.一汽车厂生产 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:
辆):
轿车
轿车 轿车
舒适
型
资料整理【淘宝店铺:向阳百分百】标准
型
按类型分层抽样的方法在这个月生产的轿车中抽取 辆,其中有 类轿车 辆.
(1)求抽取的轿车中, 类轿车的数量;
(2)求 的值;
(3)用分层抽样的方法在 类轿车中抽取一个容量为 的样本.将该样本看成一个总体,从中任取 辆,求
至少有 辆舒适型轿车的概率.
【答案】(1)
(2)
(3)
【分析】(1)根据抽样比可求得 类轿车数量;
(2)确定 类轿车数量后,结合抽样比可构造方程求得 的值;
(3)根据分层抽样原则可求得样本中舒适型和标准型的数量,采用列举法确定基本事件个数,由古典概
型概率公式可求得结果.
【详解】(1)根据分层抽样原则知: 类轿车的数量为 .
(2)由(1)得:抽取的 类轿车的数量为 ,
根据分层抽样原则知: ,解得: .
(3)根据分层抽样原则可知:抽取的 个样本中,舒适型有 辆,记为 ;标准型有
辆,记为 ;
从 个样本中任意抽取 个,则有 , , , , , , , , ,
,共 个基本事件;
其中至少有 个舒适型的基本事件有: , , , , , , ,共 个基
本事件;
所求概率 .
资料整理【淘宝店铺:向阳百分百】考点02 统计图表
5.2022年11月,国内猪肉、鸡蛋、鲜果、禽肉、粮食、食用油、鲜菜价格同比(与去年同期相比)的变化情况
如图所示,则下列说法正确的是( )
A.猪肉、鸡蛋、鲜果、禽肉、粮食、食用油这6种食品中,食用油价格同比涨幅最小
B.猪肉价格同比涨幅超过禽肉价格同比涨幅的5倍
C.去年11月鲜菜价格要比今年11月低
D.这7种食品价格同比涨幅的平均值超过
【答案】D
【分析】根据变化情况,逐一核对选项,即可判断.
【详解】由图可知,猪肉、鸡蛋、鲜果、禽肉、粮食、食用油这6种食品中,粮食价格同比涨幅最小,所以A
错误.
,所以B错误.
去年11月鲜菜价格要比今年11月高,所以C错误.
因为
,所以D正确.
故选:D
6.如图为国家统计局于2023年1月20日发布的2016-2022年全国R&D经费总量与R&D经费与
GDP之比的数据图表,则( )
资料整理【淘宝店铺:向阳百分百】A.R&D经费总量的平均数超过23000亿元
B.R&D经费总量的中位数为19678亿元
C.R&D经费与GDP之比的极差为0.45%
D.R&D经费与GDP之比增幅最大的是2021年到2022年
【答案】C
【分析】根据数据图表逐项判断可得答案.
【详解】对于选项A,R&D经费总量的平均数为
,
所以A错误;
对于选项B,R&D经费总量的中位数为22144亿元,所以B错误;
对于选项C,R&D经费与 之比的极差为 ,所以C正确;
对于选项D,R&D经费与GDP之比增幅最大的是2019年到2020年,所以D错误.
故选:C.
7.某企业不断自主创新提升技术水平,积极调整企业旗下的甲、乙、丙、丁、戊等 种系列产品的结构比
例,近年来取得了显著效果.据悉该企业 年 种系列产品年总收入是 年的 倍,其中 种系列产品
的年收入构成比例如图所示.则下列说法错误的是( )
资料整理【淘宝店铺:向阳百分百】A. 年甲系列产品收入比 年的多
B. 年乙和丙系列产品收入之和比 年的企业年总收入还多
C. 年丁系列产品收入是 年丁系列产品收入的
D. 年戊系列产品收入是 年戊系列产品收入的 倍
【答案】C
【分析】利用已知条件可分别得出 年和 年 种系列产品所占总收入的比例,结合该企业 年
种系列产品年总收入是 年的 倍,逐一检验选项即可得出答案.
【详解】对于A: 年甲系列产品收入占了总收入的 , 年甲系列产品收入占了总收入的 ,
而该企业 年 种系列产品年总收入是 年的 倍,故 年甲系列产品收入比 年的多,故A
选项不符题意;
对于B: 年乙和丙系列产品收入之和占了总收入的 ,该企业 年 种系列产品年总收入是
年的 倍,
故 年乙和丙系列产品收入之和比 年的企业年总收入还多,故B选项不符题意;
对于C: 年丁系列产品收入占了总收入的 , 年丁系列产品收入占了总收入的 ,而该企业
年 种系列产品年总收入是 年的 倍,故 年丁系列产品收入是 年丁系列产品收入的 ,
故C选项符合题意;
对于D: 年戊系列产品收入占了总收入的 , 年戊系列产品收入占了总收入的 ,而该企
业 年 种系列产品年总收入是 年的 倍,故 年戊系列产品收入是 年戊系列产品收入的
倍,故D选项不符题意.
故选:C.
8.Keep是一款具有社交属性的健身APP,致力于提供健身教学、跑步、骑行、交友及健身饮食指导、装
备购买等一站式运动解决方案.Keep可以让你随时随地进行锻炼,记录你每天的训练进程.不仅如此,它
资料整理【淘宝店铺:向阳百分百】还可以根据不同人的体质,制定不同的健身计划.小张根据Keep记录的2022年1月至2022年11月期间
每月跑步的里程(单位:十公里)数据整理并绘制了下面的折线图.根据该折线图,下列说法错误的是(
)
A.月跑步里程逐月增加
B.月跑步里程最大值出现在10月
C.月跑步里程的中位数为5月份对应的里程数
D.1月至5月的月跑步里程相对于6月至11月波动性更小
【答案】A
【分析】根据折线图,结合选项即可逐一求解.
【详解】由折线图可知,月跑步里程不是逐月增加的,故A不正确;
月跑步里程最大值出现在10月,故B正确;
月跑步里程数从小到大排列分别是:2月,8月,3月,4月,1月,5月,7月,6月,11月,9月,10月,
故5月份对应的里程数为中位数,故C正确;
1月到5月的月跑步里程相对于6月至11月波动性更小,变化比较平稳,故D正确.
故选:A.
9.(多选)《黄帝内经》中十二时辰养生法认为:子时的睡眠对一天至关重要(子时是指23点到次日凌
晨1点).相关数据表明,入睡时间越晚,沉睡时间越少,睡眠指数也就越低.根据某次的抽样数据,对
早睡群体和晚睡群体的睡眠指数统计如下图,则下列说法错误的是( )
A.在睡眠指数 的人群中,早睡人数多于晚睡人数
资料整理【淘宝店铺:向阳百分百】B.早睡人群睡眠指数主要集中在
C.早睡人群睡眠指数的极差比晚睡人群睡眠指数的极差小
D.晚睡人群睡眠指数主要集中在
【答案】ACD
【分析】根据统计图表一一判断即可.
【详解】由图知,每一组中的早睡人群占比与晚睡人群占比都是以早睡与晚睡各自的总人数为基数的,
所以每一组中的早睡人数与晚睡人数不能从所占的百分比来判断,故选项A错误;
早睡人群睡眠指数主要集中在 ,晚睡人群睡眠指数主要集中在 ,选项B正确,选项D错误;
早睡人群睡眠指数的极差和晚睡人群睡眠指数的极差的大小无法确定,故选项C错误.
故选:ACD.
10.(多选)2022年的夏季,全国多地迎来罕见极端高温天气.某课外小组通过当地气象部门统计了当地
七月份前20天每天的最高气温与最低气温,得到如下图表,则根据图表,下列判断正确的是( )
A.七月份前20天最低气温的中位数低于25℃
B.七月份前20天中最高气温的极差大于最低气温的极差
C.七月份前20天最高气温的平均数高于40℃
D.七月份前10天(1—10日)最高气温的方差大于最低气温的方差
【答案】BD
【分析】根据折线统计图一一分析即可.
【详解】七月份前20天中,最低气温低于 ℃的天数不超过9天,故中位数不可能低于 ℃,故 A错误;
最高气温的最大值大于 ℃,最小值低于 ℃,而最低气温的最大值小于 ℃,最小值接近 ℃,
故最高气温的极差大于最低气温的极差,故B正确;
最高气温超过 ℃的天数不超过5天,且最大值不超过 ℃,故平均数不可能高于 ℃,故C错误;
资料整理【淘宝店铺:向阳百分百】前10天中,最低气温的分布更集中,故最高气温的方差大于最低气温的方差,故D正确.
故选:BD
考点03 频率分布直方图
11.某校高二(10)班50名学生的身高(单位: )数据均在区间 ,其频率分布直方图(将频
率视为概率)如图所示,则下列说法正确的是( )
A.
B.估计该班学生身高的中位数为
C.估计该班学生身高的平均值大于
D.估计该班学生身高不低于 的概率为0.4
【答案】D
【分析】对于A,根据频率和为1求解并判断选项;对于B,中位数就是频率分布直方图面积的一半所对
应的值,即中位数两边的小长方形面积和都是0.5;对于C,平均数为每个小长方形面积与小长方形中点横
坐标乘积之和;对于D,由频率分布直方图得到学生身高不低于 的频率,求其和即可判断.
【详解】对于A, ,解得 ,故A错误;
对于B,由频率分布直方图可得,前三个小矩形的面积之和为 ,
设该班学生身高的中位数为 ,所以 ,解得 ,故B错
误;
对于C,由频率分布直方图可得,身高的平均值
,故C错误;
对于D,由频率分布直方图可得,该班学生身高不低于 的频率为 ,
资料整理【淘宝店铺:向阳百分百】故该班学生身高不低于 的概率为0.4,故D正确.
故选:D.
12.(多选)为了向社会输送优秀毕业生,中等职业学校越来越重视学生的实际操作(简称实操)能力的
培养.中职生小王在对口工厂完成实操产品100件,质检人员测量其质量(单位:克),将所得数据分成
5组: .根据所得数据制成如图所示的频率分布直方图,其中质
量在 内的为优等品.对于这100件产品,下列说法正确的是( )
A.质量的平均数为99.7克(同一区间的平均数用区间中点值代替) B.优等品有45件
C.质量的众数在区间 内 D.质量的中位数在区间 内
【答案】ABD
【分析】根据频率分布直方图的性质,以及其数据特征估计值的计算,可得答案.
【详解】对于选项A,质量的平均数为
(克),选项A正确;
对于选项B,优等品有 件,选项B正确;
对于选项C,频率分布直方图上不能判断质量众数所在区间,质量众数不一定落在区间[98,100)内,所
以选项C错误;
对于选项D,质量在 内的有45件,质量在 内的有15件,质量在 内的有5件,
所以质量的中位数一定落在区间 内,所以选项D正确.
故选:ABD.
资料整理【淘宝店铺:向阳百分百】13.(多选)为了解某校高二年级学生数学学习的阶段性表现,年级组织了一次测试.已知此次考试共有
1000名学生参加,考试成绩的频率分布直方图如下(同一组中的数据用该组区间的中点值作代表),分数
不低于110分为优秀,则( )
A.频率分布直方图中的a的值为0.008
B.这次考试中优秀的学生有100人
C.这次考试成绩的众数约为100
D.这次考试的中位数约为95
【答案】ACD
【分析】根据频率分布直方图中面积之和为1可求解a,进而可求解中位数,众数等.
【详解】对于A, ,故A正确,
对于B,优秀的学生为 ,故B错误,
对于C,这次考试成绩的众数约为 ,故C正确,
对于D,设中位数为 ,则 ,故D正确,
故选:ACD
14.(多选)为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,现调
查了当地的100家中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,则下面结论正
确的是( ).
资料整理【淘宝店铺:向阳百分百】A.样本在区间 内的频数为18
B.如果规定年收入在300万元以内的企业才能享受减免税政策,估计有30%的当地中小型企业能享受
到减免税政策
C.样本的中位数小于350万元
D.可估计当地的中小型企业年收入的平均数超过400万元(同一组中的数据用该组区间的中点值为代
表)
【答案】AB
【分析】选项A、B,根据频率分布直方图的性质,面积代表频率,可得答案;
选项C,根据频率分布直方图的中位数估计值的计算公式,可得答案;
选项D,根据频率分布直方图的平均数估计值的计算公式,可得答案.
【详解】由图可得
样本在区间 内的频数为 ,故A正确;
年收入在300万元以内的企业频率为 ,故B正确;
则中位数在 之间,
设为 则 ,故C不正确;
年收入平均数超过 ,D不正确.
故选:AB.
15.(多选)为了提高学生的英语基础,某中学要求学生每天坚持一小时的听、说、读、写训练.为了调
查该校5000名高中学生每周平均参加英语训练时间的情况,某教师从高一、高二、高三三个年级学生中按
照3∶1∶1的比例分层抽样,收集了100名学生平均每周英语训练时间的样本数据(单位:h),整理后得
资料整理【淘宝店铺:向阳百分百】到如图所示的频率分布直方图,则下列说法中正确的有( )
A.估计该校高中学生平均每周英语训练时间不足4h的人数为1500人
B.估计该校高中学生平均每周英语训练时间不少于8h的人数所占百分比为22%
C.估计该校高中学生平均每周英语训练时间的中位数为5h
D.估计该校高中学生平均每周英语训练时间为5.84h
【答案】BD
【分析】对AB:分别计算相应矩形的面积即可判断;对C:验证中位数是否为5h即可;对D:根据频率
分布直方图计算平均数的方法求解.
【详解】对A:时间不足4h的人数为 人,故A错误;
对B:训练时间不少于8h的人数所占百分比为 ,故B正确;
对C:若英语训练时间的中位数为5h,而小于5h所占的百分比为 ,故英
语训练时间的中位数为5h错误;
对D:英语训练时间为 ,故D
正确.
故选:BD
16.某区为了解全区 名高二学生的体能素质情况,在全区高二学生中随机抽取了 名学生进行体
能测试,并将这 名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,这 名学
生平均成绩的估计值为 .
资料整理【淘宝店铺:向阳百分百】【答案】
【分析】根据所有矩形面积之和为 求出 的值,将每个矩形底边的中点值乘以对应矩形的面积,相加可得
这 名学生平均成绩.
【详解】由于频率分布直方图中所有矩形面积之和为 ,
可得 ,解得 ,
由频率分布直方图可知,这 名学生平均成绩的估计值为
分.
故答案为: .
考点04 均值及方差的性质
17.已知一组数据 的平均数为 ,标准差为 .若 的平均数与方差相等,
则 的最大值为( )
A. B. C. D.
【答案】A
【分析】利用平均数与方差的性质,结合二次函数的性质即可求解.
【详解】由题意可知, ,则 .
因为 ,
所以 ,解得 .
令
资料整理【淘宝店铺:向阳百分百】设 ,则 ,
从而 ,
由二次函数的性质知,对称轴为 ,开口向下,
所以 在 上单调递增,在 上单调递减,
当 时, 取得最大值为 .
故选:A.
18.(多选)若甲组样本数据 (数据各不相同)的平均数为3,乙组样本数据
的平均数为5,下列说错误的是( )
A. 的值不确定
B.乙组样本数据的方差为甲组样本数据方差的2倍
C.两组样本数据的极差可能相等
D.两组样本数据的中位数可能相等
【答案】ABC
【分析】由甲组平均数为 ,则乙组平均数为 ,解得 值,又乙组方差为甲组方差的 倍,可判
断选项AB,再利用极差与中位数定义判断CD项.
【详解】对选项A,由题意可知, ,故A错误;
对选项B,易知乙组样本数据的方差为甲组样本数据方差的 倍,故B错误;
对选项C,不妨设 ,
则甲组数据的极差为 ,
乙组数据的极差为 ,
又已知甲组数据各不相同,
所以两组样本数据的极差不相等,故C错误;
资料整理【淘宝店铺:向阳百分百】对选项D,设甲组样本数据的中位数为 ,
则乙组样本数据的中位数为 ,
当 时, ,
所以两组样本数据的中位数可能相等,故D正确.
故选:ABC.
19.(多选)有一组样本甲的数据 ,一组样本乙的数据 ,其中 为不完全相等
的正数,则下列说法正确的是( )
A.样本甲的极差一定小于样本乙的极差
B.样本甲的方差一定大于样本乙的方差
C.若样本甲的中位数是 ,则样本乙的中位数是
D.若样本甲的平均数是 ,则样本乙的平均数是
【答案】ACD
【分析】根据统计中的相关概念和性质运算求解.
【详解】不妨设样本甲的数据为 ,且 ,
则样本乙的数据为 ,且 ,
对于选项A:样本甲的极差为 ,样本乙的极差 ,
因为 ,即 ,
所以样本甲的极差一定小于样本乙的极差,故A正确;
对于选项B:记样本甲的方差为 ,则样本乙的方差为 ,
因为 ,即 ,
所以样本甲的方差一定小于样本乙的方差,故B错误;
对于选项C:因为样本甲的中位数是 ,
则样本乙的中位数是 ,故C正确;
对于选项D:若样本甲的平均数是 ,则样本乙的平均数是 ,故D正确;
故选:ACD.
资料整理【淘宝店铺:向阳百分百】20.(多选)统计学是源自对国家的资料进行分析,也就是“研究国家的科学”.一般认为其学理研究始
于希腊的亚里士多德时代,迄今已有两千三百多年的历史.在两千多年的发展过程中,将社会经济现象量
化的方法是近代统计学的重要特征.为此,统计学有了自己研究问题的参数,比如:均值、中位数、众数、
标准差.一组数据: ( )记其均值为m,中位数为k,方差为 ,则
( )
A.
B.
C.新数据: 的均值为m+2
D.新数据: 的方差为
【答案】CD
【分析】利用中位数的定义可判断A选项;举反例可判断B选项;利用均值和方差公式可判断CD选项.
【详解】对于A选项,因 ,
样本数据最中间的项为 和 ,
由中位数的定义可知, ,A错;
对于B,不妨令 ,
则 ,B错误;
对于C,数据 的均值为:
,C正确;
对于D,数据 的均值为:
资料整理【淘宝店铺:向阳百分百】,
其方差为 ,D对.
故选:CD
21.为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其
每天睡眠时间均值为9小时,方差为0.5,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为1,
则估计该地区中学生每天睡眠时间的方差为 .
【答案】
【分析】根据给定条件,求出该地区中学生每天睡眠时间的平均数,再利用分层抽样方差的计算方法求得
结果.
【详解】该地区中学生每天睡眠时间的平均数为:
(小时),
该地区中学生每天睡眠时间的方差为:
.
故答案为:
22.“绿水青山就是金山银山”的口号已经深入民心,人们对环境的保护意识日益增强,质检检测部门也
会不时地对一些企业的生产污染情况进行排查,并作出相应的处理,本次排查了30个企业,共查出510个
污染点,其中造成污染点前10名的企业分别造成的污染点数为58,36,36,35,33,32,28,26,24,
22.
(1)求这30个企业造成污染点的第80百分位数;
(2)已知造成污染点前10名的企业的方差为 ,其他20个企业造成污染点的方差为44.7,求这30个企业
造成污染点的总体方差.
【答案】(1)30
(2)188.6.
【分析】(1)根据百分位数的定义计算即可;
(2)首先求出总的平均数、前十名的平均数,然后可求出其他20个企业造成污染点的平均数,然后根据
公式计算出答案即可.
【详解】(1)根据定义可得,此30个数据从小到大排列, ,
资料整理【淘宝店铺:向阳百分百】所以这30个企业造成污染的第80百分位数是第24个数据与第25个数据的平均数,即 .
(2)按照企业造成的污染点数从小到大排列,记为 , ,... ,其平均数记为 ,方差记为 ;
把剩下10个数据记为 , ,... ,其平均数记为 ,方差记为 ;
把总样本数据的平均数记为 ,方差记为 .
由题意可知, ,
,
则 ,由题知 ,
代入数据可得
所以,这30个企业造成污染点的总体方差为188.6.
考点05 总体百分位数的估计
23.(多选)为了了解学生对于高中数学重要性的认识,进行了一个问卷调查.用分层随机抽样法从某校高
三年级2000名学生的问卷成绩(满分150分)中抽取一个容量为120的样本,将这120个学生的成绩分为
6组,绘制得到如图所示的频率分布直方图(每组数据以区间的中点值为代表),下列说法正确的是(
)
A.学生成绩的样本数据在 内的频率为0.015
B.学生成绩的样本数据的众数为100
资料整理【淘宝店铺:向阳百分百】C.学生成绩的样本数据的第75百分位数为118
D.根据样本可以估计全体高三学生问卷成绩在110分以上的学生为840名
【答案】BC
【分析】对于A,利用频率之和为1即可判断;对于BC,利用众数和百分位数的定义进行求解即可;对于
D,算出110分以上的学生频率,即可估计学生人数.
【详解】学生问卷成绩在 内的频率为 ,故
错误;
由图可得,学生问卷成绩的众数为 ,故B正确;
样本数据在 内的频率为 ,
样本数据在 内的频率为 ,
所以第75百分位数在区间 内,该数为 ,故C正确;
样本中110分以上的学生的频率为 ,
则全体高三学生问卷成绩110分以上学生为 名,故D错误.
故选:BC
24.(多选)2022年我国对外经济进口总值累计增长率统计数据如图所示,则( )
A.2022年我国对外经济进口总值逐月下降
B.2022年我国对外经济进口总值累计增长率在前6个月的方差大于后6个月的方差
C.2022年我国对外经济进口总值累计增长率的中位数为5.5%
D.2022年我国对外经济进口总值累计增长率的80%分位数为7.1%
【答案】BC
资料整理【淘宝店铺:向阳百分百】【分析】利用折线图的特点及方差的意义,结合中位数及第 百分位数的定义即可求解.
【详解】对于A ,2022年我国对外经济进口总值累计增长率逐月下降,并不能说明对外经济进口总值逐
月下降,故A不正确.
对于B,由图可知,2022我国对外经济进口总值累计增长率在前6个月的波动较大,故B正确.
对于C,将我国对外经济进口总值累计增长率从小到大排列,得中位数为 ,故C
正确.
对于D,将我国对外经济进口总值累计增长率从小到大排列,由 ,可知80%分位数为第10个
数据,即9.6%,故D不正确.
故选:BC.
25.(多选)今年春节档两部电影票房突破20亿大关,《满江红》不负众望,凭借喜剧元素和家国情怀,
以25.96亿票房成为档期内票房冠军,另一部科幻续作《流浪地球2》则成为最高口碑电影.下图是这两部
电影连续7天的日票房情况,则( )
A.《满江红》日票房平均数大于《流浪地球 日票房平均数
B.《满江红》日票房方差大于《流浪地球2》日票房方差
C.《满江红》日票房极差小于《流浪地球2》日票房极差
D.《满江红》日票房的第25百分位数小于《流浪地球2》日票房的第75百分位数
【答案】ABD
【分析】根据图表信息逐一判断即可.
【详解】由图表可得《满江红》日票房都大于《流浪地球 日票房,所以《满江红》日票房平均数大于
《流浪地球2》日票房平均数,A正确;
由图可得《满江红》日票房单日票房数据波动更大,《满江红》日票房方差大于《流浪地球2》日票房方
差,所以B正确.
《满江红》日票房极差大于《流浪地球 日票房极差,故C错误;
资料整理【淘宝店铺:向阳百分百】因为 ,《满江红》日票房的第25百分位数是从小到大排序第 个数,
因为 ,《流浪地球2》日票房的第75百分位数是从小到大排序第 个数,
《满江红》日票房的第25百分位数小于《流浪地球2》日票房的第75百分位数,所以D正确.
故选:ABD.
26.某学习小组共有20人,在一次数学测试中,得100分的有2人,得95分的有4人,得90分的有5人,
得85分的有3人,得80分的有5人,得75分的有1人,则这个学习小组成员该次数学测试成绩的第70百
分位数是 .
【答案】 /
【分析】将数据从小到大排列,结合百分位数的计算方法,即可求解.
【详解】根据题意,将20个数据从小到大排列:其中75分1个,80分5个,85分3个,90分5个,95分
4个,100分2个,
由 ,所以 百分位数是第14和15个数据的平均数,
所以 百分位数为 .
故答案为: .
27.军训中某人对目标靶进行8次射击,已知前7次射击分别命中7环、9环、7环、10环、8环、9环、6
环.若第8次射击结果不低于这8次射击环数的平均数且不高于这8次射击环数的75%分位数,则此人第8
次射击的结果可能是 环.(写出有一个符合题意的值即可)
【答案】8(答案不唯一)
【分析】设第8次射击的结果是x环,由平均数可得 ,再分类讨论并结合第75%分位数求出x范围作
答.
【详解】设第8次射击的结果是x环,依题意, ,解得 ,
当 时,8次射击的结果由小到大排列为 ,
由 ,得8次射击环数的75%分位数为 ,显然符合题意,即 ,
当 时,8次射击的结果由小到大排列为 ,8次射击环数的75%分位数为 ,
由 ,解得 ,无解,
所以 ,此人第8次射击的结果可能是8环.
故答案为:8
资料整理【淘宝店铺:向阳百分百】28.某小学制订了一份调查问卷,让学生家长对该校实行“双减”的效果进行评分,评分都在 内,
将所有数据按 , , , , , 进行分组,整理得到频率分布直
方图如下,则这次调查数据的第55百分位数为 .
【答案】75
【分析】利用百分位数的概念以及频率分布直方图求解.
【详解】因为前3组数据的频率之和为0.05+0.15+0.2=0.4,
前4组数据的频率之和为0.05+0.15+0.2+0.3=0.7,
则55%分位数在 内,设55%分位数为x,
则0.4+(x-70)×0.030=0.55,解得x=75,
所以55%分位数为75.
故答案为:75.
考点06 相关关系与相关系数
29.关于 的一组样本数据 ,
的散点图中,所有样本点均在直线 上,则这组样本数据的样本相关系数 为( )
A. B.0 C.1 D.
【答案】A
【分析】根据回归直线方程定义和相关系数的性质即可判断.
【详解】因为所有样本点都在直线 上,所以回归直线方程是 ,
可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,
且所有样本点都在直线上,则有 相关系数 ,
资料整理【淘宝店铺:向阳百分百】故选:A.
30.对两个变量 , 进行线性相关检验,得线性相关系数 ,对两个变量 , 进行线性相关检
验,得线性相关系数 ,则下列判断正确的是( )
A.变量 与 正相关,变量 与 负相关,变量 与 的线性相关性较强
B.变量 与 负相关,变量 与 正相关,变量 与 的线性相关性较强
C.变量 与 正相关,变量 与 负相关,变量 与 的线性相关性较强
D.变量 与 负相关,变量 与 正相关,变量 与 的线性相关性较强
【答案】C
【分析】根据相关系数的概念与性质分析判断.
【详解】因为线性相关系数 ,所以 , 正相关,
因为线性相关系数 ,所以 , 负相关,
又因为 ,所以变量 , 的线性相关性比 , 的线性相关性强,
故A、B、D错误,C正确.
故选:C.
31.(多选)某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为
,计算其相关系数为 .经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5
组数据计算得到回归直线的方程为 ,相关系数为 ,以下结论中,正确的是( )
A. B.
C. D.
资料整理【淘宝店铺:向阳百分百】【答案】ACD
【分析】去掉“离群点”F后,两变量的线性相关性更强,由此可判断A,B的正误;回归直线
必经过样本中心点 ,可求 ,判断C的正误;回归直线 必经过样本
中心点 ,可求 ,判断D的正误.
【详解】由题图可知两变量呈现正相关,故 , ,故A正确;
去掉“离群点”F后,两变量的线性相关性更强,故 ,故B错误;
设去掉“离群点”F前的样本中心点为 ,
由散点图可得: , ,
可知回归直线 必经过样本中心点 ,
所以 ,故C正确;
设去掉“离群点”F后的样本中心点为 ,
由散点图可得: , ,
回归直线 必经过样本中心点 ,
所以 ,得 ,即 ,故D正确,
故选:ACD.
32.变量X与Y相对应的一组数据为:(10,1),(11.3,2),(11.8,3),(12.5,4),(13,
5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),
表示变量Y与X之间的线性相关系数, 表示变量V与U之间的线性相关系数,则 与 的大小关系是
.
【答案】
【分析】通过相关系数的知识确定正确答案.
资料整理【淘宝店铺:向阳百分百】【详解】由数据可知 与 正相关, 与 负相关,
所以 ,则 .
故答案为:
33.经过分层抽样得到16名学生高一和高二结束时的数学考试成绩(满分:100分),如下表所示.
学生编号 1 2 3 4 5 6 7 8
8 7 6 5
高一 85 74 58 82
4 1 0 1
8 7 6 6
高二 88 73 62 85
4 2 8 0
1 1
学生编号 9 10 11 12 14 16
3 5
8 7 8 6
高一 69 80 84 54
7 9 3 3
8 8 8 6
高二 73 82 83 67
8 4 3 6
(1)绘制这些成对数据的散点图;
(2)计算学生高一和高二数学成绩的相关系数.根据此相关系数,你能得出什么结论?
【答案】(1)散点图见解析
(2) ,得出结论:高一高二的数学成绩有很强的相关关系.
【分析】(1)根据所给数据直接绘制散点图;
(2)利用相关系数公式结合所给数据求解.
【详解】(1)
(2)记高一成绩为变量 ,高二成绩为变量 ,
资料整理【淘宝店铺:向阳百分百】则有
因为 ,
,
,
所以相关系数 ,
因为相关系数非常接近于1,所以表明高一高二的数学成绩有很强的相关关系.
考点07 线性回归方程
34.用最小二乘法得到一组数据 (i=1,2,3,4,5)的线性回归方程为 ,若 ,
则 等于( )
A.11 B.13
C.53 D.65
【答案】D
【分析】代入回归方程,根据求和公式,即可求解.
【详解】 .
故选:D
35.某医科大学实习小组为研究实习地昼夜温差与感冒人数之间的关系,分别到当地气象部门和某医院抄
录了1月至3月每月5日、20日的昼夜温差情况与因感冒而就诊的人数,得到如表资料:
日期 1月5日 1月20日 2月5日 2月20日 3月5日 3月20日
昼夜温差x(℃) 10 11 13 12 8 6
就诊人数y(个) 22 25 29 26 16 12
该小组确定的研究方案是:先从这6组数据中随机选取4组数据求线性回归方程,再用剩余的2组数据进
行检验.
资料整理【淘宝店铺:向阳百分百】参考公式: , .
(1)求剩余的2组数据都是20日的概率;
(2)若选取的是1月20日、2月5日、2月20日、3月5日这4组数据.
①请根据这4组数据,求出y关于x的线性回归方程 ;
②若某日的昼夜温差为7℃,请预测当日就诊人数.(结果保留整数).
【答案】(1)
(2)① ;②14人
【分析】(1)利用列举法求解,先列出从这6组中随机选取4组数据,剩余的2组数据所有等可能的情况,
然后找出其中2组数据都是20日的情况,然后利用古典概型的概率公式求解,
(2)①根据表中的数据和公式求出y关于x的线性回归方程,②把 代入回归方程求解即可
(1)
记6组依次为1,2,3,4,5,6,从这6组中随机选取4组数据,剩余的2组数据所有等可能的情况为
, , , , , , , , , , , , , ,
共15种,
其中2组数据都是20日,即都取自2,4,6组的情况有3种.
根据古典概型概率计算公式,剩余的2组数据都是20日的概率 .
(2)
①由所选数据,得 , ,
所以 ,
所以 ,
所以y关于x的线性回归方程为 .
资料整理【淘宝店铺:向阳百分百】②当 时, ,
所以某日的昼夜温差为7℃,预测当日就诊人数约为14人.
36.某样本点 的经验回归方程为 ,当 时,y的实际值为4.5,则当
时,预测值与实际值的差值为( ).
A.0.1 B.0.2 C.0.3 D.0.4
【答案】B
【分析】根据经验回归方程,直接代入求解即可
【详解】当 时,y的预测值 , .
故选B
37.市场监管部门对某线下某实体店2023年前两季度的月利润情况进行调查统计,得到的数据如下:
月份x 1 2 3 4 5 6
净利润y(万元) 1.0 1.4 1.7 2.0 2.2 2.4
(1)是否可以用线性回归模型拟合y与x的关系?请用相关系数r加以说明;(参考:若 时,则线性
相关程度较高, ,则线性相关程度一般,计算 时精确度为0.01)
(2)利用最小二乘法求出y关于x的回归方程;用样本估计总体,请预估第9月份的利润.
附:对于一组数据 ,其回归直线 的斜率
, .相关系数 .
参考数据: , , , , , .
【答案】(1)可以,理由见解析
(2) ,3.32万元
【分析】(1)计算出相关数据,利用相关系数公式计算即可;
(2)根据线性回归方程公式计算即可.
资料整理【淘宝店铺:向阳百分百】【详解】(1)由条件则 ,
,
.
根据相关系数公式则
.
因此可以用线性回归模型拟合x与y的关系.
(2)根据(1)则变量x,y线性相关,设所求的线性回归方程为 .
根据回归方程的回归系数公式则
.
又因为 .
从而可得变量x,y线性回归方程为
当 时,
因此预测9月份的利润为3.32万元.
38.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间
的对应数据的散点图,如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若
资料整理【淘宝店铺:向阳百分百】,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为10千克时,西红柿亩产量的增加量约为多少?
附:相关系数公式 .
参考数据:
回归方程 中斜率和截距的最小二乘估计公式分别为
.
【答案】(1) ,说明见解析
(2) ;550千克
【分析】(1)根据散点图中的数据分别求得可得 , , , , ,
进而求得相关系数 ,再与0.75比较下结论.
(2)结合(1)中的数据,分别求得 , ,写出回归方程,然后将 代入求解.
【详解】(1)由已知数据可得 , ,
所以 ,
,
,
资料整理【淘宝店铺:向阳百分百】所以相关系数 .
因为 ,所以可用线性回归模型拟合y与x的关系.
(2) , ,
所以回归方程为 .
当 时, .
即当液体肥料每亩使用量为10千克时,西红柿亩产量的增加量约为550千克
39.新冠肺炎疫情发生以来,中医药全面参与疫情防控救治,做出了重要贡献.某中医药企业根据市场调
研与模拟,得到研发投入x(亿元)与产品收益y(亿元)的数据统计如下:
研发投入x(亿元) 1 2 3 4 5
产品收益y(亿元) 3 7 9 10 11
(1)计算x,y的相关系数r,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若
,则线性相关程度一般,若 ,则线性相关程度较高)
(2)求出y关于x的线性回归方程,并预测研发投入20(亿元)时产品的收益.
参考数据: , , .
附:相关系数公式: ,回归直线方程的斜率 ,截距
.
【答案】(1) ,具有较高的线性相关程度
(2) ,40.3亿元
【分析】(1)将已知数据代入相关系数公式计算即可得结论.
(2)求出回归直线方程,将 代入线性回归方程计算即可.
资料整理【淘宝店铺:向阳百分百】【详解】(1)∵ , , ,
∴ ,
∴该中医药企业的研发投入x与产品收益y具有较高的线性相关程度.
(2)∵ ,
,
∴ .
∴y关于x的线性回归方程为 ,
将 代入线性回归方程可得, ,
∴预测研发投入20(亿元)时产品的收益为40.3(亿元).
考点08 非线性回归方程
40.某池塘中水生植物的覆盖水塘面积x(单位: )与水生植物的株数y(单位:株)之间的相关关系,
收集了4组数据,用模型 去拟合x与y的关系,设 ,x与z的数据如表格所示:
x 3 4 6 7
z 2 2.5 4.5 7
得到x与z的线性回归方程 ,则 .
【答案】 /
【分析】根据已知条件,求得 ,进而代入回归方程可求得 ,从而得出 ,联立
,即可求得本题答案.
【详解】由已知可得, , ,
所以,有 ,解得 ,
资料整理【淘宝店铺:向阳百分百】所以, ,
由 ,得 ,
所以, ,则 .
故答案为:
41.汽车轮胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎面磨损.某实验室通过实验测得行驶里
程与某品牌轮胎凹槽深度的数据,建立了如下回归模型 ,通过实验数据分析与计算得到如下结
论:① ;② ,令 , ,则回归方程应为 .
【答案】 .
【分析】由题意,根据对数的运算性质,以及所提供的信息,列出等式,即可求解.
【详解】因为回归模型为 ,
因为 ,可得 ,
两边同时取对数,可得 ,
令 ,此时 ,
又因为 , ,所以 ,即 ,
所以 .
故答案为: .
42.在正常生产条件下,根据经验,可以认为化肥的有效利用率近似服从正态分布 ,而化肥
施肥量因农作物的种类不同每亩也存在差异.
(1)假设生产条件正常,记 表示化肥的有效利用率,求 ;
(2)课题组为研究每亩化肥施用量与某农作物亩产量之间的关系,收集了10组数据,并对这些数据作了初
步处理,得到了如图所示的散点图及一些统计量的值.其中每亩化肥施用量为 (单位:公斤),粮食亩产
量为 (单位:百公斤)
资料整理【淘宝店铺:向阳百分百】参考数据:
650 91.5 52.5 1478.6 30.5 15 15 46.5
, ,2, , .
(i)根据散点图判断, 与 ,哪一个适宜作为该农作物亩产量 关于每亩化肥施用量 的回
归方程(给出判断即可,不必说明理由);
(ii)根据(i)的判断结果及表中数据,建立 关于 的回归方程;并预测每亩化肥施用量为27公斤时,
粮食亩产量 的值.
附:①对于一组数据 ,2,3, , ,其回归直线 的斜率和截距的最小二乘估计分
别为 , ;
②若随机变量 ,则 , .
【答案】(1)
(2)(i) 适宜作为粮食亩产量 关于每亩化肥施用量 的回归方程;(ii) , (百公斤)
【分析】(1)根据正态分布曲线的对称性,结合 ,即可求解;
(2)(i)由散点图可知 与 的关系不是线性关系,即可得到答案;
资料整理【淘宝店铺:向阳百分百】(ii)由 ,得到 ,令 ,得到 ,结合公式求得回归系数和 的
值,即可求解.
【详解】(1)解:由 ,根据正态分布曲线的对称性,
可得 .
(2)解:(i)由散点图可知 与 的关系不是线性关系,所以 适宜作为粮食亩产量 关于每亩化
肥施用量 的回归方程;
(ii)因为 ,所以 ,令 ,则 ,
由表可得 ,所以 ,
所以 ,所以 ,所以 ,
当 时, (百公斤)
43.某研发小组为了解年研发资金投入量 (单位:亿元)对年销售额 (单位:亿元)的影响,结合近
10年的年研发资金投入量 和年销售额 的数据( ),建立了两个函数模型:① ,
② ,其中 , , , 均为常数, 为自然对数的底数.设 , ,经过计
算得如下数据.
20 66 770 200 14
46
4.20 3125000 0.308 21500
0
(1)设 和 的相关系数为 , 和 的相关系数为 ,请从相关系数的角度,选择一个拟合程度更
资料整理【淘宝店铺:向阳百分百】好的模型.
(2)根据(1)中选择的模型及表中数据,建立 关于 的线性回归方程(系数精确到0.01),根据线性回归
方程,若当年的销售额大致为 亿元,则估计当年的研发资金投入量为多少亿元.
参考公式:相关系数 ,
线性回归直线 中斜率和截距的最小二乘法估计参数分别为 , .
【答案】(1)模型 的拟合程度更好
(2) ,8亿元
【分析】(1)根据题干所给数据求出相关系数为 、 即可判断;
(2)由(1)可得 两边取对数可得 ,即 ,再由所给数据求出 、 ,即可得到
回归方程,再代入 求出 即可.
【详解】(1)由题意可知 ,
因为 ,所以从相关系数的角度,模型 的拟合程度更好.
(2)因为 ,所以 ,即 .
资料整理【淘宝店铺:向阳百分百】由题中数据可得 ,
则 ,从而 关于 的线性回归方程为 ,
故 ,即 .
将年销售额 亿元,代入 ,得 ,解得 ,
故估计当年的研发资金投入量为 亿元.
44.在一次抽样调查中测得 个样本点,得到下表及散点图.
(1)根据散点图判断 与 哪一个适宜作为 关于 的回归方程;
(给出判断即可,不必说明理由)
(2)根据(1)的判断结果试建立 与 的回归方程;(计算结果保留整数)
参考公式:
【答案】(1)
(2)
【分析】(1)根据散点图即可求解,
(2)将非线性转化为线性,即可利用最小二乘法求解.
【详解】(1)由题中散点图可以判断, 适宜作为 关于 的回归方程;
资料整理【淘宝店铺:向阳百分百】(2)令 ,则 ,原数据变为
由表可知 与 近似具有线性相关关系,计算得 ,
,
,
所以, ,则 .
所以 关于 的回归方程是 .
45.为了研究某种细菌随天数 变化的繁殖个数 ,收集数据如下:
天数 1 2 3 4 5 6
繁殖个数 6 12 25 49 95 190
(1)在图中作出繁殖个数 关于天数 变化的散点图,并由散点图判断
( 为常数)与 ( 为常数,且 )哪一个适宜作为繁殖个数 关于天数 变化的回
归方程类型?(给出判断即可,不必说明理由)
(2)对于非线性回归方程 ( 为常数,且 ),令 ,可以得到繁殖个数的对数z
关于天数x具有线性关系及一些统计量的值.
3.50 62.83 3.53 17.50 596.57 12.09
资料整理【淘宝店铺:向阳百分百】(ⅰ)证明:“对于非线性回归方程 ,令 ,可以得到繁殖个数的对数 关于天数 具有线
性关系(即 为常数)”;
(ⅱ)根据(ⅰ)的判断结果及表中数据,建立 关于 的回归方程(系数保留2位小数).
附:对于一组数据 ,其回归直线方程 的斜率和截距的最小二乘估计分
别为 .
【答案】(1)选择 为回归方程较宜
(2)(ⅰ)证明见解析;(ⅱ)
【分析】(1)根据表格提供数据画出散点图,并由此选择 .
(2)(ⅰ)利用换元法,结合对数运算证得结论成立;(ⅱ)根据回归方程的求法求得正确答案.
【详解】(1)作出散点图如图所示.
由散点图看出样本点分布在一条指数型曲线 的周围,
故选择 为回归方程较宜.
(2)(i)由已知:令 ,则 ,
则 , ,即 .所以繁殖个数的对数 关于天数 具有线性关系.
(ii)由(i)知繁殖个数的对数 关于天数 可以用线性回归方程来拟合.由表中数据可得,
资料整理【淘宝店铺:向阳百分百】,
,
得到 关于 的线性回归方程为 ,又 ,
因此细菌的繁殖个数 关于天数 的非线性回归方程为 .
考点09 误差分析
46.下列四幅残差分析图中,与一元线性回归模型拟合精度最高的是( )
A. B.
C. D.
【答案】D
【分析】根据残差的特点,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区
域的宽度越窄,说明模型的拟合精度越高.即可得到答案.
【详解】用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较
合适,
带状区域的宽度越窄,说明模型的拟合精度越高,显然D选项的拟合精度最高.
故选:D.
47.某新能源汽车生产公司,为了研究某生产环节中两个变量 之间的相关关系,统计样本数据得到如
下表格:
资料整理【淘宝店铺:向阳百分百】由表格中的数据可以得到 与 的经验回归方程为 ,据此计算,下列选项中残差的绝对值最小的
样本数据是( )
A. B.
C. D.
【答案】C
【分析】根据最小二乘法可求得 的值,从而得到经验回归方程;根据残差的求法依次验证各选项中的残
差的绝对值即可.
【详解】由表格数据知: , ,
, 经验回归方程为 ;
对于A,残差的绝对值为 ;
对于B,残差的绝对值为 ;
对于C,残差的绝对值为 ;
对于D,残差的绝对值为 ;
残差绝对值最小的样本数据是 .
故选:C.
48.(多选)已知变量 , 之间的经验回归方程为 ,且变量 , 的数据如图所示,则下列
说法正确的是( )
2 3 5 9 11
1
10 7 3
2
资料整理【淘宝店铺:向阳百分百】A.该回归直线必过
B.变量 , 之间呈正相关关系
C.当 时,变量 的值一定等于
D.相应于 的残差估计值为
【答案】AD
【分析】根据回归直线一定经过样本中心点,及残差概念等来逐项判断.
【详解】对于A,由表格数据得, , ,所以该回归直线必过
,故A正确;
对于B,因为回归直线方程为 , ,当变量 增加,变量 相应值减少两个变量之间呈
负相关关系,故B错误;
对于C,当 时, ,变量 的值可能为 ,故C错误;
对于D,由残差定义知,观测值减去预测值为残差,当 时,得预测值 ,则相应于
的残差估计值为 ,故D正确.
故选:AD.
49.(多选)为研究女儿身高 与母亲身高 的关系,现经过随机抽样获得成对样本数据 ,
,下列说法正确的是( )
A.落在回归直线上的样本点越多,回归直线方程的拟合效果越好
B.样本相关系数 越大,变量 线性相关程度越强
C.决定系数 越小,残差平方和越大,模型的拟合效果越好
D.决定系数 越大,残差平方和越小,模型的拟合效果越好
【答案】BD
【分析】根据变量间的相关关系中,决定系数 或相关系数 的意义进行判断即可.
【详解】对于A:回归直线方程拟合效果的好坏是由决定系数 来判断的,故A错误;
资料整理【淘宝店铺:向阳百分百】对于B:因为 ,且相关系数 越接近 ,变量 线性相关程度越强,故B正确;
对于C:决定系数 越小,残差平方和越大,模型的拟合效果越差,故C错误;
对于D:决定系数 越大,残差平方和越小,模型的拟合效果越好,故D正确.
故选:BD.
50.某互联网公司为了确定下季度的前期广告投人计划,收集了近6个月广告投入量 (单位:万元)和
收益 (单位:万元)的数据如表:
月份 1 2 3 4 5 6
广告投入
2 4 6 8 10 12
量
收益 14.21 20.31 31.8 31.18 37.83 44.67
他们用两种模型① ,② 分别进行拟合,得到相应的回归方程并进行残差分析,得到如图
所示的残差图及一些统计量的值.
7 30 1464.24 364
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型拟合?并说明理由;
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.
(i)剔除异常数据后求出(1)中所选模型的回归方程;
(ii)若广告投入量 时,(1)中所选模型收益的预报值是多少?
附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘估计分别为:
资料整理【淘宝店铺:向阳百分百】【答案】(1)选择模型①,理由见解析
(2)(i) ;(ii)62.04万元
【分析】(1)根据残差图的分布比较可得结论;
(2)(i)求出剔除异常数据后的平均数,即可求得 和 ,即得回归方程;(ii)将 代入回归直线
方程,即可得答案.
【详解】(1)选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,
且模型①的带状区域比模型②的带状区域窄,
所以模型①的拟合精度高,回归方程的预报精度高.
(2)(i)剔除异常数据,即组号为3的数据,剩下数据的平均数为
;
,
.
.
∴所选模型的回归方程为 ;
(ⅱ)若广告投入量 时,该模型收益的预报值是 万元.
考点10 独立性检验
51.随机调查了200名高中生是否喜欢看篮球比赛,得到如下的列联表:
喜欢 不喜欢 总计
男 80 20 100
女 40 60 100
总计 120 80 200
(1)能否有99%的把握认为“高中生是否喜欢看篮球比赛与性别有关”;(运算结果保留三位小数)
资料整理【淘宝店铺:向阳百分百】(2)用分层抽样的方法从喜欢看篮球比赛的120名学生中抽取6名学生,再从这6名学生中随机选取2人,
求这2人中至少有1名女生的概率.
附:
0.100 0.050 0.025 0.010 0.005
2.706 3.841 5.024 6.635 7.879
【答案】(1)有99%的把握认为“高中生是否喜欢看篮球比赛与性别有关”
(2)
【分析】(1)根据卡方公式和附表中的数据进行求解判断即可;
(2)根据古典概型运算公式、对立事件的概率公式,结合列举法进行求解即可.
【详解】(1) ,
有99%的把握认为“高中生是否喜欢看篮球比赛与性别有关”;
(2)由题意可知6名学生中男生有4人,女生有2人,
4名男生记为1,2,3,4,2名女生记为 ,基本事件
共15种,
记“2人中至少有1名女生”为事件A,则事件 包含的基本事件为 共6种,
,
“2人中至少有1名女生”发生的概率为
52.近日,某市市民体育锻炼的热情空前高涨.某学生兴趣小组在 月 日随机抽取了该市 人,并对其
当天体育锻炼时间进行了调查,如图是根据调查结果绘制的体育锻炼时间的频率分布直方图,锻炼时间不
少于 分钟的人称为“运动达人”.
资料整理【淘宝店铺:向阳百分百】(1)估算这 人当天体育锻炼时间的众数和平均数(每组中的数据用组中值代替);
(2)根据已知条件完成下面的 列联表,并据此判断是否有 的把握认为“运动达人”与性别有关.
非“运动达 “运动达
合计
人” 人”
男
性
女
性
合
计
附: , ,
临界值表: 0.05 0.01
3.841 6.635
【答案】(1)众数为35,平均数为
(2)填表见解析;没有 的把握认为“运动达人”与性别有关
【分析】(1)由频率分布直方图求众数与平均数知识可得答案;(2)由题目数据可完成列联表,后由独
立性检验知识可得答案.
【详解】(1)(1)由众数的定义可知,这 人当天体育锻炼时间的众数为 的组中值,即35,
设这 人当天体育锻炼时间的平均数为 ;
则 ;
(2)根据已知条件, 列联表如下:
非“运动达 “运动达
合计
人” 人”
男
性
女
性
合
计
根据 列联表中的数据有
,
资料整理【淘宝店铺:向阳百分百】所以没有 的把握认为“运动达人”与性别有关.
53.某地区对某次考试成绩进行分析,随机抽取100名学生的A,B两门学科成绩作为样本.将他们的A
学科成绩整理得到如下频率分布直方图,且规定成绩达到70分为良好.已知他们中B学科良好的有50人,
两门学科均良好的有40人.
(1)根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为这次考试学生的A
学科良好与B学科良好有关;
B学科良好 B学科不够良好 合计
A学科良好
A学科不够良好
合计
(2)用样本频率估计总体概率,从该地区参加考试的全体学生中随机抽取3人,记这3人中A,B学科均良
好的人数为随机变量X,求X的分布列与数学期望.
附: ,其中 .
0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.15
2.072 2.706 3.841 5.024 6.635 7.879 10.828 2.072
【答案】(1)填表见解析,有95%把握认为A学科良好与B学科良好有关
(2)分布列见解析,期望为
【分析】(1)根据频率分布直方图计算可得出A学科良好的人数,进而即可得出2×2列联表.根据公式计
算得出 的值,比较即可根据独立性检验得出答案;
资料整理【淘宝店铺:向阳百分百】(2)根据(1)得出AB学科均良好的概率 ,可知 .然后计算得出 取不同值的概率,列
出分布列,根据期望公式即可得出答案.
【详解】(1)由直方图可得A学科良好的人数为 ,
所以2×2列联表如下:
B学科良好 B学科不够良好 合计
A学科良好 40 30 70
A学科不够良好 10 20 30
合计 50 50 100
假设 :A学科良好与B学科良好无关,
,
所以有95%把握认为A学科良好与B学科良好有关.
(2)AB学科均良好的概率 ,
X的可能取值为0,1,2,3,且 .
所以 , ,
, .
所以X的分布列为
X 0 1 2 3
P
因为 ,所以 .
资料整理【淘宝店铺:向阳百分百】54.某手机商家为了更好地制定手机销售策略,随机对顾客进行了一次更换手机时间间隔的调查.从更换
手机的时间间隔不少于3个月且不超过24个月的顾客中选取350名作为调查对象,其中男性顾客和女性顾
客的比值为 ,商家认为一年以内(含一年)更换手机为频繁更换手机,否则视为未频繁更换手机.现按
照性别采用分层抽样的方法随机抽取105人,并按性别分为两组,得到如下表所示的频数分布表:
时间间隔(月)
男性 8 9 19 12 8 4
女性 2 5 12 11 7 2
(1)计算表格中 的值;
(2)请根据频率分布表填写 列联表,并判断是否有99%以上的把握认为“频繁更换手机与性别有关”?
频繁更换手
未频繁更换手机 合计
机
男性顾客
女性顾客
合计
附表及公式:
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
,其中 .
【答案】(1)
(2)表格见解析,没有
【分析】(1)根据男性顾客和女性顾客的比值、分层抽样的知识求得 .
(2)根据已知条件填写 列联表,计算 的值,由此作出判断.
【详解】(1)由题知男性顾客共有 人,女性顾客共有 人,
按分层抽样抽取105人,则应该抽取男性顾客 人,女性顾客 人;
资料整理【淘宝店铺:向阳百分百】所以 .
(2)由频率分布表可知,在抽取的105人中,男性顾客中频繁更换手机的有20人,女性顾客中频繁更换
手机的有10人,据此可得 列联表:
频繁更换手
未频繁更换手机 合计
机
男性顾客 20 43 63
女性顾客 10 32 42
合计 30 75 105
所以 .
因为 ,所以没有99%以上的把握认为“频繁更换手机与性别有关”.
55.广西新高考改革方案已正式公布,根据改革方案,将采用3+1+2”的高考模式,其中,“3”为语文、数
学,外语3门参加全国统一考试,选择性考试科目为政治、历史、地理、物理、化学,生物6门,由考生
根据报考高校以及专业要求,结合自身实际,首先在物理和历中选择1门,再从政治、地理、化学、生物
中选择2门,形成自己的高考选考组合.
(1)若某学生根据方案进行随机选科,求该生恰好选到“物化生”组合的概率;
(2)由于物理和历史两科必须选择1科,某校想了解离一新生选科的需求.随机选取100名高一新生进行调查,
得到如下绕计效据,完成以下列联表,判断是否有 的把握认为“选科与性别有关”?
选择历
选择物理 合计
史
男生 40 10 50
女生 30 20 50
合计 70 30 100
附:
0.10 0.05 0.025 0.01 0.005
2.706 3.841 5.024 6.635 7.879
【答案】(1)
资料整理【淘宝店铺:向阳百分百】(2)有 的把握认为“选科与性别有关.
【分析】(1)设物理、历史两门学科分别为 ,政治、地理、化学、生物分别为 ,利用列举法
求得基本事件的总数,结合古典概型的概率计算公式,即可求解;
(2)根据 的列联表,求得 ,结合附表,即可得到结论.
【详解】(1)解:设物理、历史两门学科分别为 ,政治、地理、化学、生物分别为 ,
某同学根据方案进行随机选科,所得的结果为:
,共有12种情形,
所以该生恰好选到“物化生”的概率为 .
(2)解:由 的列联表:
选择历
选择物理 合计
史
男生 40 10 50
女生 30 20 50
合计 70 30 100
可得 ,
所以有 的把握认为“选科与性别有关.
56.第二十二届卡塔尔世界杯足球赛(FIFAWorldCupQatar2022)决赛中,阿根廷队通过扣人心弦的点球
大战战胜了法国队.某校为了丰富学生课余生活,组建了足球社团.足球社团为了解学生喜欢足球是否与性
别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:
喜欢足
不喜欢足球 合计
球
男生 40
女生 30
合计
(1)根据所给数据完成上表,并判断是否有 的把握认为该校学生喜欢足球与性别有关?
(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知男生进球的概率为 ,
资料整理【淘宝店铺:向阳百分百】女生进球的概率为 ,每人射门一次,假设各人射门相互独立,求3人进球总次数的分布列和数学期望.
附: .
【答案】(1)表格见解析,有
(2)分布列见解析, .
【分析】(1)根据题意,得到 列联表,求得 ,结合附表,即可得到结论;
(2)根据题意,得到随机变量的可能的取值,求得相应的概率得到分布列,利用期望公式,即可求解.
【详解】(1)解:根据题意,得到 列联表如下:
喜欢足
不喜欢足球 合计
球
男生 60 40 100
女生 30 70 100
合计 90 110 200
可得 ,
所以有 的把握认为该校学生喜欢足球与性别有关.
(2)解:由题意, 人进球总次数 的所有可能取值为 ,
可得 , ,
,
所以随机变量 的分布列为:
0 1 2 3
资料整理【淘宝店铺:向阳百分百】所以 的数学期望为 .
资料整理【淘宝店铺:向阳百分百】