文档内容
8.4 统计与统计案例(精练)
1(2023·河南开封·统考模拟预测)某学校组建了演讲,舞蹈,合唱,绘画,英语协会五个社团,全校2000
名学生每人都参加且只参加其中二个社团,校团委从这2000名学生中随机选取部分学生进行调查,并将调
查结果绘制成如下不完整的两个统计图:
则选取的学生中,参加绘画社团的学生数为( )
A.20 B.30 C.40 D.45
【答案】A
【解析】选取的学生中,合唱的比例为 ,
所以绘画的比例为 ,
所以选取的学生中,参加绘画社团的学生数为 .
故选:A.
2.(2024秋·湖北武汉·高三统考开学考试)公司邀请用户参加某产品的试用并评分,满意度为10分的有1
人,满意度为9分的有1人,满意度为8分的有2人,满意度为7分的有4人,满意度为5分和4分的各有
1人,则该产品用户满意度评分的平均数、众数、中位数、85%分位数分别为( )
A.8分,7分,7分,9分
B.8分,7分,7分,8.5分
C.7.2分,7分,7分,9分
D.7.2分,7分,7分,8.5分
【答案】C
【解析】把10个数据从小到大排列:4,5,7,7,7,7,8,8,9,10,
资料整理【淘宝店铺:向阳百分百】故平均数为: (分),出现次数最多的是7,因此众数为7分,中位数为
(分),又 ,所以85%分位数在第9位,即9分.
故选:C.
3.(2023·贵州黔东南·凯里一中校考模拟预测)“说文明话、办文明事、做文明人,树立城市新风尚!创
建文明城市,你我共同参与!”为宣传创文精神,华强实验中学高一(2)班组织了甲乙两名志愿者,利
用一周的时间在街道对市民进行宣传,将每天宣传的次数绘制成如下频数分布折线图,则以下说法不正确
的为( )
A.甲的众数小于乙的众数 B.乙的极差小于甲的极差
C.甲的方差大于乙的方差 D.乙的平均数大于甲的平均数
【答案】D
【解析】由图可知,甲志愿者的宣传次数分别为:4,5,6,3,4,3,3,
乙志愿者的宣传次数分别为:5,4,4,5,4,3,3,
甲的平均数为 ,
乙的平均数为 ,故D错误,
甲的众数为3,乙的众数为4,故甲的众数小于乙的众数,故A正确;
甲的极差为3,乙的极差为2,则乙的极差小于甲的极差,故B正确;
甲的方差为 ,
乙的方差为 ,
故甲的方差大于乙的方差,故C正确.
资料整理【淘宝店铺:向阳百分百】故选:D.
4.(2023春·河北石家庄·高三校联考阶段练习)2023年考研成绩公布不久,对某校“软件工程”专业参
考的200名考生的成绩进行统计,可以得到如图所示的频率分布直方图,其中分组的区间为 ,
, , ,同一组中的数据用该组区间的中间值作代表值,则下列说法中不正确
的是( )
A.这200名学生成绩的众数为370分
B.这200名学生成绩的平均分为377分
C.这200名学生成绩的70%分位数为386分
D.这200名学生成绩在 中的学生有30人
【答案】C
【解析】显然众数是370,故A正确;
平均分为 ,故B正确;
设70%分位数为 ,则 ,得 ,故C错误;
,故D正确.
故选:C
5.(2023·河北衡水·河北衡水中学校考一模)某新能源汽车生产公司,为了研究某生产环节中两个变量
之间的相关关系,统计样本数据得到如下表格:
资料整理【淘宝店铺:向阳百分百】由表格中的数据可以得到 与 的经验回归方程为 ,据此计算,下列选项中残差的绝对值最小的
样本数据是( )
A. B.
C. D.
【答案】C
【解析】由表格数据知: , ,
, 经验回归方程为 ;
对于A,残差的绝对值为 ;
对于B,残差的绝对值为 ;
对于C,残差的绝对值为 ;
对于D,残差的绝对值为 ;
残差绝对值最小的样本数据是 .
故选:C.
6(2023秋·云南保山·高三统考期末)新冠肺炎疫情发生以来,中医药全面参与疫情防控救治,做出了重要
贡献.某中医药企业根据市场调研与模拟,得到研发投入 (亿元)与产品收益 (亿元)的数据统计如下
表:
研发投入 (亿元) 1 2 3 4 5
产品收益 (亿
3 7 9 10 11
元)
用最小二乘法求得 关于 的经验回归直线方程是 ,相关系数 (若 ,则线
资料整理【淘宝店铺:向阳百分百】性相关程度一般,若 ,则线性相关程度较高),下列说法不正确的有( )
A.变量 与 正相关且相关性较强
B.
C.当 时, 的估计值为40.3
D.相应于点 的残差为0.8
【答案】D
【解析】对于A,由相关系数 可知变量 与 正相关且相关性较强,故A正确;
对于B,由表中数据可得 ,所以 ,解得
,故B正确;
对于C, 关于 的线性回归方程为 ,将 代入线性回归方程可得,
,故C正确;
对于D,相应于点 的残差为 ,故 错误.
故选:D.
7.(2023·湖南·校联考模拟预测)若需要刻画预报变量 和解释变量 的相关关系,且从已知数据中知道
预报变量 随着解释变量 的增大而减小,并且随着解释变量 的增大,预报变量 大致趋于一个确定的
值,为拟合 和 之间的关系,应使用以下回归方程中的( , 为自然对数的底数)( )
A. B. C. D.
【答案】D
【解析】对于A:因为 在定义域内单调递增且 ,所以 随着 的增大而增大,不合题意,故A错
误;
对于B:因为 在定义域内单调递增且 ,所以 随着 的增大而减小,当解释变量 ,
,不合题意,故B错误;
资料整理【淘宝店铺:向阳百分百】对于C:因为 在定义域内单调递增且 ,所以 随着 的增大而减小,当解释变量 ,
,不合题意,故C错误;
对于D:因为 在定义域内单调递减且 ,所以 随着 的增大而减小,当解释变量 ,
,故D错误;
故选:D.
8.(2023秋·湖北·高三校联考阶段练习)(多选)某医院护士对甲、乙两名住院病人一周内的体温进行了
统计,其结果如图所示,则下列说法正确的有( )
A.病人甲体温的极差为
B.病人乙的体温比病人甲的体温稳定
C.病人乙体温的众数、中位数与平均数都为
D.病人甲体温的上四分位数为
【答案】BC
【解析】对于选项A:病人甲体温的最大值为 ,最小值为 ,故极差为 ,故A错误;
对于选项B:病人乙的体温波动较病人甲的小,极差为 ,也比病人甲的小,因此病人乙的体温比病人
甲的体温稳定,故B正确;
对于选项C:病人乙体温按照从小到大的顺序排列为: ,
病人乙体温的众数、中位数都为 ,
病人乙体温的平均数为: ,故C正确;
对于选项D:病人甲体温按照从小到大的顺序排列为: ,
又 ,
病人甲体温的上四分位数为上述排列中的第6个数据,即 ,故D错误.
故选:BC.
资料整理【淘宝店铺:向阳百分百】9.(2023春·山东菏泽·高三校考开学考试)(多选)一组样本数据 ,且成等差数列,其中 是
最小值, 是最大值,则下列各选项正确的是( )
A. 的平均数等于 的平均数
B. 的中位数等于 的中位数
C. 的标准差不小于 的标准差
D. 的极差不大于 的极差
【答案】ABD
【解析】对于选项A:设 的平均数为 , 的平均数为 ,
则 ,
因为数据 且成等差数列,确定 ,所以判断 ,故A正确;
对于选项B:不妨设 ,
可知 的中位数等于 的中位数均为 ,故B正确;
对于选项C:因为 是最小值, 是最大值,
则 的波动性不大于 的波动性,即 的标准差不大于 的标准差,
例如: ,则平均数 ,
标准差 ,
,则平均数 ,
资料整理【淘宝店铺:向阳百分百】标准差 ,
显然 ,即 ;故C错误;
对于选项D:不妨设 ,
则 ,当且仅当 时,等号成立,故D正确;
故选:ABD.
10.(2023秋·云南昆明·高三云南省昆明市第十中学校考开学考试)(多选)若甲组样本数据
(数据各不相同)的平均数为3,乙组样本数据 的平均数为5,下列说错误的是
( )
A. 的值不确定
B.乙组样本数据的方差为甲组样本数据方差的2倍
C.两组样本数据的极差可能相等
D.两组样本数据的中位数可能相等
【答案】ABC
【解析】对选项A,由题意可知, ,故A错误;
对选项B,易知乙组样本数据的方差为甲组样本数据方差的 倍,故B错误;
对选项C,不妨设 ,
则甲组数据的极差为 ,
乙组数据的极差为 ,
又已知甲组数据各不相同,
所以两组样本数据的极差不相等,故C错误;
对选项D,设甲组样本数据的中位数为 ,
则乙组样本数据的中位数为 ,
资料整理【淘宝店铺:向阳百分百】当 时, ,
所以两组样本数据的中位数可能相等,故D正确.
故选:ABC.
11.(2023·广东梅州·统考三模)(多选)某公司经营五种产业,为应对市场变化,在五年前进行了产业
结构调整,优化后的产业结构使公司总利润不断增长,今年总利润比五年前增加了一倍,调整前后的各产
业利润与总利润的占比如图所示,则下列结论错误的是( )
A.调整后传媒的利润增量小于杂志
B.调整后房地产的利润有所下降
C.调整后试卷的利润增加不到一倍
D.调整后图书的利润增长了一倍以上
【答案】ABC
【解析】设调整前的各产业利润的总和为 ,则调整后的各产业利润的总和为 .
对于选项A,调整前传媒的利润为 ,杂志的利润为 ,
调整后传媒的利润为 ,杂志的利润为 ,
则调整后传媒的利润增量为 ,杂志的利润增量为 ,故选项A不正确;
对于选项B,调整前房地产的利润为 ,调整后房地产的利润为 ,故选项B不正确;
对于选项C,调整前试卷的利润为 ,调整后试卷的利润为 ,且 ,故选项C不正确;
对于选项D,调整前图书的利润为 ,调整后图书的利润为 ,且 ,故选项D正确.
故选:ABC.
12.(2023·辽宁·大连二十四中校联考模拟预测)(多选)大连市教育局为了解二十四中学、第八中学、
育明中学三所学校的学生文学经典名著的年阅读量,采用样本比例分配的分层随机抽样抽取了一个容量为
120的样本.其中,从二十四中学抽取容量为35的样本,平均数为4,方差为9;从第八中学抽取容量为40
的样本,平均数为7,方差为15;从育明中学抽取容量为45的样本,平均数为8,方差为21,据此估计,
资料整理【淘宝店铺:向阳百分百】三所学校的学生文学经典名著的年阅读量的( )
A.均值为6.3 B.均值为6.5
C.方差为17.52 D.方差为18.25
【答案】BD
【解析】设二十四中学、第八中学、育明中学三组数据中每个人的数据分别为
, , ,
均值 ,
方差
,
故选:BD
13.(2023秋·广西南宁·高三南宁市武鸣区武鸣高级中学校考开学考试)(多选)下列命题为真命题的有
( )
A.若随机变量 的方差为 ,则
B.已知 关于 的回归直线方程为 ,则样本点 的残差为
C.若随机变量 ,且 ,则
D.根据分类变量 与 的成对样本数据,计算得到 ,根据 的独立性检验
,有 的把握认为 与 有关
【答案】BC
资料整理【淘宝店铺:向阳百分百】【解析】对于A,因为 ,所以 ,故A错误;
对于B,由 ,得样本点 的残差为 ,故B正确;
对于C,若随机变量 ,且 ,
可得 ,则 ,故C正确;
对于D,根据 ,故没有 的把握认为 与 有关,故D错误.
故选:BC.
14.(2023·福建三明·统考三模)若 为一组从小到大排列的数1,2,3,5,6,8的第六十百分位数,则
的展开式中 的系数为 .
【答案】
【解析】由 ,得 ,
于是 展开式中含 的项为 ,
所以 的展开式中 的系数为 .
故答案为:
15.(2024秋·浙江·高三舟山中学校联考开学考试)已知成对样本数据 中
互不相等,且所有样本点 都在直线 上,则这组成对样本数据的样
本相关系数 .
【答案】
【解析】因为所有样本点 都在直线 上,显然直线 的斜率 ,
所以样本数据成负相关,相关系数为 .
故答案为:
16.(2023·四川绵阳·绵阳中学校考二模) 年 月 日,神舟十三号载人飞船返回舱成功着陆,航天
员翟志刚、王亚平、叶光富完成在轨驻留半年的太空飞行任务,标志着中国空间站关键技术验证阶段圆满
资料整理【淘宝店铺:向阳百分百】完成.并将进入建造阶段某地区为了激发人们对天文学的兴趣,开展了天文知识比赛,满分 分( 分
及以上为认知程度高),结果认知程度高的有 人,这 人按年龄分成 组,其中第一组: ,第二
组: ,第三组: ,第四组: ,第五组: ,得到如图所示的频率分布直方图,
已知第一组有 人.
(1)根据频率分布直方图,估计这 人的第 百分位数(中位数 第 百分位数);
(2)现从以上各组中用分层随机抽样的方法抽取 人,担任“党章党史”的宣传使者.
①若有甲(年龄 ),乙(年龄 )两人已确定入选宣传使者,现计划从第四组和第五组被抽到的使者
中,再随机抽取 名作为组长,求甲、乙两人至少有一人被选上的概率;
②若第四组宣传使者的年龄的平均数与方差分别为 和 ,第五组宣传使者的年龄的平均数与方差分别为
和 ,据此估计这 人中 岁所有人的年龄的平均数和方差.
【答案】(1)
(2)① ;②年龄的平均数为 ,方差约为
【解析】(1)设第 百分位数为 ,
, ,
位于第四组: 内;
方法一:由 得: .
方法二:由 得: .
(2)①由题意得,第四组应抽取 人,记为 , , ,甲;第五组抽取 人,
资料整理【淘宝店铺:向阳百分百】记为 ,乙,
对应的样本空间为: , , 甲, , 乙, , 甲, , 乙, 甲, , 乙,甲 ,
甲乙, 乙,共 个样本点.
设事件 为“甲、乙两人至少一人被选上”,
则有 甲, 乙, 甲, 乙, 甲, 乙,甲 ,甲乙, 乙,共有 个样本点.
;
②设第四组的宣传使者的年龄分别为 ,平均数分别为 ,方差分别为 ,
设第五组的宣传使者的年龄分别为 , ,平均数分别为 ,方差分别为 ,
则 , , , ,
可得 , , , ,
设第四组和第五组所有宣传使者的年龄平均数为 ,方差为 .
则 ,
即第四组和第五组所有宣传使者的年龄平均数为 ,
则
.
即第四组和第五组所有宣传使者的年龄方差为 ;
据此估计这 人中年龄在 岁的所有人的年龄的平均数为 ,方差约为 .
17.(2023·全国·高三专题练习)某乡镇为了提高乡镇居民收入,对山区进行大面积指导农民种植黄茋、
党参、当归等药材,同时在种植药材附近种植草,让牛羊吃,发展畜牧业,第二年将种植药材的地改种草
让牛羊吃,将牛羊吃过的草地改种药材,这样药材的生长主要依靠牛羊等有机肥来供给,提高药效,同时
增加农民的经济收入.现将该乡镇某农户近7年(2016-2022年对应年份代码1-7)的种植药材的收入金额绘
资料整理【淘宝店铺:向阳百分百】成折线图,同时统计出相关数据: , , , ,
.
(1)根据图中所给出的折线图,判断 和 哪一个更适合作为回归模型;(给出判断即可,
不必说明理由)
(2)求相关系数 (保留两位小数)并求药材种植收入 关于年份代码 的回归直线方程;
(3)若在生物学上将在药材附近同时种植草称作间作,将药材和草每年轮流种植称作轮作,根据题目所给信
息,分析这两种种植方式对当地居民收入的影响.
附:相关系数 ,回归直线方程 中斜率和截距的最小二乘估计公式分
别为 , .
【答案】(1)
(2) ,
(3)答案见解析
资料整理【淘宝店铺:向阳百分百】【解析】(1)因为折线图更接近直线,所以 更适合作为回归模型.
(2) ,
,
相关系数 ,
根据题意,可得 ,
, .
种植药材收入金额 关于年份代码 的回归直线方程为 .
(3)(答案不唯一,合理即可)①间作:药材和草的间作一方面可以同时发展畜牧业来增加居民收入,
另一方面可以实现土地的利用率,实现单位面积内经济效益的最大化;
②轮作:一方面牛羊粪等有机肥可以用来供给药材的生长从而提高乡镇居民收入,另一方面可以调节土壤
的肥沃能力,形成良性循环,进一步提高土地的生态效益和经济效益.
17.(2022秋·四川遂宁·高三射洪中学校考阶段练习)文旅部门统计了某网红景点在2022年3月至7月的
旅游收入 (单位:万),得到以下数据:
月份 3 4 5 6 7
旅游收入
10 12 11 12 20
(1)根据表中所给数据,求出 关于 之间的线性回归方程;
(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的 列联表,
能否有99.9%的把握认为“游客是否喜欢该网红景点与性别有关联”.
喜欢 不喜欢 总计
男 100
资料整理【淘宝店铺:向阳百分百】女 60
总计 110
参考公式:线性回归方程: ,其中 ,
.
临界值表:
【答案】(1)
(2)表格见解析,有99.9%的把握认为“游客是否喜欢该网红景点与性别有关联”.
【解析】(1)由已知得: ,
,
,
则 关于 的线性回归方程为: .
(2)依题意可得 列联表如下:
喜欢 不喜欢 总计
男 70 30 100
女 40 60 100
总计 110 90 200
零假设 :游客是否喜欢该网红景点与性别无关联,
资料整理【淘宝店铺:向阳百分百】根据列联表中数据, ,
依据小概率值 的独立性检验,我们推断 不成立,
即有99.9%的把握认为“游客是否喜欢该网红景点与性别有关联”.
18.(2023秋·四川巴中·高三统考开学考试)中央电视台“国家品牌计划”栏目组为了做好新能源汽车的
品牌推介,利用网络平台对年龄(单位:岁)在 内的人群进行了调查,并从参与调查者中随机选出
600人,把这600人分为对新能源汽车比较关注和不太关注两类,制成如下表格:
年龄
人数 40 120 160 80
男性
比较关注人数 8 72 112 48
人数 10 70 100 20
女性
比较关注人数 5 49 80 16
(1)完成下面的列联表,并根据列联表判断能否在犯错误的概率不超过0.01的前提下认为性别与对新能源汽
车的关注有关;
不太关
比较关注 总计
注
男性
女性
总计
(2)为了进一步了解不同性别的消费者对新能源汽车的关注情况,采用分层抽样的方法从这600人中选出6
人进行访谈,最后从这6人中随机选出3人参与电视直播节目,记其中男性的人数为 ,求 的分布列与
期望.
附: ,其中 .
0.10 0.05 0.010 0.005
2.706 3.841 6.635 7.879
资料整理【淘宝店铺:向阳百分百】【答案】(1)表格见解析,能;
(2)分布列见解析,2.
【解析】(1)由给定的数表知,男性总人数为400,其中比较关注的有240人,女性中比较关注的有150
人,列联表如下:
不太关
比较关注 总计
注
男性 240 160 400
女性 150 50 200
总计 390 210 600
则
所以能在犯错误的概率不超过0.01的前提下认为性别与对新能源汽车的关注有关.
(2)已知600人中男性与女性的比为 ,则所抽男性人数为 人,所抽女性人数为 人,
依题意, 的可能值为1,2,3, ,
因此 , , ,
所以 的分布列为:
1 2 3
期望为 .
20.(2023秋·陕西汉中·高三统考阶段练习)为加强学生对垃圾分类意义的认识,让学生养成良好的垃圾
分类的习惯,某校团委组织了垃圾分类知识问卷调查.从该校随机抽取100名男生和100名女生参与该问卷
调查,已知问卷调查合格的人中女生比男生多10人,且共有50人不合格.
(1)完成以下2×2列联表,并判断能否有90%的把握认为问卷调查是否合格与学生性别有关联;
问卷调查合 问卷调查不合格 合计
资料整理【淘宝店铺:向阳百分百】格
男生
女生
合计
(2)用频率近似概率,从该校随机抽取3名学生进行垃圾分类知识问卷调查,求这3名学生问卷调查合格的
人数X的分布列和数学期望.
附: ,其中 .
0.10 0.05 0.025 0.010 0.001
2.706 3.841 5.024 6.635 10.828
【答案】(1)答案见详解
(2)答案见详解
【解析】(1)根据题意填写列联表如下:
问卷调查合
格 问卷调查不合格 合计
男生 70 30 100
女生 80 20 100
合计 150 50 200
由 公式, .
,
没有 的把握认为问卷调查是否合格与学生性别有关联;
(2)被抽取学生进行垃圾分类知识问卷调查合格的概率为: ,
被抽取的3名学生问卷调查合格的人数X可能取值有:0,1,2,3,
则 ,
资料整理【淘宝店铺:向阳百分百】,
,
,
则X的分布列为:
X 0 1 2 3
P
则 .
21.(2023秋·湖北·高三孝感高中校联考开学考试)推进垃圾分类处理,是落实绿色发展理念的必然选择,
也是打赢污染防治攻坚战的重要环节. 为了解某居民小区对垃圾分类的了解程度,随机抽取100名小区居
民参与问卷测试,并将问卷测试的得分绘制成下面的频率分布表:
得分
男性人
6 10 19 6 5 6 3
数
女性人
2 5 8 13 11 4 2
数
(1)将小区居民对垃圾分类的了解程度分为“不太了解(得分低于60分)”和“比较了解(得分不低于60
分)”两类,请先完成 列联表,然后依据小概率值 的独立性检验,分析小区居民对垃圾分类
的了解是否与性别有关;
(2)从参与问卷测试且得分不低于80分的小区居民中,按照性别进行分层抽样,共抽取5人,现从这5人中
随机抽取3人作为环保宣传队长,设3人中男性队长的人数为 ,求 的分布列和期望.
比较了
不太了解 合计
解
男性
资料整理【淘宝店铺:向阳百分百】女性
合计
附: .
0. 10 0. 05 0. 01 0. 005 0. 001
2. 706 3. 841 6. 635 7. 879 10. 828
【答案】(1)列联表见解析,小区居民对垃圾分类的了解与性别无关
(2)分布列见解析,期望为
【解析】(1)根据频率分布表得到列联表:
比较了
不太了解 合计
解
男性 35 20 55
女性 15 30 45
合计 50 50 100
零假设为 :小区居民对垃圾分类的了解程度与性别无关,
根据列联表中的数据,经计算得到
,
依据小概率值 的独立性检验,没有充分的证据推断 不成立,
因此可以认为 成立,即小区居民对垃圾分类的了解与性别无关.
(2)不低于80分的居民的样本中,男性有9人,女性有6人,
故抽取男性 人,抽取女性 人,
的可能取值为 ,则
资料整理【淘宝店铺:向阳百分百】, ,
分布列为:
1 2 3
的数学期望为: .
资料整理【淘宝店铺:向阳百分百】