文档内容
第3讲 统计与成对数据的分析(新高考专用)
目录
【真题自测】.................................................................................................................................2
【考点突破】.................................................................................................................................5
【考点一】统计图表、数字特征.....................................................................................................5
【考点二】回归分析.......................................................................................................................8
【考点三】独立性检验..................................................................................................................12
【专题精练】...............................................................................................................................14
1 / 22
学科网(北京)股份有限公司考情分析:
高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与
运用、独立性检验问题,常与概率综合考查,中等难度.
真题自测
一、单选题
1.(2024·全国·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田
的亩产量(单位:kg)并整理如下表
亩产 [900, [1000, [1050, [1150,
[950,1000) [1100,1150)
量 950) 1050) 1100) 1200)
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
2.(2023·全国·高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽
样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,
则不同的抽样结果共有( ).
A. 种 B. 种
C. 种 D. 种
3.(2022·全国·高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机
抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前
和讲座后问卷答题的正确率如下图:
2 / 22
学科网(北京)股份有限公司则( )
A.讲座前问卷答题的正确率的中位数小于
B.讲座后问卷答题的正确率的平均数大于
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
二、解答题
4.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分
为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患
该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良
良好
好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该
疾病”. 与 的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标
为R.
(ⅰ)证明: ;
3 / 22
学科网(北京)股份有限公司(ⅱ)利用该调查数据,给出 的估计值,并利用(ⅰ)的结果给出R的估计值.
附 ,
0.050 0.010 0.001
k 3.841 6.635 10.828
5.(2022·全国·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树
木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位: )和材积量(单位:
),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得 .
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为 .已
知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数 .
6.(2023·全国·高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20
只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养
在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设 表示指定的两只小白鼠中分配到对照组的只数,求 的分布列和数学期望;
(2)实验结果如下:
对照组的小白鼠体重的增加量从小到大排序为:
4 / 22
学科网(北京)股份有限公司15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
实验组的小白鼠体重的增加量从小到大排序为:
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如
下列联表:
对照组
实验组
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加
量有差异.
附:
考点突破
0.100 0.050 0.010
2.706 3.841 6.635
【考点一】统计图表、数字特征
核心梳理:
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×.
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
5 / 22
学科网(北京)股份有限公司(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中
点的横坐标之和.
一、单选题
1.(2024·四川·模拟预测)甲、乙两名运动员在一次射击训练中各射靶20次,命中环数的频率分布条形
图如下.设甲、乙命中环数的众数分别为 , ,方差分别为 , ,则( )
A. , B. ,
C. , D. ,
2.(2024·辽宁·一模)下图是2022年5月一2023年5月共13个月我国纯电动汽车月度销量及增长情况统
计图(单位:万辆),则下列说法错误的是( )(注:同比:和上一年同期相比)
A.2023年前5个月我国纯电动汽车的销量超过214万辆
B.这13个月我国纯电动汽车月度销量的中位数为61.5万辆
C.这13个月我国纯电动汽车月度销量的众数为52.2万辆
6 / 22
学科网(北京)股份有限公司D.和上一年同期相比,我国纯电动汽车月度销量有增有减
二、多选题
3.(2024·河南·模拟预测)某地教师招聘考试,有3200人参加笔试,满分为100分,笔试成绩前20%(含
20%)的考生有资格参加面试,所有考生的笔试成绩和年龄分别如频率分布直方图和扇形统计图所示,则
( )
A.90后考生比00后考生多150人 B.笔试成绩的60%分位数为80
C.参加面试的考生的成绩最低为86分 D.笔试成绩的平均分为76分
4.(2024·广东汕头·一模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了 名
学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这
名学生中,成绩位于[80,90)内的学生成绩方差为 ,成绩位于 内的同学成绩方差为 .则
( )
参考公式:样本划分为 层,各层的容量、平均数和方差分别为: 、 、 ; 、 、 .记样本平均数
为 ,样本方差为 , .
A.
B.估计该年级学生成绩的中位数约为
7 / 22
学科网(北京)股份有限公司C.估计该年级成绩在 分及以上的学生成绩的平均数为
D.估计该年级成绩在 分及以上的学生成绩的方差为
三、填空题
5.(2024·甘肃白银·三模)一组样本数据 的众数为 ,中位数为 .
6.(2024·山东济宁·一模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本
题共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6分,
有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题
正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的
考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地选
了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为 .
7.(23-24高二上·湖北武汉·开学考试)有一组按从小到大顺序排列的数据:3,5, ,8,9,10,若其极
差与平均数相等,则这组数据的中位数为 .
8.(2023·山东聊城·模拟预测)某市统计高中生身体素质的状况,规定身体素质指标值不小于60就认为
身体素质合格.现从全市随机抽取 100名高中生的身体素质指标值 , 经计算
, .若该市高中生的身体素质指标值服从正态分布 ,则估计该
市高中生身体素质的合格率为 .(用百分数作答,精确到0.1%)
参考数据:若随机变量X服从正态分布 ,则 ,
, .
规律方法:
(1)对于给出的统计图表,一定要结合问题背景理解图表意义.
(2)频率分布直方图中纵坐标不要误以为是频率.
【考点二】回归分析
核心梳理:
求经验回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(2)计算出,,a,b.
(3)写出经验回归方程.
一、单选题
1.(2024·四川成都·模拟预测)某老师为了了解数学学习成绩得分y(单位:分)与每天数学学习时间x
8 / 22
学科网(北京)股份有限公司(单位:分钟)是否存在线性关系,搜集了100组数据 ,并据此求得y关于x
的线性回归方程为 .若一位同学每天数学学习时间约80分钟,则可估计这位同学数学成绩为
( )
A.106 B.122 C.136 D.140
2.(2023·四川南充·一模)某商品的地区经销商对2023年1月到5月该商品的销售情况进行了调查,得到
如下统计表.发现销售量y(万件)与时间x(月)成线性相关,根据表中数据,利用最小二乘法求得y与
x的回归直线方程为: .则下列说法错误的是( )
时间x(月) 1 2 3 4 5
销售量y(万件) 1 1.6 2.0 a 3
A.由回归方程可知2024年1月份该地区的销售量为6.8万件
B.表中数据的样本中心点为
C.
D.由表中数据可知,y和x成正相关
二、多选题
3.(21-22高三上·重庆黔江·阶段练习)下列说法中正确的是( )
A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变
B.回归直线 恒过样本点的中心 ,且至少过一个样本点
C.用相关指数 来刻画回归效果时, 越接近1,说明模型的拟合效果越好
D.在 列联表中, 的值越大,说明两个分类变量之间的关系越弱
4.(2024·浙江·一模)为调研加工零件效率,调研员通过试验获得加工零件个数 与所用时间 (单位:
)的5组数据为: ,根据以上数据可得经验回归方程为:
,则( )
9 / 22
学科网(北京)股份有限公司A.
B.回归直线 必过点
C.加工60个零件的时间大约为
D.若去掉 ,剩下4组数据的经验回归方程会有变化
三、填空题
5.(23-24高二上·四川绵阳·期末)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定
的价格进行试销,得到如下数据:
单价(元)
销量(件)
由表中数据,求得线性回归方程 ,若在这些样本点中任取一点,则它在回归直线右上方的概率为
6.(2024·全国·模拟预测)某市一水果店为了了解柑橘的月销售量 (单位:千克)与月平均气温 (单
位: )之间的关系,随机统计了4个月的柑橘的月销售量与当月的平均气温,其数据如下表:
月平均气温x/ 18 12 8 2
月销售量 千
26 45 62 77
克
由表中数据得到 关于 的线性回归方程为 ,气象部门预测2024年4月该市的平均气温为
,据此估计该水果店2024年4月柑橘的销售量为 千克.
四、解答题
7.(2024·河南郑州·三模)按照《中华人民共和国环境保护法》的规定,每年生态环境部都会会同国家发
展改革委等部门共同编制《中国生态环境状况公报》,并向社会公开发布.下表是2017-2021年五年《中
国生态环境状况公报》中酸雨区面积约占国土面积的百分比 :
年份 2017年 2018年 2019年 2020年 2021年
年份代码 1 2 3 4 5
6.4 5.5 5.0 4.8 3.8
(1)求2017—2021年年份代码 与 的样本相关系数(精确到0.01);
10 / 22
学科网(北京)股份有限公司(2)请用样本相关系数说明该组数据中 与 之间的关系可用一元线性回归模型进行描述,并求出 关于
的经验回归方程;
(3)预测2024年的酸雨区面积占国土面积的百分比.
(回归直线的斜率和截距的最小二乘法估计公式分别为:
附:样本相关系数, .
8.(23-24高三上·湖南衡阳·阶段练习)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高
科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,
其中年份代码1∼10分别对应年份2013∼2022.
根据散点图,分别用模型① ,② 作为年研发投入y(单位:亿元)关于年份代码x的
经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计
量的值:
75 2.25 82.5 4.5 120 28.35
表中 , .
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经
11 / 22
学科网(北京)股份有限公司验回归方程模型?并说明理由;
(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;
(ii)设该科技公司的年利润 (单位:亿元)和年研发投入y(单位:亿元)满足 (
且 ),问该科技公司哪一年的年利润最大?
附:对于一组数据(x ,y ),(x ,y ),…, ,其经验回归直线 的斜率和截距的最小二乘估
1 1 2 2
计分别为 , .
规律方法:
(1)样本点不一定在经验回归直线上,但点(,)一定在经验回归直线上.
(2)求b时,灵活选择公式,注意公式的推导和记忆.
(3)利用样本相关系数判断相关性强弱时,看|r|的大小,而不是r的大小.
(4)区分样本相关系数r与决定系数R2.
(5)通过经验回归方程求的都是估计值,而不是真实值.
【考点三】独立性检验
核心梳理:
独立性检验的一般步骤
(1)根据样本数据列2×2列联表.
(2)根据公式χ2=,计算χ2的值.
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H 成立(两类变量相互独立)的概
0
率越小,H 不成立的概率越大.
0
一、解答题
1.(2024·安徽合肥·二模)树人中学高三(1)班某次数学质量检测(满分150分)的统计数据如下表:
参加考试人
性别 平均成绩 标准差
数
男 30 100 16
女 20 90 19
12 / 22
学科网(北京)股份有限公司在按比例分配分层随机抽样中,已知总体划分为2层,把第一层样本记为 ,其平均数记为 ,
方差记为 ;把第二层样本记为 ,其平均数记为 ,方差记为 ;把总样本数据的平均数
记为 ,方差记为 .
(1)证明: ;
(2)求该班参加考试学生成绩的平均数和标准差(精确到1);
(3)假设全年级学生的考试成绩服从正态分布 ,以该班参加考试学生成绩的平均数和标准差分别作
为 和 的估计值.如果按照 的比例将考试成绩从高分到低分依次划分为 四
个等级,试确定各等级的分数线(精确到1).
附: .
2.(2024·辽宁·模拟预测)土壤食物网对有机质的分解有两条途径,即真菌途径和细菌途径.在不同的土
壤生态系统中,由于提供能源的有机物其分解的难易程度不同,这两条途径所起的作用也不同.以细菌分
解途径为主导的土壤,有机质降解快,氮矿化率高,有利于养分供应,以真菌途径为主的土壤,氮和能量
转化比较缓慢,有利于有机质存贮和氮的固持.某生物实验小组从一种土壤数据中随机抽查并统计了8组
数据,如下表所示:
编号 1 2 3 4 5 6 7 8
细菌 百万个 70 80 90 100 110 120 130 140
真菌 百万个 8.0 10.0 12.5 15.0 17.5 21.0 27.0 39.0
其散点图如下,散点大致分布在指数型函数 的图象附近.
13 / 22
学科网(北京)股份有限公司(1)求 关于 的经验回归方程(系数精确到0.01);
(2)在做土壤相关的生态环境研究时,细菌与真菌的比值能够反映土壤的碳氮循环.以样本的频率估计总体
分布的概率,若该实验小组随机抽查8组数据,再从中任选4组,记真菌 (单位:百万个)与细菌
(单位:百万个)的数值之比位于区间 内的组数为 ,求 的分布列与数学期望.
附:经验回归方程 的斜率和截距的最小二乘估计公式分别为 ,
3.(2024·江苏南京·二模)某地5家超市春节期间的广告支出x(万元)与销售额y(万元)的数据如下:
超市 A B C D E
广告支出x 2 4 5 6 8
销售额y 30 40 60 60 70
(1)从A,B,C,D,E这5家超市中随机抽取3家,记销售额不少于60万元的超市个数为X,求随机变量
X的分布列及期望 ;
(2)利用最小二乘法求y关于x的线性回归方程,并预测广告支出为10万元时的销售额.
附:线性回归方程 中斜率和截距的最小二乘估计公式分别为: , .
4.(2024·黑龙江哈尔滨·一模)入冬以来,东北成为全国旅游和网络话题的“顶流”.南方的小土豆们纷
纷北上体验东北最美的冬天,这个冬天火的不只是东北的美食、东北人的热情,还有东北的洗浴中心,拥
挤程度堪比春运,南方游客直接拉着行李箱进入.东北某城市洗浴中心花式宠“且”,为给顾客更好的体
验,推出了 和 两个套餐服务,顾客可自由选择 和 两个套餐之一,并在App平台上推出了优惠券活
动,下表是该洗浴中心在App平台10天销售优惠券情况.
日期 1 2 3 4 5 6 7 8 9 10
销售量 (千
1.9 1.98 2.2 2.36 2.43 2.59 2.68 2.76 2.7 0.4
张)
14 / 22
学科网(北京)股份有限公司经计算可得: , , .
(1)因为优惠券购买火爆,App平台在第10天时系统出现异常,导致当天顾客购买优惠券数量大幅减少,现
剔除第10天数据,求 关于 的经验回归方程(结果中的数值用分数表示);
(2)若购买优惠券的顾客选择 套餐的概率为 ,选择 套餐的概率为 ,并且 套餐可以用一张优惠券,
套餐可以用两张优惠券,记App平台累计销售优惠券为 张的概率为 ,求 ;
(3)记(2)中所得概率 的值构成数列 .
①求 的最值;
②数列收敛的定义:已知数列 ,若对于任意给定的正数 ,总存在正整数 ,使得当 时,
,( 是一个确定的实数),则称数列 收敛于 .根据数列收敛的定义证明数列 收敛.
参考公式: , .
规律方法:
(1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.
(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
专题精练
一、单选题
1.(2024·全国·模拟预测)某机构统计了中国2018—2022年全部工业增加值(单位:万亿元)及增长率数
据如图所示,则下列结论错误的是( )
15 / 22
学科网(北京)股份有限公司A.2018—2022年中国的全部工业增加值逐年增加
B.2018—2022年中国全部工业增加值的增长率的极差为
C.与上一年相比,2022年中国增加的全部工业增加值是2019年增加的全部工业增加值的2倍
D.2018年中国全部工业增加值的增长率比2018—2022年中国全部工业增加值的增长率的最小值高
2.(2024·四川遂宁·三模)某调查机构对某地快递行业从业者进行调查统计,得到快递行业从业人员年龄
分布饼状图(图1)、“90后”从事快递行业岗位分布条形图(图2),则下列结论中错误的是( )
A.快递行业从业人员中,“90后”占一半以上
B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的20%
C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多
D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多
3.(2024·陕西西安·模拟预测)某校为了解在校学生对中国传统文化的传承认知情况,随机抽取了100名
学生进行中国传统文化知识考试,并将这100名学生成绩整理得到如下频率分布直方图.根据此频率分布
直方图(分成[40,50),[50,60),[60,70), ,[80,90),[90,100]六组),下列结论中不正确的是
( )
16 / 22
学科网(北京)股份有限公司A.图中的
B.若从成绩在 ,[80,90),[90,100]内的学生中采用分层抽样抽取10名学生,则成绩在[80,90)
内的有3人
C.这100名学生成绩的中位数约为65
D.若同一组中的数据用该组区间的中点值作代表,则这100名学生的平均成绩约为68.2
4.(23-24高三上·湖北·期末)有一组样本数据:5,6,6,6,7,7,8,8,9,9.则关于该组数据的下列
数字特征中,数值最大的为( )
A.平均数 B.第50百分位数 C.极差 D.众数
5.(2024·湖南·模拟预测)已知由小到大排列的 个数据 、 、 、 ,若这 个数据的极差是它们中位
数的 倍,则这 个数据的第 百分位数是( )
A. B.6 C. D.4
6.(2024·浙江·二模)为了解某中学学生假期中每天自主学习的时间,采用样本量比例分配的分层随机抽
样,现抽取高一学生40人,其每天学习时间均值为8小时,方差为0.5,抽取高二学生60人,其每天学习
时间均值为9小时,方差为0.8,抽取高三学生100人,其每天学习时间均值为10小时,方差为1,则估计
该校学生每天学习时间的方差为( )
A.1.4 B.1.45 C.1.5 D.1.55
7.(23-24高三下·山东·开学考试)为研究某池塘中水生植物的覆盖水塘面积 (单位: )与水生植物
的株数 (单位:株)之间的相关关系,收集了4组数据,用模型 去拟合 与 的关系,设
与 的数据如表格所示:得到 与 的线性回归方程 ,则 ( )
3 4 6 7
2 2.5 4.5 7
17 / 22
学科网(北京)股份有限公司A.-2 B.-1 C. D.
8.(21-22高二下·山东滨州·期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否
有关联进行了一次调查,其中被调查的男生、女生人数均为 人,男生中喜欢短视频的人数占男
生人数的 ,女生中喜欢短视频的人数占女生人数的 .零假设为 :喜欢短视频和性别相互独立.若依据
的独立性检验认为喜欢短视频和性别不独立,则 的最小值为( )
附: ,附表:
0.05 0.01
3.841 6.635
A.7 B.8 C.9 D.10
二、多选题
9.(2020·海南·高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11
天复工复产指数折线图,下列说法正确的是
A.这11天复工指数和复产指数均逐日增加;
B.这11天期间,复产指数增量大于复工指数的增量;
C.第3天至第11天复工复产指数均超过80%;
D.第9天至第11天复产指数增量大于复工指数的增量;
10.(2024·安徽·三模)下列关于概率统计的说法中正确的是( )
A.某人在10次答题中,答对题数为 ,则答对7题的概率最大
B.设随机变量 服从正态分布 ,若 ,则
18 / 22
学科网(北京)股份有限公司C.已知回归直线方程为 ,若样本中心为 ,则
D.两个变量 的相关系数为 ,则 越小, 与 之间的相关性越弱
11.(2024·湖北·一模)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层抽
样的方式随机抽取100名学生进行问卷调查,将调查的结果得到如下等高堆积条形图和列联表,则( )
数学兴趣
性别 合计
感兴趣 不感兴趣
女生
男生
合计 100
参考数据:本题中
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.表中
B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多
C.根据小概率值 的 独立性检验,可以认为性别与对数学的兴趣有差异
D.根据小概率值 的 独立性检验,可以认为性别与对数学的兴趣没有差异
三、填空题
12.(2023·全国·模拟预测)某农业科研所在5块面积相同的长方形试验田中均种植了同-一种农作物,每
一块试验田的施肥量x(单位:kg)与产量y(单位:kg)之间有如下关系:
19 / 22
学科网(北京)股份有限公司施肥量x/kg 20 40 50 60 80
产量y/kg 600 800 1200 1000 1400
已知y与x满足线性回归方程 ,则当施肥量为80kg时,残差为 .
13.(2024·全国·模拟预测)记样本数据10,18,8,4,16,24,6,8,32的中位数为a,平均数为b,则
= .
14.(2024·广东广州·一模)某校数学建模兴趣小组收集了一组恒温动物体重 (单位:克)与脉搏率
(单位:心跳次数/分钟)的对应数据 ,根据生物学常识和散点图得出 与 近似满足
( 为参数).令 , ,计算得 , , .由最小二乘法得经验回
归方程为 ,则 的值为 ;为判断拟合效果,通过经验回归方程求得预测值
,若残差平方和 ,则决定系数 .(参考公式:决定系数
)
四、解答题
15.(2024·浙江温州·二模)红旗淀粉厂2024年之前只生产食品淀粉,下表为年投入资金 (万元)与年
收益 (万元)的8组数据:
10 20 30 40 50 60 70 80
12.8 16.5 19 20.9 21.5 21.9 23 25.4
(1)用 模拟生产食品淀粉年收益 与年投入资金 的关系,求出回归方程;
20 / 22
学科网(北京)股份有限公司(2)为响应国家“加快调整产业结构”的号召,该企业又自主研发出一种药用淀粉,预计其收益为投入的
.2024年该企业计划投入200万元用于生产两种淀粉,求年收益的最大值.(精确到0.1万元)
附:①回归直线 中斜率和截距的最小二乘估计公式分别为: ,
②
161 29 20400 109 603
③
16.(23-24高三下·全国·开学考试)2023年11月,世界首届人工智能峰会在英国举行,我国因为在该领
域取得的巨大成就受邀进行大会发言.为了研究不同性别的学生对人工智能的了解情况,我市某著名高中进
行了一次抽样调查,分别抽取男、女生各50人作为样本.设事件 “了解人工智能”, “学生为男
生”,据统计 .
(1)根据已知条件,填写下列 列联表,是否有 把握推断该校学生对人工智能的了解情况与性别有关?
了解人工智
不了解人工智能 合计
能
男生
女生
合计
(2)①现从所抽取的女生中利用分层抽样的方法抽取20人,再从这20人中随机选取3人赠送科普材料,求
选取的3人中至少有2人了解人工智能的概率;
②将频率视为概率,从我市所有参与调查的学生中随机抽取20人科普材料,记其中了解人工智能的人数为
X,求随机变量 的数学期望和方差.
参考公式: .常用的小概率值和对应的临界值如下表:
0.150 0.100 0.050 0.025 0.010 0.005 0.001
21 / 22
学科网(北京)股份有限公司2.072 2.706 3.841 5.024 6.635 7.879 10.828
22 / 22
学科网(北京)股份有限公司