文档内容
02 卷 第九章 统计与统计案例《真题模拟卷》
-2022 年高考一轮数学单元复习(新高考专用)
第I卷(选择题)
一、单选题
1.(2021·天津高考真题)从某网络平台推荐的影视作品中抽取 部,统计其
评分分数据,将所得 个评分数据分为 组: 、 、 、
,并整理得到如下的费率分布直方图,则评分在区间 内的影视作
品数量是( )
A. B. C. D.
2.(2021·全国高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入
进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
3.(2008·山东高考真题(文))从某项综合能力测试中抽取100人的成绩,统计如
表,则这100人成绩的标准差为( )
分数 5 4 3 2 1
人数 20 10 30 30 10
A. B. C.3 D.
4.(2020·天津高考真题)从一批零件中抽取80个,测量其直径(单位: ),将
所得数据分为9组: ,并整理
得到如下频率分布直方图,则在被抽取的零件中,直径落在区间 内的个数
为( )
A.10 B.18 C.20 D.36
5.(2020·全国高考真题(文))设一组样本数据x,x,…,x 的方差为0.01,则数
1 2 n
据10x,10x,…,10x 的方差为( )
1 2 n
A.0.01 B.0.1 C.1 D.106.(2019·全国高考真题(理))演讲比赛共有9位评委分别给出某选手的原始评
分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7
个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
A.中位数 B.平均数
C.方差 D.极差
7.(重庆市第八中学2020-2021学年高二下学期期中数学试题)随机调查了相同数量
的男、女学生,发现有 的男生喜欢网络课程,有 的女生不喜欢网络课程,
且有 的把握但没有 的把握认为是否喜欢网络课程与性别有关,则被调查的
男、女学生总数量可能为( )
附: ,其中 .
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
A. B. C. D.
8.(2021·云南高二期末(文))由数据 , ,…, 可得 关
于 的线性回归方程为 ,若 ,则 ( )
A.48 B.52 C.56 D.80
9.(2021·重庆西南大学附中高二期末)下列说法中正确的个数是( )
①某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按简单随机抽样的
方法抽取为200人,则每个女生被抽到的概率为 ;
②设有一个回归方程 ,变量 增加1个单位时, 平均增加5个单位;
③将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
④具有线性相关关系的两个变量 , 的相关系数为r.则 越接近于0, , 之间的线性相关程度越高;
⑤在一个 列联表中,由计算得出 ,而 ,则在犯
错误的概率不超过0.001的前提下认为这两个变量之间有相关关系
A.1 B.2 C.3 D.4
10.(2020·黑龙江省哈尔滨市双城区兆麟中学高二期末(文))下列说法错误的是(
)
A.回归直线过样本点的中心
B.在残差图中,残差点分布的带状区域的宽度越窄,其模型拟合的精度越高
C.线性回归方程对应的直线 至少经过其样本数据点 , ,
…, 中的一个点
D.在回归分析中, 的模型比 的模型拟合的效果好
11.(2021·重庆南开中学高二期末)“绿水青山就是金山银山”,某城市发起了“减
少碳排放行动”,通过增加植树面积,逐步实现碳中和,为调查民众对减碳行动的参
与情况,在某社区随机调查了90位市民,每位市民对减碳行动给出认可或不认可的评
价,得到如图所示的列联表、经计算 的观测值 ,则可以推断出( )
认可 不认可
40岁以下 20 20
40岁以上(含40岁) 40 10
附:
A.该社区居民中约有99%的人认可“减碳行动”
B.该社区居民中约有99.5%的人认可“减碳行动
C.在犯错率不超过0.005的前提下,认为“减碳行动"的认可情况与年龄有关
D.在犯错率不超过0.001的前提下,认为“减碳行动"的认可情况与年龄有关二、多选题
12.(2021·全国高考真题)下列统计量中,能度量样本 的离散程度的是
( )
A.样本 的标准差 B.样本 的中位数
C.样本 的极差 D.样本 的平均数
13.(2021·全国高考真题)有一组样本数据 , ,…, ,由这组数据得到新样
本数据 , ,…, ,其中 ( 为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样数据的样本极差相同
14.(2021·广东高二期中)下列说法正确的是( )
A.对于独立性检验,随机变量 的观测值 值越小,判定“两变量有关系”犯错误
的概率越小
B.在回归分析中,相关指数 越大,说明回归模型拟合的效果越好
C.随机变量 ,若 , ,则
D.甲、乙、丙、丁 个人到 个景点旅游,每人只去一个景点且每个景点都有人去,
设事件 为“ 个人去的景点各不相同”,事件 为“甲不去其中的 景点”,则
15.(2021·江苏省天一中学高二期末)晚上睡眠充足是提高学习效率的必要条件.某
高中高二的学生分为寄宿生和走读生两类,其中寄宿生晚上9:50必须休息,睡眠能
得到充分的保证;走读生晚上大多10:30休息,甚至更晚.为了了解这两类学生的学
习效率情况,该校有关部门分别对这两类学生学习总成绩的前50名进行问卷调查,得
到如下表所示的统计数据,则( )
寄宿生 走读生学习效率高 30 10
学习效率低 20 40
附: ,
0.050 0.010 0.005 0.001
3.841 6.635 7.879 10.828
A.走读生前50名学生中有40%的学生学习效率高
B.寄宿生前50名学生中有60%的学生学习效率高
C.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过0.05
D.有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”
16.(2021·沙坪坝区·重庆一中高二期中)针对时下的“抖音热”,某校团委对“学生
性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢
抖音的人数占男生人数的 ,女生喜欢抖音的人数占女生人数 ,若在犯错误概率不
超过0.05的前提下认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )
人
0.050 0.010
3.841 6.635
附:
A.25 B.40 C.45 D.60
17.(2021·镇江崇实女子中学高二期中)关于变量x,y的n个样本点
及其线性回归方程 ,下列说法正确的有
( )
A.相关系数r的绝对值 越接近0,表示x,y的线性相关程度越强
B.相关系数r的绝对值 越接近1,表示x,y的线性相关程度越强C.残差平方和越大,表示线性回归方程拟合效果越好
D.若 ,则点 一定在线性回归方程 上
18.(2021·河南高二期中(文))有一散点图如图所示,在5个 数据中去掉
后,下列说法不正确的是( )
A.残差平方和变小 B.相关系数r变小
C.相关指数 变小 D.解释变量x与预报变量y的相关性变
弱
19.(2021·全国高二专题练习)(多选题)对相关系数r来说,下列说法错误的有(
)
A.|r|≤1,|r|越接近0,相关程度越大;|r|越接近1,相关程度越小
B.|r|≥1,|r|越接近1,相关程度越大;|r|越大,相关程度越小
C.|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小
D.|r|≥1,|r|越接近1,相关程度越小;|r|越大,相关程度越大
20.(【新教材精创】8.2一元线性回归模型及其应用-A基础练)(多选题)在用最
小二乘法进行线性回归分析时,下列说法中正确的是( )
A.由样本数据得到的线性回归方程 必过样本点的中心 ;
B.由样本点 , ,…, 得到回归直线,则这些样本点都在回归
直线上;
C.利用 来刻画回归的效果, 比 的模型回归效果好;
D.残差图中的残差点比较均匀地落在水平的带状区域中,宽度越窄,则说明模型拟
合精度越低;
第II卷(非选择题)
请点击修改第II卷的文字说明
三、填空题
21.(2012·浙江高考真题(文))某个年级有男生560人,女生420人,用分层抽样
的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为
____________.
22.(2020·江苏高考真题)已知一组数据 的平均数为4,则 的值是
_____.
23.(2019·全国高考真题(文))我国高铁发展迅速,技术先进.经统计,在经停某
站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10
个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为
___________.
24.(2010·安徽高考真题(文))某地有居民100 000户,其中普通家庭99 000户,高
收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以
简单随机抽样方式抽取l00户进行调查,发现共有120户家庭拥有3套或3套以上住房,
其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你
认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是 .
25.(2009·浙江高考真题(文))某个容量为 的样本的频率分布直方图如下,则
在区间 上的数据的频数为_________.
26.(2011·辽宁高考真题(文))调查了某地若干户家庭的年收入x(单位:万元)
和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程: =0.245x+0.321.由回归直线方程可知,家
庭年收入每增加1万元,年饮食支出平均增加_______万元.
27.(2014·天津高考真题(文))某大学为了解在校本科生对参加某项社会实践活动
的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的
样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:
5:5:6,则应从一年级本科生中抽取_______名学生.
28.(2021·重庆字水中学高二期末)某工厂为研究某种产品的产量 (吨)与所需某
种原材料的质量 (吨)的相关性,在生产过程中收集4组对应数据 ,如下表所
示.(残差=观测值-预测值)
3 4 5 6
2.5 3 4
根据表中数据,得出 关于 的经验回归方程为 .据此计算出在样本
处的残差为 ,则表中 的值为______.
29.(2021·四川高三零模(文))有人发现,多看手机容易使人近视,下表是调查机
构对此现象的调查数据:
近视 不近视 总计
少看手机
多看手机
总计
则在犯错误的概率不超过__________的前提下认为近视与多看手机有关系.
附表:
参考公式: ,其中 .
30.(2021·河南高二期中(文))某企业计划通过广告宣传来提高销售额,经统计,
产品的广告费 (单位:百万元)与销售额 (单位:百万元)之间有如下对应数据:0 1 2 3 4
14.8 30.4 36.2 39.6 51
由表中的数据得线性回归方程为 .投入的广告费 时,销售额的预报
值为______百万元.
31.(2021·天津高二期末)对两个变量x,y进行回归分析.
①残差的平方和越小,模型的拟合效果越好;
②相关系数 的绝对值接近于0,两个随机变量的线性相关性越强;
③在经验回归方程 中,当解释变量x每增加1个单位时,相应变量 平
均增加 个单位;
④某人研究儿子身高 与父亲身高 的关系,得到经验回归方程
,当 时, ,即:如果一个父亲的身高为
,则儿子的升高一定为 .
则以上结论中正确的序号为__________.
32.(2021·全国高二专题练习)某公交公司推出扫码支付乘车优惠活动,活动为期两
周,活动的前五天数据如下表:
第 天 1 2 3 4 5
使用人数( ) 15 173 457 842 1333
由表中数据可得y关于x的回归方程为 ,则据此回归模型相应于点(2,
173)的残差为________.
33.(2021·全国高二专题练习)甲、乙、丙、丁四位同学各自对 两变量的线性相
关性做试验,并用回归分析方法分别求得相关系数 如下表:
甲 乙 丙 丁
-0.78
则____________同学的试验结果体现A,B两变量有更强的线性相关性.四、双空题
34.(2017·北京高考真题(理))三名工人加工同一种零件,他们在一天中的工作情
况如图所示,其中点A的横、纵坐标分别为第i名工人上午的工作时间和加工的零件
i
数,点B的横、纵坐标分别为第i名工人下午的工作时间和加工的零件数,i=1,2,3.
i
①记Q为第i名工人在这一天中加工的零件总数,则Q,Q,Q 中最大的是
i 1 2 3
_________.
②记p为第i名工人在这一天中平均每小时加工的零件数,则p,p,p 中最大的是
i 1 2 3
_________.
35.(2009·广东高考真题(文))某单位200名职工的年龄分布情况如图,现要从中
抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺
序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,
则第8组抽出的号码应是____.若用分层抽样方法,则40岁以下年龄段应抽取_____
人.
36.(2021·北京朝阳区·高二期末)判断对错,并在相应横线处划“√”或“×”.①样
本相关系数 时,称成对数据正相关, 时,称成对数据负相关
___________.②样本相关系数的绝对值 越接近于1,线性相关程度越弱, 越接近
于0,线性相关程度越强___________.
37.(2021·浙江高二课时练习)某产品的广告费用x(万元)与销售额y(万元)的统计数
据如下表:
广告费用 (万元) 4 2 3 5销售额 (万元) 49 26 39 54
根据上表可得回归方程 中的 为9.4,则:
①回归方程 中 ___________;
②据此模型预报广告费用为6万元时销售额为___________万元.
38.(2021·江苏高三专题练习)我国探月工程嫦娥五号探测器于2020年12月1日23
时11分降落在月球表面预选着陆区,在顺利完成月面自动采样之后,成功将携带样品
的上升器送入到预定环月轨道,这是我国首次实现月球无人采样和地外天体起飞,对
我国航天事业具有重大而深远的影响,为进一步培养中学生对航空航天的兴趣爱好,
某学校航空航天社团在本校高一年级进行了纳新工作,前五天的报名情况为:第1天3
人,第2天6人,第3天10人,第4天13人,第5天18人,通过数据分析已知,报
名人数与报名时间具有线性相关关系.已知第 天的报名人数为 ,则 关于 的线
性回归方程为___________,该社团为了解中学生对航空航天的兴趣爱好和性别是否有
关系,随机调查了100名学生,并得到如下 列联表:
有兴趣 无兴趣 合计
男生 45 5 50
女生 30 20 50
合计 75 25 100
请根据上面的列联表,在概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱
好和性别_______(填“有”或”无”)关系
参考公式及数据:回归方程 中斜率的最小二乘估计公式为:
, ;
,其中 .
0.10 0.05 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.82839.(2018·北京全国·高二单元测试(理))关于 与 ,有如下数据有如下的两个模
型:(1) ;(2) .通过残差分析发现第(1)个线性模型比第
(2)个拟合效果好,则 ________ , ______ (用大于,小于号填空,
是相关指数和残差平方和)
2 4 5 6 8
30 40 60 50 70
40.(2018·全国)某医疗机构为了了解肝病与酗酒是否有关,对成年人进行了一次随机
抽样抽查,结果如下表:
患肝病 未患肝病 合 计
酗 酒 30 170 200
不酗酒 20 280 300
合 计 50 450 500
从直观上你能得到的结论是_________,得到患肝病与酗酒有关系的判断有_____的把握.
41.(2021·全国高二单元测试)某高校“统计初步”课程的教师随机调查了选该课的
一些学生情况,具体数据如下表:
专业
非统计专业 统计专业
性别
男 13 10
女 7 20
为了判断主修统计专业是否与性别有关系,根据表中的数据,计算得到K2=
________(保留三位小数),所以判定________(填“能”或“不能”)在犯错误的概率不
超过0.05的前提下认为主修统计专业与性别有关系.
42.(2018·全国)对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病
人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
又发作过心脏病 未发作过心脏病 合计
心脏搭桥手术 39 157 196血管清障手术 29 167 196
合计 68 324 392
试根据上述数据计算K2≈________,能否作出这两种手术对病人又发作心脏病的影响
有差别的结论________(填“能”或“不能”).
五、解答题
43.(2021·全国高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设
备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得
到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为 和 ,样本方差分别记
为 和 .
(1)求 , , , ;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果
,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,
否则不认为有显著提高).
44.(2014·广东高考真题(理))随机观测生产某种零件的某工厂 名工人的日加
工零件数(单位:件),获得数据如下: 、 、 、 、 、 、 、 、
、 、 、 、 、 、 、 、 、 、 、 、 、 、 、
、 ,根据上述数据得到样本的频率分布表如下:
分组 频数 频率(1)确定样本频率分布表中 、 、 和 的值;
(2)根据上述频率分布表,画出样本频率分布直方图;
(3)根据样本频率分布直方图,求在该厂任取 人,至少有 人的日加工零件数落在
区间 的概率.
45.(2016·全国高考真题(文))某公司计划购买1台机器,该种机器使用三年后即被
淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在
机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几
个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下
面柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件
上所需的费用(单位:元), 表示购机的同时购买的易损零件数.
(Ⅰ)若 =19,求y与x的函数解析式;(Ⅱ)若要求“需更换的易损零件数不大于 ”的频率不小于0.5,求 的最小值;
(Ⅲ)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个
易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依
据,购买1台机器的同时应购买19个还是20个易损零件?
46.(2017·北京高考真题(文))某学校艺术专业300名学生参加某次测评,根据男
女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,
将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方
图:
(1)从总体的300名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相
等.试估计总体中男生和女生人数的比例.
47.(2019·全国高考真题(理))为了解甲、乙两种离子在小鼠体内的残留程度,进
行如下试验:将200只小鼠随机分成 两组,每组100只,其中 组小鼠给服甲离
子溶液, 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过
一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得
到如下直方图:记 为事件:“乙离子残留在体内的百分比不低于 ”,根据直方图得到 的估
计值为 .
(1)求乙离子残留百分比直方图中 的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值
为代表).
48.(2011·辽宁高考真题(理))
某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种
乙)进行田间试验.选取两大块地,每大块地分成n小块地,在总共2n小块地中,随机
选n小块地种植品种甲,另外n小块地种植品种乙.
(I)假设n=4,在第一大块地中,种植品种甲的小块地的数目记为X,求X的分布列
和数学期望;
(II)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在个小块
地上的每公顷产量(单位:kg/hm2)如下表:
分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认
为应该种植哪一品种?
附:样本数据x,x,…,x 的样本方差
1 2 a
,其中 为样本平均数.
49.(2013·全国高考真题(文))经销商经销某种农产品,在一个销售季度内,每售
出1t该产品获利润500元,未售出的产品,每1t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如右图所示.经销商为下一个销售季度购进了
130t该农产品.以 (单位:t,100≤ ≤150)表示下一个销售季度内的市场需求量,
T(单位:元)表示下一个销售季度内经销该农产品的利润.
(Ⅰ)将T表示为 的函数;
(Ⅱ)根据直方图估计利润T不少于57000元的概率.
50.(2010·全国高考真题(文))为调查某地区老人是否需要志愿者提供帮助,用简
单随机抽样方法从该地区调查了500位老年人,结果如下:
是否需要志愿 性别 男 女
需要 40 30
不需要 160 270
(1) 估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2) 能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别
有关?
(3) 根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要
志愿帮助的老年人的比例?说明理由
附:
51.(2021·渭南市杜桥中学高一期末)下表提供了某厂生产甲产品过程中记录的产量
(吨)与相应的生产能耗 吨标准煤)的几组对照数据:2 4 6 8 10
5 6 5 9 10
(1)请根据上表提供的数据,用最小二乘法求出 与 的线性回归方程 ;
(2)根据(1)求出的线性回归方程,预测生产20吨甲产品的生产能耗是多少吨标准
煤.
(附 )
52.(福建省福州第一中学2020-2021学年高二下学期期中考试数学试题)福州市风
景秀丽,是著名的旅游城巿,很多人慕名而来旅游,牛角梳是我市的著名土特产,在
我市重要景点三坊七巷有一家牛角梳店,通过在店面随机询问60名购买牛角梳的游客
之前是否知道牛角梳是本市特产,得到如下列联表:
男 女 总计
事先知道牛角梳 8 16 24
事先不知道牛角梳 32 4 36
总计 40 20 60
(1)由以上列联表判断,能否在犯错误的概率不超过0.001的前提下认为购买牛角梳
和是否事先知道牛角梳为本市特产有关系?
(2)从被询问的24名事先知道牛角梳为本市特产的顾客中随机选取2名顾客,求抽
到的女顾客人数的分布列及其数学期望.
附: .
0.010 0.005 0.001
6.635 7.879 10.828
53.(重庆市第八中学2020-2021学年高二下学期期中数学试题)为了研究黏虫孵化
的平均温度 (单位: )与孵化天数 之间的关系,重庆八中高2022级某课外兴
趣小组通过试验得到如下6组数据:组号 1 2 3 4 5 6
平均温度 15.3 16.8 17.4 18 19.5 21
孵化天数 16.7 14.8 13.9 13.5 8.4 6.2
他们分别用两种模型① ,② 分别进行拟合,得到相应的回归方程并
进行残差分析,得到如图所示的残差图:
模型① 模型②
经计算得 , , , ,
(Ⅰ)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?(给出判断即可,
不必说明理由)
(Ⅱ)残差绝对值大于1的数据被认为是异常数据,需要剔除,剔除后应用最小二乘
法建立 关于 的线性回归方程.(系数精确到0.1)
参考公式:回归方程 中斜率和截距的最小二乘法估计公式分别为:
, .
54.(2021·江苏姜堰中学高二期末)随着节能减排意识深入人心以及共享单车的大范
围推广,越来越多的市民在出行时喜欢选择共享单车,为了研究广大市民在共享单车
上的使用情况,某公司在我市随机抽取了100民用户进行调查,得到如下数据:
每周使用
1次 2次 3次 4次 5次 6次及以上
次数
男 4 3 3 7 8 30
女 6 5 4 4 6 20合计 10 8 7 11 14 50
(1)如果认为每周使用超过3次的用户为“喜欢骑行共享单车”,请设计 列联表,
并判断是否有95%的把握认为“是否喜欢骑行共享单车与性别有关”?
(2)每周骑行共享单车6次及6次以上的用户称为“骑行达人”,将频率看作概率,
在我市所有“骑行达人”中,随机抽取4名用户,对抽出的女性“骑行达人”每人奖
励500元,记奖励金额为 ,求 的分布列及均值.
附:下面的临界值表仅供参考:
0.050 0.010 0.001
x 3.841 6.635 10.828
0
(参考公式: ,其中
55.(2021·云南高二期末(文))某重点中学调查了100位学生在市统考中的理科综
合分数,以 , , , , ,
, 分组的频率分布直方图如图.
将理科综合分数不低于240分的学生称为成绩“优秀”
(1)估计某学生的成绩为“优秀”的概率;
(2)根据已知条件完成下面的2×2列联表,并据此资料判断是否有95%的把握认为成
绩“优秀”与性别有关.
成绩“非优秀” 成绩“优秀” 合计
男
女 15 45
合计附: , .
0.050 0.010 0.001
k 3.841 6.635 10.828