文档内容
考点巩固卷 21 统计与统计案例(七大考点)
考点1 简单随机抽样
1.电影《孤注一掷》的上映引发了电信诈骗问题的热议,也加大了各个社区反电信诈骗的宣传力度.已知
某社区共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年龄进行分层随机抽样,
共抽取36人作为代表,则中年人比青少年多( )
A.6人 B.9人 C.12人 D.18人
2.已知 三种不同型号的产品数量之比依次为 ,现用分层抽样的方法抽取容量为 的样本,
若样本中 型号产品有 件,则 为( )
A.60 B.70 C.80 D.90
3.国内某优秀新能源电池制造企业在锂电池单位能量密度技术上取得了重大突破,该制造企业内的某车间有两条生产线,分别生产高能量密度锂电池和低能量密度锂电池,总产量为400个锂电池.质检人员采
用分层随机抽样的方法随机抽取了一个容量为80的样本进行质量检测,已知样本中高能量密度锂电池有
35个,则估计低能量密度锂电池的总产量为( ).
A.325个 B.300个 C.225个 D.175个
4.用按比例分配的分层随机抽样方法,从某学校的600名男生和800名女生中选取14人参与某项研学活
动,则女生比男生多选取( )
A.8 人 B.6人 C.4人 D.2人
5.已知甲组数据:1,3,5,7,9,11,乙组数据:2,4,8,16,根据不同组别,用分层抽样的方法随
机抽取一个容量为5的样本,则该样本的平均数不可能是( )
A.5 B.7 C.9 D.11
6.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生近视情况形成
的原因,采用分层抽样的方法抽取部分学生进行调查,若抽取的小学生人数为70,则抽取的高中生中近视
人数为( )
A.10 B.20 C.25 D.40
7.为了检查某超市货架上的饮料是否含有塑化剂,要从编号依次为1到100的塑料瓶装饮料中抽取5瓶进
行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5瓶饮料的编号可能是( )
A.5,15,25,35,45 B.10,25,40,55,70
C.10,20,30,40,50 D.10,30,50,70,90
8.从一个含有 个个体的总体中抽取一容量为 的样本,当选取抽签法、随机数法和分层随机抽样三种
不同方法时,总体中每个个体被抽中的概率分别为 ,三者关系可能是( )
A. B. C. D.
9.下列说法中正确的个数有( )
对具有线性相关关系的变量 , ,其回归方程为 ,若样本点的中心为 ,则实数
①的值是 ;
某校共有学生1003人,用简单随机抽样的方法先剔除3人,再按简单随机抽样的方法抽取为20人,则
②
每个学生被抽到的概率为 ;
若随机事件A,B满足: , , ,则事件A与B相互独立;
③
若随机变量 , 满足 ,则 .
④
A.1 B.2 C.3 D.4
10.为了解某校初中学生的近视情况,按年级用分层抽样的方法随机抽取100名学生进行视力检测,已知
初一、初二、初三年级分别有800名,600名,600名学生,则不同的抽样结果共有( )
A. B. C. D.
考点2 频率分布直方图
11.某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产
品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.对该公司产品满意度评分低于60分的用户比例估计为35%
B.对该公司产品满意度评分不低于70分的用户比例估计为40%
C.估计该公司用户对产品的满意度评分的平均值不超过60分
D.估计该公司有一半以上的用户,对产品的满意度评分介于50分至80分之间
12.在某次高中数学模拟考试中,对800名考生的考试成绩进行统计,得到如图所示的频率分布直方图,
其中分组的区间分别为[40,50),[50,60),[60,70), ,[80,90),[90,100].若考生成绩在 内的人数为 ,考生成绩在 内的人数为 ,则 ( )
A.20 B.10 C.60 D.40
13.为了解高中学生每天的体育活动时间,某市教育部门随机抽取 高中学生进行调查,把每天进行体育
活动的时间按照时长(单位:分钟)分成 组: ,[40,50),[50,60),[60,70), , .然后对统计
数据整理得到如图所示的频率分布直方图,则可估计这 名学生每天体育活动时间的第 百分位数为
( )
A. B. C. D.
14.为了加深师生对党史的了解,激发广大师生知史爱党、知史爱国的热情,某校举办了“学党史、育新
人”的党史知识竞赛,并将1000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分
布直方图,则下列说法错误的是( )
A. 的值为0.005
B.估计这组数据的众数为75分
C.估计成绩低于60分的有250人D.估计这组数据的中位数为 分
15.某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘
制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的
是( )
A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天
B.估计该学生每日完成作业时间超过3小时的概率为0.3
C.估计该学生每日完成作业时间的中位数为2.625小时
D.估计该学生每日完成作业时间的众数为2.3小时
16.为了加深师生对党史的了解,激发广大师生知史爱党、知史爱国的热情,某校举办了“学党史、育文
化”的党史知识竞赛,并将1000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分
布直方图,估计这组数据的第85百分位数为( )分
A.84 B.85 C.86 D.87
17.某校高三共有200人参加体育测试,将体测得分情况进行了统计,把得分数据按照
分成6组,绘制了如图所示的频率分布直方图.根据规则,
82分以上的考生成绩等级为A,则获得 的考生人数约为( )A.25 B.50 C.75 D.100
18.为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明
城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区
居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其
得分数据,将所得50份数据的得分结果分为6组: ,并
整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为( )
A.89.09 B.86.52 C.84.55 D.81.32
19.某市为了解全市12000名高一学生的的体能素质情况,在全市高一学生中随机抽取了1000名学生进行
体能测试,并将这1000名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,下列结论
中正确的是( )A.图中 的值为0.020;
B.同一组中的数据用该组区间的中点值做代表,则这1000名学生的平均成绩约为80.5;
C.估计样本数据的75%分位数为88;
D.由样本数据可估计全市高一学生体测成绩优异(80分及以上)的人数约为5000人.
20.某校举行知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按 ,
, , , 分成5组,得到如图所示的频率分布直方图,则下列说法不正确的
是( )
A.图中的x值为0.020 B.得分在 的人数为400
C.这组数据的极差为50 D.这组数据的平均数的估计值为77
考点3 均值及方差的性质
21.样本数据 的平均数 ,方差 ,则样本数据 , , , 的平均数,
方差分别为( )
A.9,4 B.9,2 C.4,1 D.2,1
22.若数据 的标准差为 ,则数据 , , ,…, 的标准差为( )
A. B. C. D.
23.已知数据 的平均数为10,方差为10,则 的平均数和方差
分别为( )
A.32,90 B.32,92 C.30,90 D.30,92
24.下列命题错误的是( )A.若数据 的标准差为 ,则数据 的标准差为
B.若 ,则
C.若 ,则
D.若 为取有限个值的离散型随机变量,则
25.已知样本数据 的平均数和标准差均为4,则数据 的平均数与方差
分别为( )
A. B. C. D.
26.已知一组数据 , , , , 的平均数是 ,方差是 ,则对于以下数据: , ,
, , 下列选项正确的是( )
A.平均数是 ,方差是6 B.平均数是 ,方差是
C.平均数是5,方差是 D.平均数是5,方差是12
27.某人在“全球购”平台上购买了 件商品,这些商品的价格如果按美元计算,则平均数为 ,标准差
为 ,如果按人民币计算(汇率按1美元=7元人民币),则平均数和方差分别为( )
A. , B. , C. , D. ,
28.已知样本数据 的平均数为 、方差为 ,若样本数据 , 的平均数为
,方差为 ,则 ( )
A. B. C. D.
29.一组数据 的平均数和标准差分别为3和1,另一组数据
(其中 )的平均数和标准差分别为10和4,则 ( )A.16 B.8 C. D.
30.已知数据 , ,…, 的平均数和方差分别为4,10,那么数据 , ,…, 的平
均数和方差分别为( )
A. , B.1, C. , D. ,
考点4 总体百分位数的估计
31.小明希望自己的高考数学成绩能超过120分,为了激励自己,他记录了近8次数学考试成绩,并绘制
成折线统计图,如图,这8次成绩的第80百分位数是( )
A.100 B.105 C.110 D.120
32.某校高三年级举行数学知识竞赛,并将100名学生的竞赛成绩(满分100分,成绩取整数)整理成如
图所示的频率分布直方图,则估计这组数据的第85百分位数为( )
A.85 B.86 C.86.5 D.87
33.某地气象部门统计了当地2024年3月前8天每天的最高气温T(单位:℃),数据如下:
时间 第1天 第2天 第3天 第4天 第5天 第6天 第7天 第8天
T(℃) 8 12 8 14 16 11 18 21
则这8天的气温数据的75%分位数为( )A.15 B.16 C.17 D.18
34.已知某学校参加学科节数学竞赛决赛的8人的成绩(单位:分)为:72,78,80,81,83,86,88,
90,则这组数据的第75百分位数是( )
A.86 B.87 C.88 D.90
35.已知一组数据:4,6,7,9,11,13,则这组数据的第65百分位数为( )
A.6 B.7 C.9 D.11
36.给出下列说法,其中正确的是( )
A.某病8位患者的潜伏期(天)分别为3,3,8,4,2,7,10,18,则它们的第50百分位数为
B.已知数据 的平均数为2,方差为3,那么数据 , , 的平均数和方差分别为5,
13
C.在回归直线方程 中,相对于样本点 的残差为
D.样本相关系数
37.某台机器每天生产10000个零件,现连续12天检测,得到每天的次品零件个数依次为:8,12,9,
18,16,17,15,9,18,20,13,11,则这组样本数据的中位数与第60百分位数之和是( )
A.29 B.30 C.30.5 D.31
38.样本数据12,8,32,10,24,22,12,33的第60百分位数为( )
A.8 B.12 C.22 D.24
39.样本数据 的第60百分位数为( )
A.23 B.31 C.33 D.36
40.样本数据11 ,12 ,13 ,15 ,16 ,13 ,14 ,15 ,11的第一四分位数为( )
A.11.5 B.12 C.12.5 D.13
考点5 相关关系与相关系数
41.如图对两组数据 , 和 , 分别进行回归分析,得到散点图如图,并求得线性回归方程分别是
和 ,并对变量 , 进行线性相关检验,得到相关系数 ,对变量 , 进行线性相
关检验,得到相关系数 ,则下列判断正确的是( )A. B. C. D.
42.对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
43.上海百联集团对旗下若干门店的营业额与三个影响因素分别作了相关性分析,绘制了如下的散点图,
则下述大小关系正确的为( ).
A. B. C. D.
44.调查某校高三学生的身高 和体重 得到如图所示散点图,其中身高 和体重 相关系数 ,
则下列说法正确的是( )A.学生身高和体重没有相关性
B.学生身高和体重呈正相关
C.学生身高和体重呈负相关
D.若从样本中抽取一部分,则这部分的相关系数一定是
45.已知变量 与 的回归直线方程为 ,变量 与 负相关,则( )
A. 与 负相关, 与 负相关 B. 与 正相关, 与 正相关
C. 与 负相关, 与 正相关 D. 与 正相关, 与 负相关
46.某校数学建模兴趣小组为研究本地区儿子身高 与父亲身高 之间的关系,抽样调查后得出
与 线性相关,且经验回归方程为 .调查所得的部分样本数据如下:
父亲身高 164 166 170 173 173 174 180
儿子身高
165 168 176 170 172 176 178
则下列说法正确的是( )
A.儿子身高 是关于父亲身高 的函数
B.当父亲身高增加 时,儿子身高增加
C.儿子身高为 时,父亲身高一定为
D.父亲身高为 时,儿子身高的均值为
47.某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们
的身高和体重得下表:
身高x(单位: ) 167 173 175 177 178 180 181
体重y(单位: ) 90 54 59 64 67 72 76
由表格制作成如图所示的散点图:由最小二乘法计算得到经验回归直线 的方程为 ,其相关系数为 ;经过残差分析,点
对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线 的方程为 ,相关系
数为 .则下列选项正确的是( )
A. B.
C. D.
48.已知变量 , 之间的一组相关数据如下表所示:
6 8 10 12
6 3 2
据此得到变量 , 之间的线性回归方程为 ,则下列说法不正确的是( )
A.变量 , 之间成负相关关系 B.可以预测,当 时,
C. D.该回归直线必过点
49.已知变量x和y满足经验回归方程 ,且变量x和y之间的一组相关数据如表所示,则下
列说法错误的是( )
6 8 10 12
7 4 3
A.变量x和y呈负相关 B.当 时,C. D.该经验回归直线必过点
50.对变量 有观测数据 ,得散点图1;对变量 有观测数据 ,得散点图
2. 表示变量 之间的线性相关系数, 表示变量 之间的线性相关系数,则下列说法正确的是( )
A.变量 与 呈现正相关,且 B.变量 与 呈现负相关,且
C.变量 与 呈现正相关,且 D.变量 与 呈现负相关,且
考点6 线性回归方程(非线性)
51.某零售行业为了解宣传对销售额的影响,在本市内随机抽取了5个大型零售卖场,得到其宣传费用x
(单位:万元)和销售额y(单位:万元)的数据如下:
x(万元) 3 4 5 6 7
5
y(万元) 45 60 65 70
0
由统计数据知y与x满足线性回归方程 ,其中 ,当宣传费用 时,销售额y的估计值
为( )
A.89.5 B.90.5 C.92.5 D.94.5
52.下列说法中,正确命题的个数为( )
① 已知随机变量 服从二项分布 ,若 ,则 .
②对具有线性相关关系的变量 , ,其线性回归方程为 ,若样本点的中心为 ,则实
数 的值是 .③以模型 去拟合一组数据时,为了求出回归方程,设 ,求得线性回归方程为 ,
则 、 的值分别是 和 .
④若样本数据 的方差为 ,则数据: 的方差为16
A.0个 B.1个 C.2个 D.3个
53.下列说法正确的是( )
A.若数据 , ,…, 的方差为1,则数据 , ,…, 的标准差为4
B.已知一组数据2,3,5,7,8,9,9,11,则该组数据的第40百分位数为6
C.一组样本数据的频率分布直方图是单峰的且形状是对称的,则该组数据的平均数和中位数应该大
体上差不多
D.经验回归直线 恒过 ,且在回归直线上的样本点越多,拟合效果越好
54.云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长. 已知某科技公司2018年
至2022年云计算市场规模数据,且市场规模 与年份代码 的关系可以用模型 (其中 为自然对
数的底数)拟合,设 ,得到数据统计表如下:
年份 2018年 2019年 2020年 2021年 2022年
年份代码 1 2 3 4 5
2 2.4 3 3.6 4
由上表可得经验回归方程 ,则2026年该科技公司云计算市场规模 的估计值为( )
(参考公式: )
A. B. C. D.
55.下列说法中正确的是( )
A.具有线性相关关系的变量 , ,其线性回归方程为 ,若样本的中心 ,则
B.数据3,4,2,8,1,5,8,6的中位数为5C.将一组数据中的每一个数据加上同一个正数后,方差变大
D.若甲、乙两组数据的相关系数分别为 和0.89,则甲组数据的线性相关性更强
56.下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于1
B.设 ,若 , ,则
C.线性回归直线 一定经过样本点的中心
D.一个袋子中有100个大小相同的球,其中有40个黄球、60个白球,从中不放回地随机摸出20个球
作为样本,用随机变量X表示样本中黄球的个数,则X服从二项分布,且
57.已知变量x和y的统计数据如表:
x 1 2 3 4 5
y 6 6 7 8 8
根据上表可得回归直线方程 ,据此可以预测当 时, ( )
A.8.5 B.9 C.9.5 D.10
58.下列说法中正确的个数为( )个
①对立事件一定是互斥事件;②在经验回归直线方程 中,当解释变量 每增加一个单位时,预
报变量 减少0.1个单位;③两个随机变量的线性相关性越强,相关系数绝对值越接近于1;④在回归分析
模型中,若相关指数 越小,则残差平方和越大,模型的拟合效果越好.
A.1 B.2 C.3 D.4
59.下列说法不正确的是( ).
A.一组数据10,11,11,12,13,14,16,18,20,22的第60百分位数为14
B.若随机变量 服从正态分布 ,且 ,则
C.若线性相关系数 越接近1,则两个变量的线性相关程度越高
D.对具有线性相关关系的变量 、 ,且回归方程为 ,若样本点的中心为 ,则实数 的值是
60.为了研究y关于x的线性相关关系,收集了5组样本数据(见下表):
x 1 2 3 4 5
y 0.5 0.9 1 1.1 1.5
若已求得一元线性回归方程为 ,则下列选项中正确的是( )
A.
B.当 时,y的预测值为2.2
C.样本数据y的第40百分位数为1
D.去掉样本点 后,x与y的样本相关系数r不会改变
考点7 独立性检验
61.“民政送温暖,老人有饭吃”.近年来,各级政府,重视提高老年人的生活质量.在医疗、餐饮等多
方面,为老人提供了方便.单从用餐方面,各社区,创建了“爱心食堂”、“爱心午餐”、“老人食堂”
等等不同名称的食堂,解决了老人的吃饭问题.“爱心食堂A”为了更好地服务老人,于3月28日12时,
食堂管理层人员对这一时刻用餐的118人,对本食堂推出的15种菜品按性价比“满意”和“不满意”作问
卷调查,其中,有13人来食堂用餐不足5次,另有儿童5人,他们对菜品不全了解,不予问卷统计,在被
问卷的人员中男性比女性多20人.用餐者对15种菜品的性价比认为“满意”的菜品数记为
,当 时,认为该用餐者对本食堂的菜品“满意”,否则,认为“不满意”.统计结
果部分信息如下表:
满意 不满意 合计
男 40
女 20
合计
(1)①完成上面 列联表;
②能有多大(百分比)的把握认为用餐者对本食堂菜品的性价比是否满意与性别有关?
(2)用分层抽样在对菜品的性价比“满意”的人群中抽取6人,再从这6人中随机抽取3人,用 表示抽取
的3人中的男性人数,求 的分布列和期望.附:参考公式和临界值表 ,其中, .
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
62.某学校举办了一次主题为“科技兴国,强国有我”的知识竞赛,并从所有参赛学生中随机抽取了男、
女生各50人,统计他们的竞赛成绩(满分100分,每名参赛学生至少得60分),并将成绩分成4组:
, , , (单位:分),得到如下的频率分布直方图.
(1)现将竞赛成绩不低于90分的学生称为“科技知识达人”,成绩低于90分的学生称为“非科技知识达
人”.把随机抽取的参赛学生数据统计如下,将下列 列联表补充完整,并判断是否有95%的把握认为
能否获得“科技知识达人”称号与性别有关.
科技知识达
非科技知识达人 合计
人
男生 15
女生
合计
(2)将频率视为概率,从所有参赛学生中随机抽取3人进行访谈,记这3人中是“科技知识达人”的人数为
,求 的分布列与数学期望.
附: (其中 ).0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
63.某数学老师在其任教的甲、乙两个班级中各抽取30名学生进行测试,分数分布如表:
甲班人
分数区间 乙班人数
数
[0,30) 3 6
[30,60) 6 6
[60,90) 9 12
[90,120) 6 3
[120,150] 6 3
(1)若成绩在120分以上(含120分)为优秀,求从乙班参加测试的成绩在90分以上(含90分)的学生中,
随机任取2名学生,恰有1名为优秀的概率;
(2)根据以上数据完成下面的2×2列联表,则在犯错的概率不超过0.1的前提下,是否有足够的把握认为学
生的数字成绩优秀与否和班级有关?
优秀 不优秀 总计
甲班
乙班
总计
参考公式: ,其中 .
64.同城配送是随即时物流发展而出现的非标准化服务,省时省力是消费者使用同城配送服务的主要目的.
某同城配送服务公司随机统计了800名消费者的年龄(单位:岁)以及每月使用同城配送服务的次数,得
到每月使用同城服务低于5次的有550人,并将每月使用同城配送服务次数不低于5次的消费者按照年龄进行分组,得到如图所示的频率分布直方图.
(1)估计每月使用同城配送服务不低于5次的消费者年龄的平均值和中位数(结果精确到0.1,每组数据用
该组区间的中点值代表);
(2)若年龄在 内的人位于年龄段 ,年龄在 内的人位于年龄段II,把每月使用同城配送服务低
于5次的消费者称为“使用同城配送服务频率低”,否则称为“使用同城配送服务频率高”,若800名消
费者中有400名在年龄段I,补全 列联表,并判断是否有 的把握认为消费者使用同城配送服务频
率的高低与年龄段有关?
年龄段I 年龄段II 合计
使用同城配送服务频率
高
使用同城配送服务频率
低
合计
参考公式: ,其中 .附:
0.050 0.010 0.001
3.841 6.635 10.828
65.某地为调查年龄在35―50岁段人群每周的运动情况,从年龄在35―50岁段人群中随机抽取了200人
的信息,将调查结果整理如下:女性 男性
每周运动超过2小时 60 80
每周运动不超过2小时 40 20
(1)根据以上信息,能否有99%把握认为该地年龄在35―50岁段人群每周运动超过2小时与性别有关?
(2)在以上被抽取且每周运动不超过2小时的人中,按性别进行分层抽样,共抽6人.再从这6人中随机抽
取2人进行访谈,求这2人中至少有1人是女性的概率.
参考公式: , .
0.10 0.05 0.025 0.010 0.001
2.706 3.841 5.024 6.635 10.828
66.为了有效预防流感,很多民众注射了流感疫苗.市防疫部门随机抽取了1000人进行调查,发现其中注
射疫苗的800人中有220人感染流感,另外没注射疫苗的200人中有80人感染流感.医学研究表明,流感的
检测结果有检错的可能,已知患流感的人其检测结果有 呈阳性(流感),而没有患流感的人其检测结
果有 呈阴性(未感染)
(1)估计该市流感感染率是多少?
(2)根据所给的数据,判断是否有99%的把握认为注射流感疫苗与预防流感有关;
(3)已知某人的流感检查结果呈阳性,求此人真的患有流感的概率.(精确到0.001)
附: .
0.050 0.010 0.001
k 3.841 6.635 10.828
67.为了引导学生阅读世界经典文学名著,某学校举办“名著读书日”活动,每个月选择一天为“名著读
书日”,并给出一些推荐书目.为了了解此活动促进学生阅读文学名著的情况,该校在此活动持续进行了
一年之后,随机抽取了校内100名学生,调查他们在开始举办读书活动前后的一年时间内的名著阅读数量,
所得数据如下表:不少于5本 少于5本 合计
活动前 35 65 100
活动后 60 40 100
合计 95 105 200
(1)依据小概率值 的独立性检验,分析举办该读书活动对学生阅读文学名著是否有促进作用;
(2)已知某学生计划在接下来的一年内阅读6本文学名著,其中4本国外名著,2本国内名著,现从6本名
著中随机抽取3本在上半年读完,求上半年读完的国内名著本数 的分布列及数学期望.
附: ,其中 .
临界值表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
68.随着AI技术的不断发展,人工智能科技在越来越多的领域发挥着重要的作用.某校在寒假里给学生
推荐了一套智能辅导系统,学生可自愿选择是否使用该系统完成假期的作业.开学时进行了入学测试,随
机抽取了100名学生统计得到如下列联表:
使用智能辅导系统 未使用智能辅导系统 合计
入学测试成绩优秀 20 20 40
入学测试成绩不优
40 20 60
秀
合计 60 40 100
(1)判断是否有95%的把握认为入学测试成绩优秀与使用智能辅导系统相关;
(2)若把这100名学生按照入学测试成绩是否优秀进行分层随机抽样,从中抽取5人,再从这5人中随机抽
取2人,记抽取的2人中入学测试成绩优秀的人数为 ,求 的分布列及数学期望 .
附: ,其中 .
0.10 0.05 0.025 0.0102.706 3.841 5.024 6.635
69.某海鲜餐厅在试营业期间,同时采用自助餐和团购套餐两种营销模式,其中自助餐模式是指顾客可随
意享用餐厅内所有菜品,最长可用餐2小时;团购套餐是指顾客在APP上购买团购券后到店消费,只可享
用套餐内所包含的菜品,用餐时间不限.该餐厅为了了解这两种营销模式的受欢迎程度,现随机调查了130
位顾客对这两种营销模式的意见反馈,统计结果如下表:
认为自助餐更有性价比 认为团购套餐更有性价比
男性顾
40 20
客
女性顾
30 40
客
(1)依据小概率值 的独立性检验,推断能否认为顾客对这两种营销模式的意见与顾客的性别有关;
(2)店长统计了第 , , , 天自助餐的用餐人数 ,统计结果如下(已知 ):
(天)
(用餐人数) 32 52 73 95
经计算得经验回归方程为 ,以样本 的相关系数 为标准,对该经验回归方
程的拟合效果进行说明.
附:(i)在经验回归方程 中, .
(ii)相关系数 若 ,可认为该模型拟合效果良好,反之,则认为该模型拟合
效果不好.
(iii) ,其中 .0.050 0.010 0.001
3.841 6.635 10.828
70.2024年3月,某校语文教师对学生提出“3月读一本书”的要求,每位学生都选择且只能选择《红楼
梦》和《三国演义》中的一本,现随机调查该校男、女生各100人,整理得到 列联表如下.
《红楼梦》 《三国演义》
男
30 70
生
女
60 40
生
(1)依据小概率值 的独立性检验,能否认为学生选择《红楼梦》还是《三国演义》与性别有关?
(2)已知学生选择哪本书是相互独立的,用频率代替概率,从该校选择《红楼梦》的学生中随机抽取3人,
抽到的女生人数设为 ,求 的分布列和数学期望.
参考公式: ,其中 .
参考数据:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828