文档内容
8.3 分类变量与列联表(精讲)
思维导图
常见考法考法一 列联表
【例1】(1)(2020·全国高二课时练习)某村庄对该村内 名老年人、年轻人每年是否体检的情况进
行了调查,统计数据如表所示:
每年体检 每年未体检 合计
老年人
年轻人
合计
已知抽取的老年人、年轻人各 名,则对列联表数据的分析错误的是( )
A. B.
C. D.
(2).(2021·河南信阳市)疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生
物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗预防效果,在进行动物试验
时,得到如下统计数据:
未发病 发病 总计
未注射疫苗 20
注射疫苗 30
总计 50 50 100
附表及公式:
, .
0.05 0.01 0.005 0.001
3.841 6.635 7.879 10.828现从试验动物中任取一只,取得“注射疫苗”的概率为 ,则下列判断错误的是( )
A.注射疫苗发病的动物数为10
B.从该试验未注射疫苗的动物中任取一只,发病的概率为
C.能在犯错概率不超过0.001的前提下,认为疫苗有效
D.该疫苗的有效率为75%
【答案】(1)D(2)D
【解析】(1)由题意得, , , , , ,
所以 , , , , ,则 .故选:D.
(2)由题知:注射疫苗动物共40只,未注射为60只,
补充列联表,
未发病 发病 总计
未注射疫苗 20 40 60
注射疫苗 30 10 40
总计 50 50 100
由此可得A、B正确.计算得: ,
故能在犯错概率不超过0.001的前提下认为疫苗有效.C正确,D错误.故选:D.
【一隅三反】
1.(2020·全国)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份
样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
【答案】D
【解析】由条形图知女生数量多于男生数量,故A正确;
有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B正确;
男生偏爱两理一文,故C正确;女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D
错误.故选:D.
2.(2021·安徽蚌埠市)某校随机调查了110名不同的高中生是否喜欢篮球,得到如下的列联表:
男 女
喜欢篮球 40 20
不喜欢篮球 20 30
附:
0.050 0.010 0.001
3.841 6.635 10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“喜欢篮球与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“喜欢篮球与性别无关”C.有99%以上的把握认为“喜欢篮球与性别有关”
D.有99%以上的把握认为“喜欢篮球与性别无关”
【答案】C
【解析】由题意 , ,因此有99%以上的把
握认为“喜欢篮球与性别有关”.故选:C.
3.(2021·江苏常州市) 年 月 日,国家药品监督管理局附条件批准国药集团中国生物北京生
物制品研究所有限责任公司的新型冠状病毒灭活疫苗( 细胞)注册申请.该疫苗是首家获批的国产新冠
病毒灭活疫苗,适用于预防由新型冠状病毒感染引起的疾病( ). 年 月 日,北京市人民
政府新闻办公室召开疫情防控第 场例行新闻发布会,表示不在 岁接种年龄段范围的人员,需
要等待进一步临床试验数据.近日专家对该年龄内和该年龄段外的 人进行了临床试验,得到如下
列联表:
能接种 不能接种 总计
岁内
岁外
总计
附: ,其中 ;
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过 的前提下,认为“能接种与年龄段无关”B.在犯错误的概率不超过 的前提下,认为“能接种与年龄段有关”
C.有 以上的把握认为“能接种与年龄段无关”
D.有 以上的把握认为“能接种与年龄段有关”
【答案】D
【解析】由 列联表可得
由
所以在犯错误的概率不超过 的前提下,认为“能接种与年龄段有关”
即有 以上的把握认为“能接种与年龄段有关
故选:D
4.(2020·全国)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某
机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
非一线 一线 总计
愿生 45 20 65
不愿生 13 22 35
总计 58 42 100
由 ,得 .
参照下表,
P(K2≥k) 0.050 0.010 0.001
0
k 3.841 6.635 10.828
0
下列结论正确的是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”
【答案】C
【解析】因为 ,所以有 以上的把握认为“生育意愿与城市级别有关”,故选:
C.
考点二 独立性检验
【例2】(2020·广西)某地区为了解学生课余时间的读书情况,随机抽取了n名学生进行调查,将调查
得到的学生日均课余读书时间分成 , , , , , 六组,绘
制成如图所示的频率分布直方图,将日均课余读书时间不低于40分钟的学生称为“读书之星”,日均课余
读书时间低于40分钟的学生称为“非读书之星”已知抽取的样本中日均课余读书时间低于10分钟的有10
人.
(1)求p和n的值;
(2)根据已知条件和下面表中两个数据完成下面的 列联表,并判断是否有95%以上的把握认为“读书
之星”与性别有关?
非读书之星 读书之星 总计
男
女 10 55
总计
(3)将本次调查所得到有关事件发生的频率视为其发生的概率,现从该地区大量学生中.随机抽取20名学
生参加读书与文学素养的研讨会,记被抽取的“读书之星”人数为随机变量X,求X的数学期望 .附: ,其中 .
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1) , ;(2)填表见解析;没有;(3) 人.
【解析】(1) ,解得: ,
所以 .
(2)因为 ,所以“读书之星”有 ,
从而 列联表如下图所示:
非读书之星 读书之星 总计
男 30 15 45
女 45 10 55
总计 75 25 100
将 列联表中的数据代入公式计算得 ,
因为 ,所以没有95%以上的把握认为“读书之星”与性别有关.
(3)将频率视为概率,即从该地区学生中抽取一名学生是“读书之星”的概率为 .
由题意可知 ,所以 (人).
【一隅三反】
1.(2021·江苏南通市)习近平总书记在党的十九大工作报告中提出,永远把人民美好生活的向往作为
奋斗目标.在这一号召下,全国人民积极工作,健康生活.当前,“日行万步”正式成为健康生活的代名词.某地一研究团队统计了该地区 位居民的日行步数,得到如下表格:
日行步数(单位:千步)
人数
(1)为研究日行步数与居民年龄的关系,以日行步数是否超过 千步为标准进行分层抽样,从上述
位居民中抽取 人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有 的把握认为
日行步数与居民年龄超过 岁有关;
日行步数 千步 日行步数 千步 总计
岁以上
岁以下(含 岁)
总计
(2)以这 位居民日行步数超过 千步的频率,代替该地区 位居民日行步数超过 千的概率,每位居
民日行步数是否超过 千相互独立.为了深入研究,该研究团队随机调查了 位居民,其中日行步数超过
千的最有可能(即概率最大)是多少位居民?
附:
,其中 .
【答案】(1)列联表见解析,没有 的把握认为日行步数与居民年龄超过 岁有关;(2)最有可能
是 位居民.【解析】(1) 人中,步数不超过 千步的有 人,超过 千步有 人,
按分层抽样,抽取的人数中不超过 千步的有 人,超过 千步的有 人,列联表如下:
日行步数 千步 日行步数 千步 总计
岁以上
岁以下(含 岁)
总计
故没有95%的把握认为日行步数与居民年龄超过40岁有关.
(2)每位居民步数超过 千的概率为 ,
设步数超过 千的最有可能是 位居民,
, , ,
,即最有可能是 位居民.
2.(2021·江苏南通市·高二期末)为了解使用手机是否对学生的学习有影响,某校随机抽取 名学生,
对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):
使用手机 不使用手机 总计
学习成绩优秀
学习成绩一般
总计
(1)补充完整所给表格,并根据表格数据计算是否有 的把握认为学生的学习成绩与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出 人,再从这 人中随机抽取 人,
记这 人中“学习成绩优秀”的人数为 ,试求 的分布列与数学期望.
参考公式: ,其中 .
参考数据:
【答案】(1)没有 的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析, .
【解析】(1) 列联表如下表所示:
使用手机 不使用手机 总计
学习成绩优秀
学习成绩一般
总计
假设学生的学习成绩与使用手机无关,
,
所以,没有 的把握认为学生的学习成绩与使用手机有关;
(2) 人中学习成绩优秀的人有 人,学习成绩一般的有 人,
可能的取值有 、 、 、 ,
, , , .
所以,随机变量 的分布列为.
3.(2021·安徽)随着新冠疫情防控进入常态化,人们的生产生活逐步步入正轨.为拉动消费,某市发行
亿元消费券.为了解该消费券使用人群的年龄结构情况,该市随机抽取了 人,对是否使用过消费券的
情况进行调查,结果如下表所示,其中年龄低于 岁的人数占总人数的 .
年龄(单位:岁)
调查人数
使用消费券人数
(1)求 、 值;
(2)若以“年龄 岁为分界点”,由以上统计数据完成下面 列联表,并判断是否有 的把握认
为是否使用消费券与人的年龄有关.
年龄低于 岁的人数 年龄不低于 岁的人数 合计
使用消费券人数
未使用消费券人数
合计
参考数据:
,其中 .【答案】(1) , ;(2)列联表答案见解析,有 的把握认为是否使用消费券与人的年龄
有关.
【解析】(1)由题意得 ,解得 , ;
(2)由以上统计数据填写下面 列联表,如下
年龄低于 岁的人数 年龄不低于 岁的人数 合计
使用消费券人数
未使用消费券人数
合计
根据公式计算 ,
所以有 的把握认为是否使用消费券与人的年龄有关.
4.(2021·安徽六安市·六安一中)某士特产超市为预估2021年元旦期间游客购买土特产的情况,对
2020年元且期间的90位游客购买情况进行统计,得到如下人数分布表.
购买金额(元)
人数 10 15 20 15 20 10
(1)根据以上数据完成 列联表,并判断是否有95%的把握认为购买金额是否少于60元与性别有关.
不小于60元 小于60元 合计
男 40
女 18
合
90
计
(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为P(每
次抽奖互不影响,且P的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次
减10元,中奖3次减15元若游客甲计划购买80元的土特产,请列出实际付款数X(元)的分布列并求其
数学期望.参考公式及数据:
,
附表:
0.10
0.150 0.050 0.010 0.005
0
2.70
2.072 3.841 6.635 7.879
6
【答案】(1)列联表见解析,有95%的把握认为购买金额是否少于60元与性别有关;(2)分布列见解析,
.
【解析】(1) 列联表如下:
不少于60元 少于60元 合计
男 12 40 52
女 18 20 38
合
30 60 90
计
,
因此有95%的把握认为购买金额是否少于60元与性别有关.
(2)X可能取值为65,70,75,80,且 .
由题意知:
, ,
, ,
所以X的分布列为
X 65 70 75 80.