文档内容
第 85 讲 章末检测十一
一、单选题
1、(2023·陕西·榆林二模文)某企业为了解员工身体健康情况,采用分层抽样的方法从该企业的营销部门
和研发部门抽取部分员工体检,已知该企业营销部门和研发部门的员工人数之比是4:1,且被抽到参加体
检的员工中,营销部门的人数比研发部门的人数多72,则参加体检的人数是( )
.
A 90 B. 96 C. 120 D. 144
【答案】C
【解析】
【分析】设参加体检的人数是 ,根据题意列出方程,求解即可.
【详解】解:设参加体检的人数是 ,则 ,解得 ,
所以参加体检的人数是120人.故选:C.
2、(2023·黑龙江大庆·统考一模)我国西北某地区开展改造沙漠的巨大工程,该地区对近5年投入的沙漠
治理经费x(亿元)和沙漠治理面积y(万亩)的相关数据统计如下表所示.
治理经费x/亿元 3 4 5 6 7
治理面积y/万亩 10 12 11 12 20
根据表中所给数据,得到y关于x的线性回归方程为 ,则 ( )
A.1 B.2 C.3 D.4
【答案】C
【分析】利用线性回归直线方程过定点 ,可得答案.
【详解】因为 ,
因回归方程过定点 ,将其代入 ,得 ,解得 ,
故选:C.
3、(2022·广东揭阳·高三期末)每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两家
公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具体数据如下:
公 文史
文史男 理工男 理工女
司 女甲 10 10 20 10
乙 15 20 10 5
分析毕业生的选择意愿与性别的关联关系时,已知对应的 的观测值 ;分析毕业生的选择意愿
与专业关联的 的观测值 ,则下列说法正确的是( )
A.有 的把握认为毕业生的选择意愿与专业相关联
B.毕业生在选择甲、乙公司时,选择意愿与专业的关联比与性别的关联性更大一些
C.理科专业的学生更倾向于选择乙公司
D.女性毕业生更倾向于选择甲公司
【答案】B
【分析】
根据题中的数据表及独立性检验的知识即可判断.
【详解】
解:与专业关联的 的观测值 ,明显大于 ,明显小于 ,所以有 的
把握认为毕业生的选择意愿与专业相关联,所以 不正确;
因为 ,故 正确;根据题中的数据表列出专业与甲、乙公司的关联表可知,理科专业的学生更倾向于
选择甲公司,列出性别与甲、乙公司的关联表可知,
女性毕业生更倾向于选择乙公司,所以C,D均不正确.
故选:B.
4、(2023·吉林通化·梅河口市第五中学校考一模)某地以“绿水青山就是金山银山”理念为引导,推进绿
色发展,现要订购一批苗木,苗木长度与售价如下表:
苗木长度x(cm) 38 48 58 68 78 88
售价y(元) 16.8 18.8 20.8 22.8 24 25.8
若苗木长度x(cm)与售价y(元)之间存在线性相关关系,其回归方程为 ,则当售价大约为38.9元时,苗木长度大约为( )
A.148cm B.150cm C.152cm D.154cm
【答案】B
【分析】根据表格中的数据求出样本点中心,根据回归直线经过样本点中心求出 ,再将 代入回归
方程可求出结果.
【详解】因为 ,
,
所以样本点中心为 ,
又回归直线 经过 ,
所以 ,所以 ,
所以回归方程为 ,
当 元时, 厘米.
则当售价大约为 元时,苗木长度大约为150厘米.
故选:B.
5、(2023·湖南邵阳·统考三模)为加强居民对电信诈骗的认识,提升自我防范的意识和能力,拧紧保障居
民的生命财产的“安全阀”,某社区开展了“防电信诈骗进社区,筑牢生命财产防线”专题讲座,为了解
讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份防电信诈骗手段知识问卷,这
10位社区居民在讲座前和讲座后问卷答题的正确率如图所示,则( )
A.讲座前问卷答题的正确率的中位数大于75%
B.讲座后问卷答题的正确率的众数为85%C.讲座前问卷答题的正确率的方差小于讲座后正确率的方差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
【答案】B
【详解】由图可知,讲座前10位居民问卷答题的正确率分别为
,
讲座后10位居民问卷答题的正确率分别为
.
A:讲座前10位居民问卷答题的正确率按小到大排列为
其中位数为 ,故A错误;
B:讲座后10位居民问卷答题的正确率的众数为 ,故B正确;
C:由图可知,10位讲座前的居民问卷答题的正确率波动比讲座后的大,
所以10位讲座前的居民问卷答题的正确率的方差大于讲座后的方差,故C错误;
D:讲座前10位居民问卷答题的正确率的极差为 ,
讲座后10位居民问卷答题的正确率的极差为 ,
,故D错误.
故选:B.
6、(2023·四川·泸县一中二诊模拟文)某车间从生产的一批产品中随机抽取了1000个零件进行一项质量
指标的检测,整理检测结果得此项质量指标的频率分布直方图如图所示,则下列结论错误的是( )
A.
B. 估计这批产品该项质量指标的众数为45
C. 估计这批产品该项质量指标的中位数为60D. 从这批产品中随机选取1个零件,其质量指标在 的概率约为0.5
【答案】C
【解析】
【分析】利用各组的频率之和为1,求得 的值,判定A;根据众数和中位数的概念判定BC;根据频率估
计概率值,从而判定D.
【详解】 ,解得 ,故A正确;
频率最大的一组为第二组,中间值为 ,所以众数为45,故B正确;
的
质量指标大于等于60 有两组,频率之和为 ,所以60不是中位数,故C
错误;
由于质量指标在[50,70)之间的频率之和为 ,可以近似认为从这批产品中随机选取1
个零件,其质量指标在 的概率约为0.5,故D正确.
故选:
7、.(2023·安徽马鞍山·统考三模)某校高三(1)班(45人)和高三(2)班(30人)进行比赛,按照分
层抽样的方法从两个班共抽取10名同学,相关统计情况如下:高三(1)班答对题目的平均数为 ,方差
为 ;高三(2)班答对题目的平均数为 ,方差为 ,则这10人答对题目的方差为( )
A. B. C. D.
【答案】D
【详解】由分层抽样可得高三(1)班抽取的人数为 ,高三(2)班抽取的人数为
,
设高三(1)班(6人)答对题目数依次为 ,高三(2)班(4人)答对题目数依次为 ,
由题意可得:,
可得 ,
则这10人答对题目的平均数 ,
这10人答对题目的方差 .
故选:D.
8、(2022·山东济南·高三期末)酒后驾驶是严重危害交通安全的行为,某交通管理部门对辖区内四个地区
(甲、乙、丙、丁)的酒驾治理情况进行检查督导,若“连续8天,每天查获的酒驾人数不超过10”,则
认为“该地区酒驾治理达标”,根据连续8天检查所得数据的数字特征推断,酒驾治理一定达标的地区是
( )
A.甲地,均值为4,中位数为5 B.乙地:众数为3,中位数为2
C.丙地:均值为7,方差为2 D.丁地:极差为 , 分位数为8
【答案】C
【分析】
对于选项AC:首先假设不达标,通过均值、中位数和方差的公式运算,检验假设是否成立;对于选项
BD:根据众数、中位数、极差和百分位数定义即可判断.
【详解】
不妨设8天中,每天查获的酒驾人数从小到大分别为 , , , ,
且 ,其中 ,
选项A:若不达标,则 ,因为中位数为5,所以 ,
又因为均值为4,故 ,从而 ,且 ,则 ,
, , 满足题意,从而甲地有可能不达标;故A错误;选项B:由众数和中位数定义易知,当 , , , 时,乙地不达标,
故B错误;
选项C:若不达标,则 ,由均值为7可知,则其余七个数中至少有一个数不等于7,
由方差定义可知, ,这与方差为2矛盾,从而丙地一定达标,故C正确;
选项D:由极差定义和百分位数定义可知,当 , 时,丁地不达标,
故D错误.
故选:C.
二、多选题
9、2023·湖南·铅山县第一中学校联考三模)已知一组数据:0,1,2,4,则下列各选项正确的是( )
A.该组数据的极差,中位数,平均数之积为10
B.该组数据的方差为2.1875
C.从这4个数字中任取2个不同的数字可以组成8个两位数
D.在这4个数字中任取2个不同的数字组成两位数,从这些两位数中任取一数,取得偶数的概率为
【答案】BD
【详解】由数据计算可得:该组数据的极差为4-0=4,中位数为(1+2)÷2=1.5,平均数为(0+1+2+4)
÷4=1.75,它们之积为4×1.5×1.75=10.5,故A错误;
方差为 ,故B正确;
先排十位数,有三种排法,再排个位数也是三种派发,故可以组成9个两位数,即C错误;
而组成的9个两位数其中只有21,41两个奇数,从中随机抽一数,抽到偶数的概率为 ,故D正确.
故选:BD.
10、(2023·辽宁·校联考三模)已知某产品的单价 以及销量 情况统计如下表所示,由表中数据求得经验
回归方程 ,则下列说法正确的是( )
单价 (元) 4 5 6 7 8 9销是 (件) 90 84 83 80 75 68
A.销量的平均数为80件
B.根据经验回归方程可以测得,单价每上升1元,销量就减少4件
C.
D.根据经验回归方程可以预测,单价为10元时,销量为66件
【答案】ABD
【详解】 ,故 正确;
将 代入回归方程得 故回归方程为 ,
由于回归方程的斜率为-4,故 正确,C错误;
根据回归方程可以预测,单价为10元时,销量为 件,故 正确;
故选: .
11、(2023·湖南岳阳·统考三模)2022年11月28日,平江-益阳高速公路通车运营,湖南省交通运输厅统
计了平益高速2023年1月22日至1月28日的高速公路车流量(单位:万车次),并与2022年12月22日
至12月28日比较,得到同比增长率( )数据,绘制了如下统
计图,则下列结论正确的是( )
A.2023年1月22日至1月28日的高速公路车流量的极差为25
B.2023年1月22日至1月28日的高速公路车流量的中位数为18
C.2023年1月22日至1月28日的高速公路车流量比2022年12月22日至12月28日高速公路车流量大
的有4天
D.2022年12月25日的高速公路车流量小于20万车次
【答案】BC
【详解】根据标准数据,依次分析各选项即可得答案.对于A:由题图知,2023年1月22日至1月28日的高速公路车流量的极差为 ,故A错误;
对于B:易知2023年1月22日至1月28日的高速公路车流量的中位数为18,故B正确;
对于C:2023年1月23日,1月26日,1月27日,1月28日这4天的同比增长率均大于0,所以2023年1
月22日至1月28日的高速公路车流量比2022年12月22日至12月28日高速公路车流量大的有4天,故C
正确;
对于D:2023年1月25日的高速公路车流量为18万车次,同比增长率为 ,设2022年12月25日的
高速公路车流量为 万车次,则 ,解得 ,故D错误.
故选:BC.
12、(2023·云南红河·统考一模)某校高三一名数学教师从该校高三学生中随机抽取男、女生各50名进行
了身高统计,得到男、女身高分别近似服从正态分布 和 ,并对其是否喜欢体育锻炼进
行数据统计,得到如下2×2列联表:
喜欢 不喜欢 合计
男生 37 m 50
女生 n 32 50
合计 55 45 100
参考公式:
α 0.01 0.005 0.001
6.635 7.879 10.828
则下列说法正确的是( )A. ,
B.男生身高的平均数约为173,女生身高的平均数约为164
C.男生身高的标准差约为11,女生身高的标准差约为9
D.依据 的独立性检验,认为喜欢体育锻炼与性别有关联
【答案】ABD
【分析】A选项,根据列联表中数据分析求出 ,A正确;BC选项,由男、女身高分别近似服从正态分布 和 ,得到平均数和标准差;D选项,计算出卡方,与6.635比较大小后得到结论.
【详解】对于A.因为 , ,算得 , ,故A正确:
对于B,在正态分布 中,μ约为平均数,所以男生身高的平均数约为173,女生身高的平均数约为
164,故B正确;
对于C,在正态分布 中, 为方差, 为标准差,男生身高的标准差为 ,女生身高的标准差
为3,故C不正确;
对于D,由 ,
依据 的独立性检验,认为喜欢体育锻炼与性别有关联,故D正确.
故选:ABD.
三、填空题
13、(安徽·2023·皖南八校第二次大联考)国庆节前夕,某市举办以“红心颂党恩、喜迎二十大”为主题
的青少年学生演讲比赛,其中10人比赛的成绩从低到高依次为:85,86,88,88,89,90,92,93,94,
98(单位:分),则这10人成绩的第75百分位数是__________.
【答案】
【解析】
【分析】根据第 百位数公式,即可求解.
【详解】因为 ,根据第 百位数的含义知,应该选取第8个数作为第75百分位数,所以这
10人成绩的第75百分位数是93.故答案为:93.
14、(2023·江苏连云港·统考模拟预测)为了研究高三(1)班女生的身高x(单位;cm)与体重y(单位:
kg)的关系,从该班随机抽取10名女生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设
其回归直线方程为 .已知 , , .该班某女生的身高为170cm,据
此估计其体重为________________kg.
【答案】54.5
【分析】计算出样本中心点,代入回归直线方程,得到 ,从而估计出该女生的体重.【详解】 , ,
故 ,解得: ,
故回归直线方程为 ,则当 时, (kg).
故答案为:54.5.
15、(2022·山东临沂·高三期末)为研究数学成绩与物理成绩是否具有线性相关性,李老师将班级里4位
同学的某次数学成绩和物理成绩记录如下表所示:
学生编号 1 2 3 4
数学分数x 98 102 118 122
物理分数y 80 83 m 100
经检验数学成绩确实与物理成绩具有相关性,且线性回归方程为 ,则表中 ______.
【答案】97
【分析】
求得样本中心点的坐标,代入回归直线方程即可求得结果.
【详解】
由题可知: ,
样本中心点 在回归直线方程上,代入得
解得 .
故答案为: .
16、(梅州市大埔县高三期末试题)在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但
墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1 ,
那么这组数据的方差 可能的最大值是__________.
【答案】32.8
【详解】设这组数据的最后两个分别是: , ,则 ,
得: ,故 ,故 ,显然 最大取 时, 有最大值 ,故答案为 .
四、解答题
17、(2021年全国高考甲卷数学(理)试题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二
级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
【解析】(1)甲机床生产的产品中的一级品的频率为 ,
乙机床生产的产品中的一级品的频率为 .
(2) ,
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异
18、(2023·陕西·咸阳二模文)2023年,党中央、国务院印发了《关于进一步减轻义务教育阶段学生作业
负担和校外培训负担的意见》,也就是我们现在所称的“双减”政策.某地为了检测双减的落实情况,从某
高中选了6名同学,检测课外学习时长(单位:分钟),相关数据如下表所示.
学生序号 1 2 3 4 5 6学习时 220 180 210 220 200 230
长/分
(Ⅰ)若从被抽中的6名同学中随机抽出2名,则抽出的2名同学课外学习时长都不小于210分钟的概率;
(Ⅱ)下表是某班统计了本班同学2023年1-7月份的人均月课外劳动时间(单位:小时),并建立了人均
月课外劳动时间 关于月份 的线性回归方程 , 与 的原始数据如下表所示:
月份 1 2 3 4 5 6 7
人均月劳动时间 8 9 12 19 22
由于某些原因导致部分数据丢失,但已知 .
(1)求 , 的值;
(2)求该班6月份人均月劳动时间数据的残差值(残差即样本数据与预测值之差).
附: , , .
解:(Ⅰ)用 表示从被抽中的6名同学中随机抽出2名同学的序号分别为 和 ,则基本事件有
, , , , , , , , , , , , ,
, ,共15个,
将“抽出的2名同学的课外学习时长都不小于210分钟”记为事件,
由已知,序号为1,3,4,6的同学课外学习时长都不小于210分钟,
∴事件 中基本事件有 , , , , , ,共6个,∴ .
( Ⅱ ) ( 1 ) 由 表 知 ,
,
∴ ,∴ ,即 ,①
∵回归直线恒过样本点的中心 ,∴ ,即 ,②
由①②,得 , ,③
∵ ,∴ ,④
由③④,得 , .
(2)∵线性回归方程为 ,
∴当 时,预测值 ,此时残差为
19、(2023·黑龙江哈尔滨·哈师大附中统考三模)碳中和是指国家、企业、产品、活动或个人在一定时间内直
接或间接产生的二氧化碳或温室气体排放总量,通过植树造林、节能减排等形式,以抵消自身产生的二氧
化碳或温室气体排放量,实现正负抵消,达到相对"零排放."2020年9月22日,中国政府在第七十五届联
合国大会上提出:"中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于
2030年前达到峰值,努力争取2060年前实现碳中和.某工厂响应国家号召,随着对工业废气进行处理新技
术不断升级,最近半年二氧化碳排放量逐月递减,具体数据如下表:
月份序号 1 2 3 4 5 6
碳排放量
100 70 50 35 25 20
(吨)
并计算得 .
(1)这6个月中,任取2个月,求已知其中1个月的碳排放量低于6个月碳排放量的平均值的条件下,另1
个月碳排放量高于6个月碳排放量的平均值的概率;(2)若用函数模型 对两个变量月份 与排放量 进行拟合,根据表中数据,求出 关于 的回归方程.
附:对于同一组数据 ,其回归直线 的斜率和截距的最小二乘估计公式
分别为:
【答案】(1) ;
(2) .
【详解】(1)6个月碳排放量的平均值为 ,因此碳排放量低于50的有3
个月,
“从6个月中,任取2个月,其中一个月碳排放量低于50”为事件 ,“1个月碳排放量高于50”为事件 ,
, ,
由条件概率公式可得
所以所求概率为 .
(2)由 ,两边取对数得 ,而 , ,
因此 ,
,
所以回归方程为: ,即 ,亦即 ,所以 关于 的回归方程是 .
20、(2023·江苏南京·南京市秦淮中学校考模拟预测)垃圾是人类日常生活和生产中产生的废弃物,由于
排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采
用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据 ,其中 和 分别
表示第 个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得 ,
, , , .
(1)请用相关系数说明该组数据中 与 之间的关系可用线性回归模型进行拟合;
(2)求 关于 的线性回归方程;
(3)某科研机构研发了两款垃圾处理机器,其中甲款机器每台售价100万元,乙款机器每台售价80万元,
下表是以往两款垃圾处理机器的使用年限统计表:
1年 2年 3年 4年 合计
甲款 5 20 15 10 50
乙款 15 20 10 5 50
根据以往经验可知,某县城每年可获得政府支持的垃圾处理费用为50万元,若仅考虑购买机器的成本和每
台机器的使用年限(使用年限均为整年),以频率估计概率,该县城选择购买一台哪款垃圾处理机器更划
算?
参考公式:相关系数 ,对于一组具有线性相关关系的数据
,其回归直线 的斜率和截距的最小二乘估计分别为: ,.
【答案】(1)因为 与 的相关系数接近 ,所以 与 之间具有较强的线性相关关系,可用线性回归模
型进行拟合;(2) ;(3)甲款.
【分析】(1)根据相关系数的计算公式及参考数据即可得出结论;
(2)根据参考公式及参考数据即可求解;
(3)分别求出从两款机器中购买一台节的政府支持的拉圾外理费用的分布列,然后分别求出期望,比较
即可得出结果
【详解】
解(1)由题意知相关系数 ,
因为 与 的相关系数接近 ,
所以 与 之间具有较强的线性相关关系,可用线性回归模型进行拟合.
(2)由题意可得, ,
,
所以 .
(3)以频率估计概率,购买一台甲款垃圾处理机器节约政府支持的垃圾处理费用 (单位:万元)的分
布列为:
0 50 100
(万元).
购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用 (单位:万元)的分布列为:20 70 120
(万元).
因为 ,所以该县城选择购买一台甲款垃圾处理机器更划算.
21、(2023·江苏南京·校考一模)2020年将全面建成小康社会,是党向人民作出的庄严承诺.目前脱贫攻
坚已经进入冲刺阶段,某贫困县平原地区家庭与山区家庭的户数之比为 .用分层抽样的方法,收集了
100户家庭2019年家庭年收入数据(单位:万元),绘制的频率直方图如图所示,样本中家庭年收入超过
1.5万元的有10户居住在山区.
(1)完成2019年家庭年收入与地区的列联表,并判断是否有99.9%的把握认为该县2019年家庭年收入超过
1.5万元与地区有关.
超过1.5万元 不超过1.5万元 总计
平原地区
山区 10
总计
附: ,其中 .
0.100 0.050 0.010 0.001
k 2.706 3.841 6.635 10.828
(2)根据这100个样本数据,将频率视为概率.为了更好地落实党中央精准扶贫的决策,从2020年9月到12月,每月从该县2019年家庭年收入不超过1.5万元的家庭中选取4户作为“县长联系家庭”,记“县长
联系家庭”是山区家庭的户数为 ,求X的分布列和数学期望 .
【详解】(1)由频率分布直方图可知,收入超过1.5万元的家庭的频率为 ,
所以收入超过1.5万元的家庭的户数有 户,
又因为平原地区家庭与山区家庭的户数之比为 ,抽取了100户,
故平原地区的共有60户,山区地区的共有40户,
又样本中家庭年收入超过1.5万元的有10户居住在山区,
所以超过1.5万元的有40户居住在平原地区,不超过1.5万元的有20户住在平原地区,有30户住在山区
地区,
故2019年家庭年收入与地区的列联表如下:
超过1.5万元 不超过1.5万元 总计
平原地区 40 20 60
山区 10 30 40
总计 50 50 100
则
,
所以有99.9%的把握认为该县2019年家庭年收入超过1.5万元与地区有关.
(2)由(1)可知,选1户家庭在平原的概率为 ,山区的概率为 ,
X的可能取值为0,1,2,3,4,
所以 ,
,,
,
,
所以X的分布列为:
X 0 1 2 3 4
P
因为X服从二项分布 ,
所以X的数学期望
22、(2022·山东济南·高三期末)某机构为了解市民对交通的满意度,随机抽取了100位市民进行调查结
果如下:回答“满意”的人数占总人数的一半,在回答“满意”的人中,“上班族”的人数是“非上班
族”人数的 ;在回答“不满意”的人中,“非上班族”占 .
(1)请根据以上数据填写下面 列联表,并依据小概率值 的独立性检验,分析能否认为市民对于
交通的满意度与是否为上班族存关联?
满意 不满意 合计
上班族
非上班族
合计
(2)为了改善市民对交通状况的满意度,机构欲随机抽取部分市民做进一步调查.规定:抽样的次数不超过
,若随机抽取的市民属于不满意群体,则抽样结束;若随机抽取的市民属于满意群体,则继续抽样,直到抽到不满意市民或抽样次数达到 时,抽样结束.
(i)若 ,写出 的分布列和数学期望;
(ii)请写出 的数学期望的表达式(不需证明),根据你的理解说明 的数学期望的实际意义.
附:
参考公式: ,其中 .
【答案】(1)列联表见解析,市民对交通的满意度与是否上班有关,此推断犯错误的概率不大于0.001
(2)(i)分布列见解析, ;(ii) ,平均每抽取2个人,就会有一个不满意的市民
【解析】
【分析】
(1)根据题意完成列联表,进而利用公式计算可得 ,查表分析可得结果;
(2)(i)由(1)可知市民的满意度和不满意度均为 ,计算可得 的分布列和数学期望,(ⅱ)由
(i)可得 ,当n趋向于正无穷大时, 趋向于2,即可理解为平均每抽取2个人,就会有一
个不满意的市民.
(1)
由题意可知
满意 不满意 合计
上班族 15 40 55
非上班族 35 10 45
合计 50 50 100零假设为 :市民对交通的满意度与是否上班独立,
因为 ;
根据小概率值 的独立性检验,我们推断 不成立,即认为市民对交通的满意度与是否上班有关,
此推断犯错误的概率不大于0.001.
(2)
(i)当 时, 的取值为1,2,3,4,5,
由(1)可知市民的满意度和不满意度均为 ;
所以 , , , , ,
所以 的分布列为
1 2 3 4 5
P
所以 ;
(ⅱ)
当n趋向于正无穷大时, 趋向于2,此时 恰好为不满意度的倒数;
也可以理解为平均每抽取2个人,就会有一个不满意的市民.