文档内容
专题 16 概率与统计(解答题)(理科专用)
1.【2022年全国甲卷】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜
方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已
知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
【答案】(1)0.6;
(2)分布列见解析,E(X)=13.
【解析】
【分析】
(1)设甲在三个项目中获胜的事件依次记为A,B,C,再根据甲获得冠军则至少获胜两个
项目,利用互斥事件的概率加法公式以及相互独立事件的乘法公式即可求出;
(2)依题可知,X的可能取值为0,10,20,30,再分别计算出对应的概率,列出分布列,即
可求出期望.
(1)
设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为
P=P(ABC)+P(ABC)+P(ABC)+P(ABC)
=0.5×0.4×0.8+0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2
=0.16+0.16+0.24+0.04=0.6.
(2)
依题可知,X的可能取值为0,10,20,30,所以,
P(X=0)=0.5×0.4×0.8=0.16,
P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,
P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,
P(X=30)=0.5×0.6×0.2=0.06.
即X的分布列为
X 0 10 20 30
P 0.16 0.44 0.34 0.06
期望E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.
2.【2022年新高考1卷】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100
例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到
如下数据:
不够良
良好
好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件
P(B|A) P(B|A)
“选到的人患有该疾病”. 与 的比值是卫生习惯不够良好对患该疾病
P(B|A) P(B|A)
风险程度的一项度量指标,记该指标为R.
P(A|B) P(A|B)
(ⅰ)证明:R= ⋅ ;
P(A|B) P(A|B)
(ⅱ)利用该调查数据,给出P(A|B),P(A|B)的估计值,并利用(ⅰ)的结果给出R
的估计值.
n(ad−bc) 2
附K2=
,
(a+b)(c+d)(a+c)(b+d)
P(K2≥k)0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)答案见解析
(2)(i)证明见解析;(ii)R=6;
【解析】
【分析】
(1)由所给数据结合公式求出K2的值,将其与临界值比较大小,由此确定是否有99%的把握
认为患该疾病群体与未黄该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公
式即可完成证明;(ii)根据(i)结合已知数据求R.
(1)n(ad−bc) 2 200(40×90−60×10) 2
由已知K2= = =24,
(a+b)(c+d)(a+c)(b+d) 50×150×100×100
又P(K2≥6.635)=0.01,24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)
P(B|A) P(B|A) P(AB) P(A) P(AB) P(A)
(i)因为R= ⋅ = ⋅ ⋅ ⋅ ,
P(B|A) P(B|A) P(A) P(AB) P(A) P(AB)
P(AB) P(B) P(AB) P(B)
所以R= ⋅ ⋅ ⋅
P(B) P(AB) P(B) P(AB)
P(A|B) P(A|B)
所以R= ⋅ ,
P(A|B) P(A|B)
(ii)
40 10
由已知P(A|B)= ,P(A|B)= ,
100 100
60 90
又P(A|B)= ,P(A|B)= ,
100 100
P(A|B) P(A|B)
所以R= ⋅ =6
P(A|B) P(A|B)
3.【2022年新高考2卷】在某地区进行流行病学调查,随机调查了100位某种疾病患者的
年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总
人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的
概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【答案】(1)44.65岁;
(2)0.89;
(3)0.0014.
【解析】
【分析】
(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;
(2)设A={一人患这种疾病的年龄在区间[20,70)},根据对立事件的概率公式
P(A)=1−P(A)即可解出;
(3)根据条件概率公式即可求出.
(1)
平均年龄x=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023
+55×0.020+65×0.012+75×0.006+85×0.002)×10=44.65(岁).
(2)
设A={一人患这种疾病的年龄在区间[20,70)},所以
P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89.
(3)
设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},
则由条件概率公式可得
P(BC) 0.1%×0.023×10 0.001×0.23
P(C|B)= = = =0.0014375≈0.0014.
P(B) 16% 0.16
4.【2021年新高考1卷】某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参
加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同
学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,
该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个
问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确
回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记 为小明的累计得分,求 的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
【答案】(1)见解析;(2) 类.
【解析】【分析】
(1)通过题意分析出小明累计得分 的所有可能取值,逐一求概率列分布列即可.(2)
与(1)类似,找出先回答 类问题的数学期望,比较两个期望的大小即可.
【详解】
(1)由题可知, 的所有可能取值为 , , .
;
;
.
所以 的分布列为
(2)由(1)知, .
若小明先回答 问题,记 为小明的累计得分,则 的所有可能取值为 , , .
;
;
.
所以 .
因为 ,所以小明应选择先回答 类问题.
5.【2021年新高考2卷】一种微生物群体可以经过自身繁殖不断生存下来,设一个这种
微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物
每代繁殖的个数是相互独立的且有相同的分布列,设X表示1个微生物个体繁殖下一代的
个数, .(1)已知 ,求 ;
(2)设p表示该种微生物经过多代繁殖后临近灭绝的概率,p是关于x的方程:
的一个最小正实根,求证:当 时, ,当 时,
;
(3)根据你的理解说明(2)问结论的实际含义.
【答案】(1)1;(2)见解析;(3)见解析.
【解析】
【分析】
(1)利用公式计算可得 .
(2)利用导数讨论函数的单调性,结合 及极值点的范围可得 的最小正零点.
(3)利用期望的意义及根的范围可得相应的理解说明.
【详解】
(1) .
(2)设 ,
因为 ,故 ,
若 ,则 ,故 .
,
因为 , ,
故 有两个不同零点 ,且 ,
且 时, ; 时, ;
故 在 , 上为增函数,在 上为减函数,若 ,因为 在 为增函数且 ,
而当 时,因为 在 上为减函数,故 ,
故 为 的一个最小正实根,
若 ,因为 且在 上为减函数,故1为 的一个最
小正实根,
综上,若 ,则 .
若 ,则 ,故 .
此时 , ,
故 有两个不同零点 ,且 ,
且 时, ; 时, ;
故 在 , 上为增函数,在 上为减函数,
而 ,故 ,
又 ,故 在 存在一个零点 ,且 .
所以 为 的一个最小正实根,此时 ,
故当 时, .
(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后
代的平均数超过1,则若干代后被灭绝的概率小于1.
6.【2020年新课标1卷理科】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累
计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮
空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两
人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为 ,
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.
【答案】(1) ;(2) ;(3) .
【解析】
【分析】
(1)根据独立事件的概率乘法公式可求得事件“甲连胜四场”的概率;
(2)计算出四局以内结束比赛的概率,然后利用对立事件的概率公式可求得所求事件的概
率;
(3)列举出甲赢的基本事件,结合独立事件的概率乘法公式计算出甲赢的概率,由对称性
可知乙赢的概率和甲赢的概率相等,再利用对立事件的概率可求得丙赢的概率.
【详解】
(1)记事件 甲连胜四场,则 ;
(2)记事件 为甲输,事件 为乙输,事件 为丙输,
则四局内结束比赛的概率为
,
所以,需要进行第五场比赛的概率为 ;
(3)记事件 为甲输,事件 为乙输,事件 为丙输,
记事件 甲赢,记事件 丙赢,
则甲赢的基本事件包括: 、 、 、
、 、 、 、 ,
所以,甲赢的概率为 .
由对称性可知,乙赢的概率和甲赢的概率相等,所以丙赢的概率为 .
【点睛】
本题考查独立事件概率的计算,解答的关键就是列举出符合条件的基本事件,考查计算能
力,属于中等题.
7.【2020年新课标2卷理科】某沙漠地区经过治理,生态系统得到很大改善,野生动物
数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这
些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,
2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物
的数量,并计算得 , , , ,
.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生
动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该
地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r= , ≈1.414.
【答案】(1) ;(2) ;(3)详见解析
【解析】
【分析】
(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;(2)利用公式 计算即可;
(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.
【详解】
(1)样区野生动物平均数为 ,
地块数为200,该地区这种野生动物的估计值为
(2)样本 (i=1,2,…,20)的相关系数为
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
【点晴】
本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算
能力,是一道容易题.
8.【2020年新课标3卷理科】某学生兴趣小组随机调查了某市100天中每天的空气质量等
级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
[0,200] (200,400] (400,600]
空气质量等级
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为
代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级
为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据
列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有
关?
人次≤400 人次>400
空气质量好
空气质量不好
附: ,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)该市一天的空气质量等级分别为 、 、 、 的概率分别为 、 、
、 ;(2) ;(3)有,理由见解析.
【解析】
【分析】
(1)根据频数分布表可计算出该市一天的空气质量等级分别为 、 、 、 的概率;
(2)利用每组的中点值乘以频数,相加后除以 可得结果;
(3)根据表格中的数据完善 列联表,计算出 的观测值,再结合临界值表可得结论.
【详解】
(1)由频数分布表可知,该市一天的空气质量等级为 的概率为 ,等级为
的概率为 ,等级为 的概率为 ,等级为 的概率为
;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为(3) 列联表如下:
人次 人次
空气质量好
空气质量不好
,
因此,有 的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
【点睛】
本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据
处理能力,属于基础题.
9.【2020年新高考1卷(山东卷)】为加强环境保护,治理空气污染,环境监测部门对
某市空气质量进行调研,随机抽查了 天空气中的 和 浓度(单位: ),
得下表:
(1)估计事件“该市一天空气中 浓度不超过 ,且 浓度不超过 ”的概率;
(2)根据所给数据,完成下面的 列联表:(3)根据(2)中的列联表,判断是否有 的把握认为该市一天空气中 浓度与
浓度有关?
附: ,
【答案】(1) ;(2)答案见解析;(3)有.
【解析】
【分析】
(1)根据表格中数据以及古典概型的概率公式可求得结果;
(2)根据表格中数据可得 列联表;
(3)计算出 ,结合临界值表可得结论.
【详解】
(1)由表格可知,该市100天中,空气中的 浓度不超过75,且 浓度不超过150
的天数有 天,
所以该市一天中,空气中的 浓度不超过75,且 浓度不超过150的概率为
;
(2)由所给数据,可得 列联表为:合计
64 16 80
10 10 20
合计 74 26 100
(3)根据 列联表中的数据可得
,
因为根据临界值表可知,有 的把握认为该市一天空气中 浓度与 浓度有关.
【点睛】
本题考查了古典概型的概率公式,考查了完善 列联表,考查了独立性检验,属于中档
题.
10.【2019年新课标1卷理科】为了治疗某种疾病,研制了甲、乙两种新药,希望知道哪
种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比
试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,
再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试
验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲
药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得 分;若施以乙药的白鼠治
愈且施以甲药的白鼠未治愈则乙药得1分,甲药得 分;若都治愈或都未治愈则两种药均
得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求 的分布列;
(2)若甲药、乙药在试验开始时都赋予4分, 表示“甲药的累计得分为 时,
最终认为甲药比乙药更有效”的概率,则 , ,
,其中 , , .假设 , .
(i)证明: 为等比数列;(ii)求 ,并根据 的值解释这种试验方案的合理性.
【答案】(1)见解析;(2)(i)见解析;(ii) .
【解析】
【分析】
(1)首先确定 所有可能的取值,再来计算出每个取值对应的概率,从而可得分布列;
(2)(i)求解出 的取值,可得 ,从而整理出
符合等比数列定义的形式,问题得证;(ii)列出证得的等比数列的通项公式,采用累加的
方式,结合 和 的值可求得 ;再次利用累加法可求出 .
【详解】
(1)由题意可知 所有可能的取值为: , ,
; ;
则 的分布列如下:
(2) ,
, ,
(i)
即
整理可得:
是以 为首项, 为公比的等比数列
(ii)由(i)知:
, ,……,作和可得:
表示最终认为甲药更有效的.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为
0.8时,认为甲药更有效的概率为 ,此时得出错误结论的概率非常小,说
明这种实验方案合理.
【点睛】
本题考查离散型随机变量分布列的求解、利用递推关系式证明等比数列、累加法求解数列
通项公式和数列中的项的问题.本题综合性较强,要求学生能够熟练掌握数列通项求解、概
率求解的相关知识,对学生分析和解决问题能力要求较高.
11.【2019年新课标2卷理科】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10
平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打
比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互
独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.
(1)求P(X=2);
(2)求事件“X=4且甲获胜”的概率.
【答案】(1) ;(2)0.1
【解析】
【分析】
(1)本题首先可以通过题意推导出 所包含的事件为“甲连赢两球或乙连赢两球”,
然后计算出每种事件的概率并求和即可得出结果;
(2)本题首先可以通过题意推导出 所包含的事件为“前两球甲乙各得 分,后两球
均为甲得分”,然后计算出每种事件的概率并求和即可得出结果.
【详解】(1)由题意可知, 所包含的事件为“甲连赢两球或乙连赢两球”
所以
(2)由题意可知, 包含的事件为“前两球甲乙各得 分,后两球均为甲得分”
所以
【点睛】
本题考查古典概型的相关性质,能否通过题意得出 以及 所包含的事件
是解决本题的关键,考查推理能力,考查学生从题目中获取所需信息的能力,是中档题.
12.【2019年新课标3卷理科】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下
试验:将200只小鼠随机分成 两组,每组100只,其中 组小鼠给服甲离子溶液,
组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某
种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记 为事件:“乙离子残留在体内的百分比不低于 ”,根据直方图得到 的估计值
为 .
(1)求乙离子残留百分比直方图中 的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代
表).
【答案】(1) , ;(2) , .【解析】
【分析】
(1)由 及频率和为1可解得 和 的值;(2)根据公式求平均数.
【详解】
(1)由题得 ,解得 ,由 ,解得
.
(2)由甲离子的直方图可得,甲离子残留百分比的平均值为
,
乙离子残留百分比的平均值为
【点睛】
本题考查频率分布直方图和平均数,属于基础题.
13.【2018年新课标1卷理科】某工厂的某种产品成箱包装,每箱 件,每一箱产品在
交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱
产品中任取 件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品
为不合格品的概率都为 ,且各件产品是否为不合格品相互独立.
(1)记 件产品中恰有 件不合格品的概率为 ,求 的最大值点 ;
(2)现对一箱产品检验了 件,结果恰有 件不合格品,以(1)中确定的 作为 的值.
已知每件产品的检验费用为 元,若有不合格品进入用户手中,则工厂要对每件不合格品
支付 元的赔偿费用.
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 ,求
;
(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
【答案】(1) ;(2)(i) ;(ii)应该对余下的产品作检验.
【解析】
【分析】
(1)利用独立重复实验成功次数对应的概率,求得 ,之后对其求导,利用导数在相应区间上的符号,确定其单调性,从而得到其最大值点,这里要注意
的条件;
(2)先根据第一问的条件,确定出 ,在解(i)的时候,先求件数对应的期望,之后
应用变量之间的关系,求得赔偿费用的期望;在解(ii)的时候,就通过比较两个期望的大
小,得到结果.
【详解】
(1) 件产品中恰有 件不合格品的概率为 .
因此 .
令 ,得 .当 时, ;当 时, .
所以 的最大值点为 ;
(2)由(1)知, .
(i)令 表示余下的 件产品中的不合格品件数,依题意知 ,
,即 .
所以 .
(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.
由于 ,故应该对余下的产品作检验.
【点睛】
该题考查的是有关随机变量的问题,在解题的过程中,一是需要明确独立重复试验成功次
数对应的概率公式,再者就是对其用函数的思想来研究,应用导数求得其最小值点,在做
第二问的时候,需要明确离散型随机变量的可取值以及对应的概率,应用期望公式求得结
果,再有就是通过期望的大小关系得到结论.
14.【2018年新课标2卷理科】下图是某地区2000年至2016年环境基础设施投资额
(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了 与时间变量 的
两个线性回归模型.根据2000年至2016年的数据(时间变量 的值依次为 )建立
模型①: ;根据2010年至2016年的数据(时间变量 的值依次为
)建立模型②: .
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预
测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【答案】(1)利用模型①预测值为226.1,利用模型②预测值为256.5,(2)利用模型②
得到的预测值更可靠.
【解析】
【详解】
分析:(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,
就得结果;(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且
2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能
较好得到2018的预测.
详解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
=–30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–
30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环
境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,
2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设
施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型
=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型
②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预
测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用
模型②得到的预测值更可靠.
点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直
线方程有待定参数,则根据回归直线方程恒过点 求参数.
15.【2018年新课标3卷理科】某工厂为提高生产效率,开展技术创新活动,提出了完成
某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们
随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.
根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数 ,并将完成生产任务所需时间超过
和不超过 的工人数填入下面的列联表:
超过 不超过
第一种生产方式第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附: ,
【答案】(1)第二种生产方式的效率更高. 理由见解析
(2)80
(3)能
【解析】
【详解】
分析:(1)计算两种生产方式的平均时间即可.
(2)计算出中位数,再由茎叶图数据完成列联表.
(3)由公式计算出 ,再与6.635比较可得结果.
详解:(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至
少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分
钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分
钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产
方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;
用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的
效率更高.
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最
多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎
7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间
分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知 .
列联表如下:
超过 不超过
第一种生产方式 15 5
第二种生产方式 5 15
(3)由于 ,所以有99%的把握认为两种生产方式的效
率有差异.
点睛:本题主要考查了茎叶图和独立性检验,考察学生的计算能力和分析问题的能力,贴
近生活.