文档内容
模块八 概率与统计(测试)
(考试时间:120分钟 试卷满分:150分)
第Ⅰ卷
一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要
求的。
1.下列命题中
①散点图可以直观地判断两个变量是否具有线性相关关系;
②回归直线就是散点图中经过样本数据点最多的那条直线;
③回归分析和独立性检验没有什么区别;
④回归直线一定经过样本中心点.
其中正确的命题个数为( )
A.1 B.2 C.3 D.4
【答案】B
【解析】散点图可以直观地判断两个变量是否具有线性相关关系,①正确;
回归直线可以不经过散点图中的任何一个点,②错误;
回归分析是对具有相关关系的两个变量进行统计分析的一种方法,
独立性检验是对两个变量是否具有某种关系的分析,③错误;
回归直线一定经过样本中心点,④正确,
所以正确的命题个数为2.
故选:B
2.按从小到大顺序排列的两组数据:甲组: ;乙组: ,若这两组数据
的第30百分位数,第50百分位数都分别对应相等,则 ( )
A.60 B.65 C.70 D.71
【答案】D
【解析】由 ,则甲组数据的第30百分位数为31,乙组数据的第30百分位数为n,即 ,
第50百分位数即中位数,则乙组数据的第50百分位数为 ,甲组数据的第50百分位数为 ,
于是 ,解得 ,
所以 .故选:D
3.在 的展开式中, 的系数为( )
A. B.120
C. D.60
【答案】D
【解析】 的通项为: ,
令 可得: 的系数为 .
故选:D.
4.设随机变量X的分布列如下:
X 1 2 3 4
P p
则p为( ).
A. B. C. D.
【答案】B
【解析】由分布列的性质可知, ,得 .
故选:B
5.有5张相同的卡片,分别标有数字1,2,3,4,5,从中有放回地随机取两次,每次取1张卡片. 表
示事件“第一次取出的卡片上的数字为2”, 表示事件“第二次取出的卡片上的数字为1”, 表示“事
件两次取出的卡片上的数字之和为6”, 表示事件“两次取出的卡片上的数字之和为7”,则
( )
A. 与 相互独立 B. 与 相互独立
C. 与 相互独立 D. 与 相互独立【答案】B
【解析】由题意知 , ,
,
,
因为 ,所以A错误,
因为 ,所以B正确,
因为 ,所以C错误,
因为 ,所以D错误.
故选:B
6.基础学科对于一个国家科技发展至关重要,是提高核心竞争力,保持战略领先的关键.其中数学学科尤
为重要.某双一流大学为提高数学系学生的数学素养,特开设了“九章算术”,“古今数学思想”,“数学
原理”,“世界数学通史”,“算术研究”五门选修课程,要求数学系每位同学每学年至多选三门,且已
选过的课程不能再选,大一到大三三学年必须将五门选修课程选完,则每位同学的不同选修方式种数为(
)
A.150种 B.210种 C.240种 D.540种
【答案】B
【解析】若 年学完, ,则选修方式有 种.
若 年学完,
① 时,则选修方式有 种.
② 时, 种.
所以总的方法数有 种.
故选:B7.若 ,则下列说法正确的是
( )
A.
B. 为等差数列
C.设 ,则数列 为等差数列
D.设 ,则数列 的前 项的和为
【答案】D
【解析】对于A: 为 项的系数,而得到展开式中 项,需要每一个括号里都取x项再相乘,
则 .故A错误;
对于B:由上面推导可得: ,
.
所以 ,
所以 不是等差数列.故B错误;
对于C: ,
所以 ,所以 ,
所以 ,所以 ,即数列 不是等差数列.故C错误;
对于D: ,所以数列 的前n项的和
.故D正确.
故选:D
8.甲口袋中装有2个黑球和1个白球,乙口袋中装有3个白球.现从甲、乙两口袋中各任取一个球交换放
入另一口袋,重复 次这样的操作,记甲口袋中黑球个数为 ,恰有1个黑球的概率为 ,恰有
2个黑球的概率为 ,则下列结论不正确的是( )
A. ,
B.数列 是等比数列
C.数列 是等比数列
D. 的数学期望
【答案】B
【解析】依题意, ,
且 , ,
于是 , ,A正确;
显然 ,数列 不是等比数列,B错误;
又 ,即有 ,
而 ,因此数列 是首项为 ,公比为 的等比数列,C正确;显然 ,因此 ,D正确.
故选:B
二、选择题:本题共4小题,每小题5分,共20分。在每小题给出的选项中,有多项符合题目要求。全部
选对的得5分,部分选对的得2分,有选错的得0分。
9.某地教师招聘考试,有3200人参加笔试,满分为100分,笔试成绩前20%(含20%)的考生有资格参
加面试,所有考生的笔试成绩和年龄分别如频率分布直方图和扇形统计图所示,则( )
A.90后考生比00后考生多150人 B.笔试成绩的60%分位数为80
C.参加面试的考生的成绩最低为86分 D.笔试成绩的平均分为76分
【答案】BD
【解析】对于A中,由年龄的扇形统计图,可得90后的考生有 人,
00后的考生有 人,可得 人,所以A不正确;
对于B中,由频率分布直方图性质,可得 ,
解得 ,则前三个矩形的面积和 ,
所以试成绩的 分位数为 分,所以B正确;
对于C中,设面试成绩的最低分为 ,由前三个矩形的面积和为 ,第四个矩形的面积为 ,则
分,所以C不正确;
对于D中,根据频率分布直方图的平均数的计算公式,可得考试的平均成绩为:
分,所以D正确.
故选:BD.
10.下列说法正确的是( )
A.数据 的第45百分位数是4B.若数据 的标准差为 ,则数据 的标准差为
C.随机变量 服从正态分布 ,若 ,则
D.随机变量 服从二项分布 ,若方差 ,则
【答案】BCD
【解析】对于A中,数据从小到大排列为 ,共有8个数据,
因为 ,所以数据的第45分位数为第4个数据,即为2,所以A不正确;
对于B中,数据 的标准差为 ,
由数据方差的性质,可得数据 的标准差为 ,所以B正确;
对于C中,随机变量 服从正态分布 ,且 ,
根据正态分布曲线的对称性,可得 ,所以C正确;
对于D中,随机变量 服从二项分布 ,且 ,
可得 ,解得 或 ,
当 时,可得 ;
当 时,可得 ,
综上可得, ,所以D正确.
故选:BCD.
11.关于 的展开式,下列陈述正确的是( )
A.各项系数的和等于0 B.二项式系数的和等于512
C.常数项等于 D.含 的最高次幂的项是 .
【答案】ACD【解析】对于A,在 中,令 ,得 ,即各项系数的和等于0,故A正确;
对于B,二项式系数的和等于 ,故B错误;
对于C, 的展开通项为 ,
令 ,得 ,所以常数项等于 ,故C正确;
对于D,由通项可知,当 时,得到含 的最高次幂的项是 ,故D正确.
故选:ACD.
12.记男生样本 的平均数为 ,方差为 ;女生样本 的平均数为 ,方差为 ;男
女总样本 的平均数记为 ,方差为 ,则下列说法正确的是( )
A.若 ,则
B.若 ,则
C.若 , ,则
D.
【答案】BCD
【解析】对A, ,可得 ,则 或 ,A不正确.
对B, ,所以 ,若 ,则 ,B正确.
对C,因为 ,所以 ,
则 .又 ,
所以 ,C正确.
对D,
,
所以 ,D正确.
故选:BCD
第Ⅱ卷
三、填空题:本题共4小题,每小题5分,共20分。
13.学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全
国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己
连续七天每天一次最多答对的题数如下表:
天数x 1 2 3 4 5 6 7
1 2
一次最多答对题数y 12 16 18 21 27
5 4
参考数据: , , , , ,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),其相
关系数 (结果保留两位小数)
【答案】 正 0.99
【解析】由表中数据得 随 的增大而增大,
所以该老师每天一次最多答对题数y与天数x之间是正相关,.
故答案为:正; .
14.将甲、乙、丙、丁、戊五名志愿者分配到A、B、C三项不同的公益活动中,每人只参加一项活动,每
项活动都需要有人参加,其中甲必须参加A活动,则不同的分配方法有 种.(用数字作答)
【答案】
【解析】由题意,可分为三种情况:
当甲单独参加A项活动,则有 种安排方法;
当甲和其中一人参加A项活动,则有 种安排方法;
当甲和其中两人参加A项活动,则有 种安排方法,
所以不同的分配方法有 种不同的安排方法.
故答案为: .
15.移动支付在中国大规模推广五年之后,成功在10亿移动互联网用户中获得了九成的渗透率,这大约是
中国自宽带和手机之后,普及率最高的一项产品,甚至,移动支付被视为新时代中国的四大发明之一.近日
在一家大型超市进行了顾客使用移动支付情况的调查.调查人员从年龄在20岁到60岁的顾客中随机抽取了
200人,得到如下数据:
年龄段人数类
型
使用移动支付 45 40 25 15
不使用移动支
0 10 20 45
付
从这200人中随机依次抽取2人,已知第1次抽到的人使用移动支付的条件下,第2次抽到的人不使用移
动支付的概率为 ;在随机抽取的200人中对使用移动支付的人群采用分层抽样的方式抽取25人做进
一步的问卷调查,再从这25人中随机选出3人颁发参与奖,则这3人中恰有1人的年龄在 之间的概率是 .
【答案】
【解析】使用移动支付的有 人,不使用移动支付的有 人.
①第1次抽到的人使用移动支付的条件下,第2次抽到的人不使用移动支付的概率为 .
② ,所以抽取的 人中,
在 之间的有 人,在 之外的有 人,
从这25人中随机选出3人,这3人中恰有1人的年龄在 之间的概率是 .
故答案为: ;
16.从教学楼一楼到二楼共有11级台阶(从下往上依次为第1级,第2级, ,第11级),学生甲一步
能上1级或2级台阶,若甲从一楼上到二楼使用每一种方法都是等概率的,则甲踩过第5级台阶的概率是
.
【答案】
【解析】记学生甲上到第 级台阶共有 种上法,则 ,
当 时,学生甲上到第 级台阶,可以从第 级或第 级上去,
所以 ,
于是 , , ,
其中甲踩过第5级台阶的上台阶方法数,可分两步计算,
第一步,从第1级到第5级,共有 种方法;
第二步,从第6级到第11级,相当于从第1级到第6级的方法数,共有 种方法;
所以甲踩过第5级台阶的上台阶方法数有 ,则甲踩过第5级台阶的概率是 .
故答案为: .
四、解答题:本题共6小题,共70分。解答应写出文字说明、证明过程或演算步棸。
17.(10分)
杭州第19届亚运会,中国代表团共获得201金111银71铜,共383枚奖牌,金牌数超越2010年广州亚运
会的199枚,标志着我国体育运动又有了新的突破.某大学从全校学生中随机抽取了130名学生,对其日常
参加体育运动情况做了调查,其中是否经常参加体育运动的数据统计如下:
经常参加 不经常参加
男
60 20
生
女
40 10
生
(1)利用频率估计概率,现从全校女生中随机抽取5人,求其中恰有2人不经常参加体育运动的概率;
(2)依据小概率值 的 独立性检验,能否认为是否经常参加体育运动与性别有关联.
参考公式: .
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【解析】(1)由表格知:经常参加与不经常参加体育运动的女生比例为 ,
所以,抽取到不经常参加体育运动的女生人数服从 ,
故恰有2人不经常参加体育运动的概率 .
(2)由题设得 列联表如下:
经常参加 不经常参加
男
60 20 80
生
40 10 50
女生
100 30 130
故 ,
所以,依据小概率值 的独立性检验认为经常参加体育运动与性别没有关联.
18.(12分)
家居消费是指居民在日常生活中购买和使用的家具、家电、建材、装修等产品和服务所形成的消费行为.长
期以来,家居消费一直是居民消费的重要组成部分,对于带动居民消费增长和经济恢复具有重要意义.某家
居店为了迎接周年庆举办促销活动,统计了半个月以来天数x与销售额y(万元)的一组数据 :
.通过分析发现x与y呈线性相关.
(1)求x与y的样本相关系数r(结果保留三位小数);
(2)求x与y的线性回归方程 ( , 的结果用分数表示).
参考公式:相关系数 , , .
参考数据: , , , .
【解析】(1)依题意, , ,
所以 .
(2)因为 ,则 ,
所以y关于x的线性回归方程为 .19.(12分)
某科目进行考试时,从计算机题库中随机生成一份难度相当的试卷.规定每位同学有三次考试机会,一旦某
次考试通过,该科目成绩合格,无需再次参加考试,否则就继续参加考试,直到用完三次机会.现从2022
年和2023年这两年的第一次、第二次、第三次参加考试的考生中,分别随机抽取100位考生,获得数据如
下表:
2022年 2023年
通过 未通过 通过 未通过
第一
60人 40人 50人 50人
次
第二
70人 30人 60人 40人
次
第三
80人 20人 人 人
次
假设每次考试是否通过相互独立.
(1)从2022年和2023年第一次参加考试的考生中各随机抽取一位考生,估计这两位考生都通过考试的概率;
(2)小明在2022年参加考试,估计他不超过两次考试该科目成绩合格的概率;
(3)若2023年考生成绩合格的概率不低于2022年考生成绩合格的概率,则 的最小值为下列数值中的哪一
个?(直接写出结果)
8
的值 88 93
3
【解析】(1)记事件 :“2022年第 次参加考试的考生通过考试”, ,
记事件 :“2023年第 次参加考试的考生通过考试”, ,
则 , ,
从2022年和2023年第一次参加考试的考生中各随机抽取一位考生,估计这两位考生都通过考试的概率
为 ;
(2) , ,
,小明在2022年参加考试,估计他不超过两次考试该科目成绩合格的概率为
;
(3)2022年考生成绩合格的概率为 ,
2023年考生成绩合格的概率为 ,
要使2023年考生成绩合格的概率不低于2022年考生成绩合格的概率,
则 ,解得 .
故 的最小值为 .
20.(12分)
杭州亚运会吉祥物为一组名为“江南忆”的三个吉祥物“宸宸”,“琮琮”,“莲莲”,聚焦共同的文化
基因,蕴含独特的城市元素.本次亚运会极大地鼓舞了中国人民参与运动的热情.某体能训练营为了激励
参训队员,在训练之余组织了一个“玩骰子赢礼品”的活动,他们来到一处训练场地,恰有20步台阶,现
有一枚质地均匀的骰子,游戏规则如下:掷一次骰子,出现3的倍数,则往上爬两步台阶,否则爬一步台
阶,再重复以上步骤,当队员到达第7或第8步台阶时,游戏结束.规定:到达第7步台阶,认定失败;
到达第8步台阶可赢得一组吉祥物.假设平地记为第0步台阶.记队员到达第 步台阶的概率为 (
),记 .
(1)投掷4次后,队员站在的台阶数为第 阶,求 的分布列;
(2)①求证:数列 ( )是等比数列;
②求队员赢得吉祥物的概率.
【解析】(1)由题意得每轮游戏爬一步台阶的概率为 ,爬两步台阶的概率为 ,
所以随机变量 可能取值为4,5,6,7,8,
可得 , ,, ,
,
所以 的分布列:
4 5 6 7 8
(2)(ⅰ)证明: ,即爬一步台阶,是第1次掷骰子,
向上点数不是3的倍数概率 ,则
到达第 步台阶有两种情况:
①前一轮爬到第 步台阶,又掷骰子是3的倍数得爬两步台阶,其概率为 ,
②前一轮爬到第 步台阶,又掷骰子不是3的倍数爬一步台阶,其概率为 ,
所以 ( ),
则 ( ),
所以数列 ( )是首项为 ,公比为 的等比数列.
(ⅱ)因为数列 是首项为 ,公比为 的等比数列,
所以 ,所以 , ,…, ,
各式相加,得: ,所以 ( ),
所以活动参与者得到纪念品的概率为
.21.(12分)
中国国家统计局2019年9月30日发布数据显示,2019年9月中国制造业采购经理指数(PMI)为 ,
反映出中国制造业扩张步伐有所加快.以新能源汽车、机器人、增材制造、医疗设备、高铁、电力装备、
船舶、无人机等为代表的高端制造业突飞猛进,则进一步体现了中国制造目前的跨越式发展.已知某精密
制造企业根据长期检测结果,得到生产的产品的质量差服从正态分布 ,并把质量差在
内的产品称为优等品,质量差在 内的产品称为一等品,优等品与一等品统称为
正品,其余范围内的产品作为废品处理.现从该企业生产的正品中随机抽取1000件,测得产品质量差的样
本数据统计如下:
(1)根据大量的产品检测数据,检查样本数据的标准差s近似值为10,用样本平均数 作为 的近似值,用
样本标准差 作为 的估计值,记质量差服从正态分布 ,求该企业生产的产品为正品的概率
;(同一组中的数据用该组区间的中点值代表)
参考数据:若随机变量服从正态分布 ,则 , ,
.
(2)假如企业包装时要求把2件优等品和 ( ,且 )件一等品装在同一个箱子中,质检员从某箱
子中摸出两件产品进行检验,若抽取到的两件产品等级相同则该箱产品记为 ,否则该箱产品记为 .
①试用含 的代数式表示某箱产品抽检被记为 的概率 ;
②设抽检5箱产品恰有3箱被记为 的概率为 ,求当 为何值时, 取得最大值.【解析】(1)由题意,估计从该企业生产的正品中随机抽取1000件的平均数为:
,即 ,
,所以 ,
则优等品为质量差在 内,即 ,
一等品为质量差在 内,即 ,
所以正品为质量差在 和 内,即 ,
所以该企业生产的产品为正品的概率:
;
(2)①从 件正品中任选两个,有 种选法,其中等级相同有 种选法,
∴某箱产品抽检被记为B的概率为: .
②由题意,一箱产品抽检被记为 的概率为 ,则5箱产品恰有3箱被记为 的概率为
,
所以 ,
所以当 时, ,函数 单调递增,
当 时, ,函数 单调递减,
所以当 时, 取得最大值,最大值为 .
此时 ,解得: ,∴ 时,5箱产品恰有3箱被记为 的概率最大,最大值为 .
22.(12分)
某区域中的物种C有A种和B种两个亚种.为了调查该区域中这两个亚种的数目比例(A种数目比B种数
目少),某生物研究小组设计了如下实验方案:①在该区域中有放回的捕捉50个物种C,统计其中A种数
目,以此作为一次试验的结果;②重复进行这个试验n次(其中 ),记第i次试验中的A种数目为随
机变量 ( );③记随机变量 ,利用 的期望 和方差 进行估算.设该
区域中A种数目为M,B种数目为N,每一次试验都相互独立.
(1)已知 , ,证明: ,
;
(2)该小组完成所有试验后,得到 的实际取值分别为 ( ),并计算了数据 ( )
的平均值 和方差 ,然后部分数据丢失,仅剩方差的数据 .
(ⅰ)请用 和 分别代替 和 ,估算 和 ;
(ⅱ)在(ⅰ)的条件下,求 的分布列中概率值最大的随机事件 对应的随机变量的取值.
【解析】(1)由题可知 ( ,2,…,n)均近似服从完全相同的二项分布,
则 , ,
,
,
所以 , .(2)(ⅰ)由(1)可知 ,
则 的均值 , 的方差 ,
所以 ,解得 或 ,
由题意可知: ,则 ,
所以 , ;
(ⅱ)由(ⅰ)可知: ,则 ,
则 ,
由题意可知: ,
解得 ,且 ,则 ,
所以 的分布列中概率值最大的随机事件 对应的随机变量的取值为15.