文档内容
专题五 微专题 3 统计与成对数据的统计分析
(分值:90分)
一、单项选择题(每小题5分,共30分)
1.(2024·南通模拟)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号
分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65
09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75
73 88 05 90 52 23 59 43 10
若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是( )
A.10 B.09
C.71 D.20
2.(2024·张家口模拟)现有一组数据x ,x ,…,x ,将这组数据按照从小到大的顺序排列,则去掉第一个数
1 2 n
和最后一个数后,下列统计量一定不变的是( )
A.平均数 B.中位数
C.方差 D.极差
3.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表(单位:人):
月收入
月收入5 000元以下 月收入5 000元及以上 合计
文化程度
高中文化以上 10 45 55
高中文化及以下 20 30 50
合计 30 75 105
105×(10×30-45×20) 2
由上表中数据计算得χ2= ≈6.109.如果认为文化程度与月收入有关系,那么犯错误
55×50×30×75
的概率不会超过( )
附表:
α 0.10 0.05 0.010 0.005 0.001
x 2.706 3.841 6.635 7.879 10.828
α
A.0.001 B.0.005C.0.01 D.0.05
4.(2024·临沂模拟)一组数据按从小到大的顺序排列为1,4,m,12,14,21,若该组数据的中位数是极差
2
的 ,则该组数据的第45百分位数是( )
5
A.4 B.6
C.8 D.12
5.(2024·新课标全国Ⅱ)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩
产量(单位:kg)并整理得下表:
亩产量 [900,950) [950,1 000) [1 000,1 050) [1 050,1 100) [1 100,1 150) [1 150,1 200]
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
6.(2024·秦皇岛模拟)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男
生,测量了他们的身高和体重得下表:
身高x(单位:cm) 167 173 175 177 178 180 181
体重y(单位:kg) 90 54 59 64 67 72 76
由表格制作成如图所示的散点图:
^ ^ ^
由最小二乘法计算得到经验回归直线l 1 的方程为 y=b x+a , 其样本相关系数为r 1 ;经过残差分析,点
1 1
^ ^ ^
(167,90)对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线l 2 的方程为 y=b x+a ,
2 2
样本相关系数为r .则下列选项正确的是( )
2
^ ^ ^ ^
A.b >b ,a >a ,r 1 b ,a r 2
1 2 1 2^ ^ ^ ^
C.b r 2
1 2 1 2
^ ^ ^ ^
D.b a ,r 1 7.879=x ,
0.005
依据小概率值α=0.005的独立性检验,可以推断H 不成立,即性别与选择餐厅之间有关.
0
6
1
12.解 (1) 由y= Σ y=80,
6 i
i=1
91+86+p+78+73+70
得 =80,
6
解得p=82.
1+2+3+4+5+6
(2)∵x= =3.5,
6
6 6 6
1
而y= Σ y=80, Σ xy=1 606, Σ x2 =91,
6 i i i i
i=1 i=1 i=1
^
1 606-6×3.5×80 -74
∴ b=
91-6×3.52
=
17.5
≈-4,
^
a=80-(-4)×3.5=94,
^
所求的经验回归方程为y=-4x+94.
^ ^ ^ ^ ^ ^
(3)由(2)可知,y =90,y =86,y =82,y =78,y =74,y =70,
1 2 3 4 5 6
故有效数据为(2,86),(3,82),(4,78),(6,70),ξ的可能取值为0,1,2,
C2
1
P(ξ=0)= 2 = ,
C2 15
6
C1C1
8
P(ξ=1)= 4 2 = ,
C2 15
6
C2
2
P(ξ=2)= 4 = ,
C2 5
6
则ξ的分布列为
ξ 0 1 2
1 8 2
P
15 15 5
1 8 2 4
E(ξ)=0× +1× +2× = .
15 15 5 3
13.C [设没剔除两对数据前的x,y的平均数分别为x,y,
剔除两对数据后的x,y的平均数分别为x',y',
5 5
1
为 Σ y=140,所以y'= Σ y=28,
i 5 i
i=1 i=1
y'-m 28-m
则x'= = ,
4 4
因为两对数据为(6,28)和(0,28),
1
所以y= ×(140+56)=28,
7
1
所以x= (7×y-166)=3,
10
7x-6-0 28-m
所以x'= =3= ,
5 4
解得m=16.]
14.ABD [设甲为x ,x ,…,x ,乙为y ,y ,…,y ,新数据为z ,z ,…,z ,
1 2 10 1 2 10 1 2 20
1 1
对于A,因为z= (z +z +…+z )= (10a+10a)=a,所以A正确;
20 1 2 20 20
对于B,设甲:1,2,…,10;乙:21,22,…,30,两组数据的极差均为9,但混合后数据的极差为
29,所以B正确;
1 1
对于C,因为 (x2 +x2 +…+x2 -10x2)= (y2 +y2 +…+y2 -10y2)=c,
10 1 2 10 10 1 2 10
所以x2 +x2 +…+x2 =10c+10x2,
1 2 10y2+y2+…+y2 =10c+10y2,
1 2 10
x+ y
z= ,
2
1 1
所以新数据的方差为 (x2 +x2 +…+x2 +y2 +y2 +…+y2 -20z2) = (10c+10x2+10c+10y2-20z2)=c+
20 1 2 10 1 2 10 20
x2+ y2-2z2
,
2
(x+ y) 2 (x- y) 2
因为x2+y2-2z2=x2+y2-2× = ≥0,
2 2
所以新数据的方差一定不小于c,所以C错误;
对于D,不妨设x ≤x ≤…≤x ,
1 2 10
y ≤y ≤…≤y ,
1 2 10
x +x y + y
则d= 5 6= 5 6 ,
2 2
将混合后数据按从小到大排列,
若x ≤y ,则x ≥y ,所以第10,11个数为y 和y ;
5 5 6 6 5 6
若x >y ,则x