文档内容
第 3 讲 统计与成对数据的分析
[考情分析] 高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总
体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.
考点一 统计图表
核心提炼
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×.
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以
小长方形底边中点的横坐标之和.
例1 (1)(多选)(2022·湖北八市联考)某中学举行党史知识竞赛,对全校参赛的 1 000名学生
的得分情况进行了统计,把得分数据按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5
组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是( )
A.图中的x值为0.020
B.这组数据的极差为50
C.得分在80分及以上的人数为400
D.这组数据的平均数的估计值为77
(2)(多选)(2022·张家口模拟)2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会
期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣
言》).承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方计划建立“21
世纪20年代强化气候行动工作组”,推动两国气候变化合作和多边进程.为响应《宣言》
要求,某地区统计了2020年该地区一次能源消费结构比例,并规划了2030年一次能源消费结构比例,如图所示,
经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区( )
A.2030年煤的消费量相对2020年减少了
B.2030年天然气的消费量是2020年的5倍
C.2030年石油的消费量相对2020年不变
D.2030年水、核、风能的消费量是2020年的7.5倍
易错提醒 (1)对于给出的统计图表,一定要结合问题背景理解图表意义.
(2)频率分布直方图中纵坐标不要误以为是频率.
跟踪演练1 (1)(多选)(2022·潍坊模拟)某市共青团委统计了甲、乙两名同学近十期“青年大
学习”答题得分情况,整理成如图所示的茎叶图.则下列说法中正确的是( )
A.甲得分的30%分位数是31
B.乙得分的众数是48
C.甲得分的中位数小于乙得分的中位数
D.甲得分的极差等于乙得分的极差
(2)(多选)(2022·广东六校联考)2021年1月11日,国家统计局发布2020年全国居民消费价格
指数(CPI)相关数据,指出2020年较好地实现了“居民消费价格涨幅3.5%左右”的物价调控
目标.2020年全国居民消费价格涨跌幅如折线图所示,则( )
A.从环比看,CPI由2020年11月份的环比下降0.6%在12月份转为环比上涨0.7%
B.2020年1月份CPI同比增长最多C.2020年CPI环比上涨的月份数比下跌的月份数多
D.2020年全年CPI同比平均比2019年上涨约2.5%
考点二 回归分析
核心提炼
求经验回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(2)计算出,,a,b.
(3)写出经验回归方程.
例2 (2022·湖南六校联考)为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台
决定为脱贫乡村的特色水果开设直播带货专场.该特色水果的热卖黄金时段为2022年7月
10日至9月10日,为了解直播的效果和关注度,该电商平台统计了已直播的2022年7月10
日至7月14日时段中的相关数据,这5天的第x天到该电商平台专营店购物的人数y(单位:
万人)的数据如下表:
日期 7月10日 7月11日 7月12日 7月13日 7月14日
第x天 1 2 3 4 5
人数y(单位:万人) 75 84 93 98 100
(1)依据表中的统计数据,请判断该电商平台直播的第x天与到该电商平台专营店购物的人
数y(单位:万人)是否具有较高的线性相关程度?(注:若0.3<|r|<0.75,则线性相关程度一般,
若|r|>0.75,则线性相关程度较高,计算r时精确度为0.01)
(2)求购买人数y与直播的第x天的经验回归方程;用样本估计总体,请预测从 2022年7月
10日起的第38天到该专营店购物的人数(单位:万人).
附:(y-)2=434,(x-)(y-)=64,≈65.879.
i i i
样本相关系数r=,
经验回归方程的斜率b=,
截距a=-b.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
易错提醒 (1)样本点不一定在经验回归直线上,但点(,)一定在经验回归直线上.
(2)求b时,灵活选择公式,注意公式的推导和记忆.
(3)利用样本相关系数判断相关性强弱时,看|r|的大小,而不是r的大小.(4)区分样本相关系数r与决定系数R2.
(5)通过经验回归方程求的都是估计值,而不是真实值.
跟踪演练2 (1)(多选)(2022·汕头模拟)如图所示,5个(x,y)数据,去掉D(3,10)后,下列说
法正确的是( )
A.样本相关系数r变大
B.残差平方和变大
C.决定系数R2变小
D.解释变量x与响应变量y的相关性变强
(2)(多选)(2022·重庆模拟)某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数
据如下表所示:
x 10 15 20 25 30
y 11 10 8 6 5
根据表中的数据可得经验回归方程y=bx+14.4,则下列正确的是( )
A.样本相关系数r>0
B.b=-0.32
C.若该产品价格为35元/kg,则日需求量大约为3.2 kg
D.第四个样本点对应的残差为-0.4
考点三 独立性检验
核心提炼
独立性检验的一般步骤
(1)根据样本数据列2×2列联表.
(2)根据公式χ2=,计算χ2的值.
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H 成立(两类变量
0
相互独立)的概率越小,H 不成立的概率越大.
0
例3 (2022·济宁模拟)为提高教育教学质量,越来越多的高中学校采用寄宿制的封闭管理模
式.某校对高一新生是否适应寄宿生活做调查,从高一新生中随机抽取了100人,其中男生
占总人数的40%,且只有20%的男生表示自己不适应寄宿生活,女生中不适应寄宿生活的人数占总人数的32%.学校为了考查学生对寄宿生活适应与否是否与性别有关,构建了如下
2×2列联表:
不适应寄宿生活 适应寄宿生活 合计
男生
女生
合计
(1)请将2×2列联表补充完整,并依据小概率值α=0.010的独立性检验,是否可以推断适应
寄宿生活与否与性别有关;
(2)从男生中以“是否适应寄宿生活”为标准采用分层随机抽样的方法抽取10人,再从这10
人中随机抽取2人,若所选2名学生中的“不适应寄宿生活”人数为X,求随机变量X的分
布列及均值.
附:χ2=,其中n=a+b+c+d.
α 0.025 0.010 0.001
x 5.024 6.635 10.828
α
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
易错提醒 (1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得
无关的可能性.
(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能
性为0.01.
跟踪演练3 (2022·河北联考)《2021新锐品牌数字化运营白皮书》中,我国提出了新锐品牌
的概念,全称是国货新锐品牌.对这个名称进行拆解:国货、新、锐.新有两个层面,一是
针对企业本身,指2011年后成立的品牌.二是针对消费者本身,开拓了新的消费场景(需
求),形成了细分化的品类.锐:是在短期内实现大大高于传统品牌的爆发式增长,并且占
据了一定的消费者心智.如图是11月份中国某信息网发布的我国A市2021年上半年新锐品
牌人群用户(新锐品牌人群,指在指定周期内浏览新锐品牌相关内容以及商品详情页的人群)
性别分析数据.A市从购买家电类新锐品牌人群中随机调查了100位男性顾客和100位女性
顾客,统计出每位顾客购买家电消费金额,根据这些数据得到如图所示的频数分布表:[0, (100,1 (1 000,5 (5 000,10 (10 000,+
消费金额(元)
100] 000] 000] 000] ∞)
女性顾客人数 50 30 10 6 4
男性顾客人数 20 40 24 10 6
(1)若以我国A市2021年上半年新锐品牌人群用户性别分析数据作为A市抽取新锐品牌人群
性别概率,从A市新锐品牌人群中随机抽取四人,X为四人中男性的人数,求X的概率分布
列和均值;
(2)根据A市统计购买家电消费金额数据频数分布表,完成下列2×2列联表,并依据小概率
值α=0.010的独立性检验,分析购买家电类新锐品牌人群消费金额千元以上是否与性别有
关?
不超千元 千元以上 合计
女性顾客
男性顾客
合计
附:χ2=,n=a+b+c+d.
α 0.050 0.010 0.001
x 3.841 6.635 10.828
α
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________