文档内容
专题 05 数据的分析全章复习攻略(4 个概念 3 个应用专练)
4 个概念
【考查题型一】平均数
1.算术平均数
(1)平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.
(2)算术平均数:对于n个数x ,x ,…,x ,则 = (x +x +…+x )就叫做这n个数的算术平均数.
1 2 n 1 2 n
(3)算术平均数是加权平均数的一种特殊情况,加权平均数包含算术平均数,当加权平均数中的权相等
时,就是算术平均数.
【例1】.(2023秋•绥化期末)一组数据2,1,4, ,6的平均值是4,则 的值为
A.3 B.5 C.6 D.7
【变式1-1】.(2023春•金华期末)已知一组数据 , , , 的平均数为6,则另一组数据 , , , 的平均数为
A.5 B.6 C.7 D.不确定
【变式1-2】.(2023春•漳州期末)小聪期末语文、数学、英语三科的平均分为122分,已知语文成绩是
118分,英语成绩是125分,则他的数学成绩是
A.122分 B.123分 C.124分 D.125分
【变式1-3】.(2023春•晋安区期末)若 2023个数 , , 的平均数是2,则 , ,
, 的平均数是 .
2.加权平均数
(1)加权平均数:若n个数x ,x ,x ,…,x 的权分别是w ,w ,w ,…,w ,则x1w1+x2w2+…
1 2 3 n 1 2 3 n
+xnwnw1+w2+…+wn叫做这n个数的加权平均数.
(2)权的表现形式,一种是比的形式,如4:3:2,另一种是百分比的形式,如创新占50%,综合知识占
30%,语言占20%,权的大小直接影响结果.
(3)数据的权能够反映数据的相对“重要程度”,要突出某个数据,只需要给它较大的“权”,权的差
异对结果会产生直接的影响.
(4)对于一组不同权重的数据,加权平均数更能反映数据的真实信息.
【例2】.(2023春•和平区校级期末)为了践行“首都市民卫生健康公约”,某班级举办“七步洗手法”
比赛活动,小明的单项成绩如表所示(各项成绩均按百分制计)
项目 书面测试 实际操作 宣传展示
96 98 96
成绩(分
若按书面测试占 、实际操作占 、宣传展示占 ,计算参赛个人的综合成绩(百分制),则小
明的最后得分是 .
【变式2-1】.(2023春•如皋市期末)学校举行科技创新比赛,各项成绩均按百分制计,再按照创新设计
占 ,现场展示占 计算选手的综合成绩(百分制).小华本次比赛的各项成绩分别是:创新设计
85分,现场展示90分,则他的综合成绩是 分.
【变式2-2】.(2023春•南丹县期末)某校评选先进班集体,从“学习”、“卫生”、“纪律”、“活动
参与”四个方面综合考核打分,各项满分均为100,所占比例如表:
项目 学习 卫生 纪律 活动参与
所占比例某班这四项得分依次为85,90,80,75,则该班四项综合得分为 .
【变式2-3】.(2023春•滨州期末)某校评选先进班集体,从“学习”、“卫生”、“纪律”、“活动参
与”四个方面综合考核打分,各项满分均为100,所占比例如下表:
项目 学习 卫生 纪律 活动参与
所占比例
某班这四项得分依次为83,82,73,80,则该班四项综合得分为 分.
【考查题型二】中位数
(1)中位数:
将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是
这组数据的中位数.
如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.
(2)中位数代表了这组数据值大小的“中点”,不易受极端值影响,但不能充分利用所有数据的信息.
(3)中位数仅与数据的排列位置有关,某些数据的移动对中位数没有影响,中位数可能出现在所给数据
中也可能不在所给的数据中出现,当一组数据中的个别数据变动较大时,可用中位数描述其趋势.
【例3】.(2023春•叙州区期末)为了进一步落实“作业、睡眠、手机、读物、体质”五项管理要求,某
校对学生的睡眠状况进行了调查,经统计得到6个班学生每天的平均睡眠时间(单位:小时)分别为:
8.4,7.5,8.4,8.5,7.5,9.则这组数据的中位数为
A.8.5 B.8.4 C.8.2 D.8
【变式3-1】.(2023春•惠城区校级期末)国家实行“精准扶贫”政策后,农民收入大幅度增加.广东省
某镇所辖5个村去年的年人均收入(单位:万元)为:1.4,1.6,1.8,1.3,1.9,该镇各村去年年人均收入
的中位数是
A.1.3万元 B.1.4万元 C.1.6万元 D.1.9万元
【变式3-2】.(2023春•岳麓区校级期末)2023年5月11日,世界旅游城市联合会和长沙市人民政府共
同主办了世界旅游城市联合会长沙香山旅游峰会,来自世界各地的嘉宾齐聚山水洲城长沙,共话全球旅游
复苏新机遇,助力世界旅游业扬帆再起航,世界旅游城市联合会是由北京发起成立的世界首个以城市为主
体的全球性国际旅游组织,自成立以来,其会员数量已从最初的 58个发展至当前的238个,其中城市会员
159个,机构会员79个,6个分会会员总数332个,这组数据58,238,159,793,32的中位数是
A.58 B.238 C.159 D.79
【变式3-3】(2023春•柯桥区期末)为弘扬传统文化在端午节前夕,某校举行了“诗词竞赛”,某班 15名同学参加了此次竞赛,他们的得分情况如下表所示,则全班15名同学的成绩的中位数是 .
人数 1 6 5 3
70 80 90 100
成绩(分
【考查题型三】众数
(1)一组数据中出现次数最多的数据叫做众数.
(2)求一组数据的众数的方法:找出频数最多的那个数据,若几个数据频数都是最多且相同,此时众数
就是这多个数据.
(3)众数不易受数据中极端值的影响.众数也是数据的一种代表数,反映了一组数据的集中程度,众数
可作为描述一组数据集中趋势的量..
【例4】.(2023春•东港区期末)某班七个兴趣小组人数分别为4,5,4,5,6, ,7,已知这组数据
的平均数是5,则这组数据中的 值和众数分别是
A.5,4 B.5,5 C.4,4 D.4,5
【变式4-1】.(2023春•马尾区校级期末)若某公司25名员工年薪的情况如表,则该公司全体员工年薪
的众数是
年薪 万 30 14 9 6 4 3.5 3
元
员工数 1 2 3 4 5 6 4
人
A.30万元 B.6万元 C.4万元 D.3.5万元
【变式4-2】.(2023春•长顺县期末)我校英语兴趣小组20名学生某日记单词数量如表所示:
单词数量 个 6 8 10 12 14
人数 人 3 4 5 6 2
这些学生某日记单词数量的中位数、众数分别是
A.8,10 B.10,12 C.5,6 D.8,12
【变式4-3】.(2023春•平舆县期末)已知一组数据2,9,6,10, 的众数是 ,其中 又是不等式组
的整数解,则这组数据的中位数是 .
【考查题型四】方差
(1)方差:一组数据中各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差.(2)用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个
结果叫方差,通常用s2来表示,计算公式是:
s2= [(x ﹣ )2+(x ﹣ )2+…+(x ﹣ )2](可简单记忆为“方差等于差方的平均数”)
1 2 n
(3)方差是反映一组数据的波动大小的一个量.方差越大,则平均值的离散程度越大,稳定性也越小;
反之,则它与其平均值的离散程度越小,稳定性越好.
【例5】.(2022秋•台儿庄区期末) , 两名射击运动员进行了相同次数的射击,下列关于他们射击
成绩的平均数和方差的描述中,能说明 成绩较好且更稳定的是
A. 且 B. 且
C. 且 D. 且
【变式5-1】.(2023春•鼓楼区校级期末)甲、乙、丙、丁四支花样滑冰队的人数相同,且平均身高都是
,身高的方差分别是 , , , ,则身高比较整齐的滑冰队是
A.甲 B.乙 C.丙 D.丁
【变式5-2】.(2023春•青秀区校级期末)下表记录了甲、乙、丙、丁四位选手各 10次射击成绩的数据
信息,请你根据表中数据选一人参加比赛,最合适的人选是
选手 甲 乙 丙 丁
9.2 9.3 9.3 9.2
平均数(环
0.035 0.015 0.035 0.015
方差(环
A.甲 B.乙 C.丙 D.丁
【变式5-3】.(2023春•惠城区校级期末)在一次射击比赛中,甲、乙两名运动员 10次射击的平均成绩
都是9环,其中甲成绩的方差为1.21,乙成绩的方差为3.98,由此可知
A.甲比乙的成绩稳定 B.乙比甲的成绩稳定
C.甲、乙两人的成绩一样稳定 D.无法确定谁的成绩更稳定
3 个应用
【考查题型五】平均数、中位数、众数的应用【例6】.(2023春•建华区期末)为了进一步推进学校安全教育,切实增强广大学生的安全防范意识和自
护自救能力,某校举行了安全知识网络竞赛活动,测试满分为100分,为了解八、九年级学生此次竞赛成
绩的情况,分别随机在八、九年级抽取了 20名参赛学生的成绩.已知抽到的八年级的竞赛成绩(单位:
分)如下:80,95,60,80,75,60,95,65,75,70,80,75,85,65,90,70,75,80,85,80.
注:分数在80分以上(不含80分)为优秀.
为了便于分析数据,统计员对八年级的数据进行了整理,得到下表:
成绩等级 分数(单位:分) 学生数
级
级 9
级
级 2
八、九年级所抽竞赛成绩的平均数、中位数、优秀率如表:
年级 平均数 中位数 优秀率
八年级 77
九年级 78.5 82.5
(1)根据题目信息填空: , , ;
(2)八年级小明和九年级小亮的分数都为80分,则两位同学在各自年级的排名 更靠前(按照分数由
高到低的顺序排序);
(3)若九年级共有700人参加竞赛,请估计九年级80分以上(不含80分)的人数.【变式6-1】.(2023春•永城市期末)为了解我国2022年第一季度25个地区第一季度快递业务收入的情
况,收集了这25个地区第一季度快递业务收入(单位:亿元)的数据,并对数据进行了整理、描述和分析,
给出如下信息.
.排在前5位的地区第一季度快递业务收入的数据分别为:534.9,437.0,270.3,187.7,104.0
.其余20个地区第一季度快递业务收入的数据的频数分布表如下:
快递业务收入
频数 6 10 1 3
.第一季度快递业务收入的数据在 这一组的是:20.2,20.4,22.4,24.2,26.1,26.5,28.5,
34.4,39.1,39.8
.排在前5位的地区、其余20个地区、全部25个地区第一季度快递业务收入的数据的平均数、中位数
如下:
前5位的地区 其余20个地区 全部25个地区
平均数 306.8 29.9
中位数 270.3 28.5
根据以上信息,回答下列问题:
(1)表中 的值为 ;
(2)在下面的3个数中,与表中 的值最接近的是 (填写序号);
①30
②85
③150
(3)根据(2)中的数据,预计这25个地区2022年全年快递业务收入约为 亿元.【变式6-2】.(2023春•兖州区期末)“防溺水”是校园安全教育工作的重点之一.某校为确保学生安全
开展了“远离溺水 珍爱生命”的防溺水安全知识竞赛.现从七年级、八年级各随机抽取20名学生的竞赛
成绩(百分制)进行分析,过程如下:
七年级:92,75,82,96,84,90,85,97,85,92,68,100,85,86,95,85,89,90,91,93.
八年级:90,87,93,97,90,84,92,72,100,80,90,91,59,93,87,90,82,91,92,100.
【整理与分析数据】
七年级 0 1 1 8
八年级 1 0 1 5 13
【应用数据】
平均数 众数 中位数
七年级 88 85
八年级 88 91
(1)由上表填空: , , ;
(2)若成绩不低于90分为优秀等次,该校七、八年级共有学生1600人,请你估计两个年级在本次竞赛中
获得优秀等次的共有多少人?
(3)你认为哪个年级的学生对防溺水安全知识掌握的总体水平较好,请从两个不同的角度说明理由.
【变式6-3】.(2023春•南充期末)第31届大学生夏季运动会将于2023年7月28日在成都开幕,为更好
地了解大运会,某中学在七、八年级举行了“迎大运知识竞赛”活动,现从七、八年级各随机抽取50名学生的竞赛成绩,整理如下:(得分用 表示,共分成四组: ; ; ;
. 八年级50名学生成绩数据中,落在 组中的成绩分别是:91,94,94,93,92,90,
93,94,91,90,94,91,94,93,92.
根据以上信息,解答下列问题:
七、八年级抽取的学生竞赛成绩统计表
班级 平均数 中位数 众数
七年级 91 92 95
八年级 91 96
(1)求出统计图中 的值,以及表格中 的值;
(2)该校八年级共800人参加了此次竞赛,估计参加此次竞赛成绩优秀 的八年级学生有多少人?
(3)根据以上数据分析,你认为七、八年级哪个年级竞赛成绩较好?请说明理由.
【考查题型六】方差的应用【例7】.(2023春•泸水市校级期末)我市某中学举办“网络安全知识答题竞赛”,初、高中部根据初赛
成绩各选出5名选手组成初中代表队和高中代表队参加学校决赛,两个队各选出的5名选手的决赛成绩如
图所示.
平均分(分 中位数(分 众数(分 方差(分
初中部 85
高中部 85 100 160
(1)根据图示计算出 、 、 的值;
(2)结合两队成绩的平均数和中位数进行分析,哪个队的决赛成绩较好?
(3)计算初中代表队决赛成绩的方差 ,并判断哪一个代表队选手成绩较为稳定.
【变式7-1】.(2023春•雨花区校级期末)在4月24日“中国航天日”来临之际,某校开展以“航天点
亮梦想”为主题的知识竞赛.七、八年级根据初赛成绩各选出6名选手组成七年级代表队和八年级代表队
参加学校决赛,两队各选出的6名选手的决赛成绩如下所示:七年级:65,80,80,90,95,100
八年级:75,80,85,85,90,95
平均分(分 中位数(分 众数(分 方差(分
七年级 85
八年级 85 85
(1)以上成绩统计分析表如表所示:则表中 , , .
(2)结合表中的各个统计量进行分析,你觉得哪个队的决赛成绩较好?
【变式7-2】.(2023春•陵城区期末)某校举办“十佳歌手”演唱比赛,五位评委进行现场打分,将甲、
乙、丙三位选手得分数据整理成下列统计图.
根据以上信息,回答下列问题:(1)完成表格;
平均数 分 中位数 分 方差 分
甲 8.8 ① 0.56
乙 8.8 9 ②
丙 ③ 8 0.96
(2)从三位选手中选一位参加市级比赛,你认为选谁更合适,请说明理由;
(3)在演唱比赛中,往往在所有评委给出的分数中,去掉一个最高分和一个最低分,然后计算余下分数
的平均分.如果去掉一个最高分和一个最低分之后甲的方差记为 ,则 0.56.(填“ ”或“ ”
或“ ”
【变式7-3】.(2023春•井研县期末)某校举办国学知识竞赛,设定满分 10分,学生得分均为整数.在
初赛中,甲、乙两组(每组10人)学生成绩如下(单位:分)
甲组:5,6,6,6,6,6,7,9,9,10.乙组:5,6,6,6,7,7,7,7,9,10.
组别 平均数 中位数 众数 方差
甲组 7 6 2.6
乙组 7
(1)以上成绩统计分析表中 , , ;
(2)小明同学说:“这次竞赛我得了7分,在我们小组中属中游略偏上!”观察上面表格判断,小明可能
是 组的学生;
(3)从平均数和方差看,若从甲、乙两组学生中选择一个成绩较为稳定的小组参加决赛,应选哪个组?
并说明理由.
【变式7-4】.(2023春•浦北县期末)近年来,未成年人遭电信网络诈骗的案例呈现增长趋势,为了提升
学生防范电信网络诈骗安全意识,翰林中学面对八年级共480名同学举行了防范电信网络诈骗安全知识竞
赛(满分100分).现随机抽取八(2)、八(3)两班各15名同学的测试成绩进行整理分析,过程如下:
【收集数据】
八(2)班15名学生的测试成绩:78,83,89,97,98,85,100,94,87,90,93,92,99,95,100.
八(3)班15名学生的测试成绩中, 的成绩:91,92,94,90,93.【整理数据】:
班级
八(2)班 1 1 3 4 6
八(3)班 1 2 3 5 4
(1)根据以上信息,可以求出八(2)班成绩的众数为 ,八(3)班成绩的中位数为 ;
(2)若规定测试成绩在92分及其以上为优秀,请估计本次参加防范电信网络诈骗安全知识竞赛的480名
学生中成绩为优秀的学生共有多少人?
(3)根据以上数据,若八(3)班平均分为90分,方差为50.2,你认为哪个班的学生掌握防范电信网络诈
骗安全知识的整体水平较好?请说明理由(写出一个理由即可).
【变式7-5】.(2023春•泌阳县期末)为进一步宣传防溺水知识,提高学生防溺水的能力,某校组织七、
八年级各200名学生进行防溺水知识竞赛(满分100分).现分别在七、八年级中各随机抽取10名学生的
测试成绩 (单位:分)进行统计、整理如下:
七年级:86,90,79,84,74,93,76,81,90,87.
八年级:85,76,90,81,84,92,81,84,83,84.
七八年级测试成绩频数统计表
七年级 3 4 3
八年级 1 7七八年级测试成绩分析统计表
平均数 中位数 众数 方差
七年级 84 90 36.4
八年级 84 84 18.4
根据以上信息,解答下列问题:
(1) , , ;
(2)按学生的实际成绩,你认为哪个年级的学生掌握防溺水知识的总体水平较好?请说明理由.
(3)如果把 的记为“优秀”,把 的记为“合格”,学校规定两项成绩按 计算.通过计
算比较哪个年级得分较高?
【考查题型七】用样本估计总体的思想的应用
用样本估计总体是统计的基本思想.
1、用样本的频率分布估计总体分布:
从一个总体得到一个包含大量数据的样本,我们很难从一个个数字中直接看出样本所包含的信息.这时,
我们用频率分布直方图来表示相应样本的频率分布,从而去估计总体的分布情况.
2、用样本的数字特征估计总体的数字特征(主要数据有众数、中位数、平均数、标准差与方差 ).
一般来说,用样本去估计总体时,样本越具有代表性、容量越大,这时对总体的估计也就越精确.
【例8】.(2023春•太仓市期末)某校为了解本校学生校外体育活动情况,随机抽取部分学生进行问卷调
查(每位参与调查的学生均要完成两项调查),并对数据进行了收集、整理与描述,形成了如下调查报告:请根据以上调查报告,解答下列问题:
(1)参与本次抽样调查的学生有 人,这些学生中选择“跑步”的学生有 人;
(2)估计该校1200名学生中,平均每周校外体育锻炼时间“不少于6小时”的人数;
(3)请结合以上两项调查数据分别写出一条你获取的信息.
【变式8-1】.(2023春•天河区期末)八年级的同学们即将步入初三,某校的一个主题班会小组为了解八
年级900名同学对初三学习的第一印象,用问卷开展随机调查,共有50名同学参加了抽样调查(每人只能
选一项),小组将所得数据统计如图所示,请你帮忙解决问题:
(1)将统计图补充完整;并估计八年级全体同学对初三学习第一印象是“忧喜交加”的人数;
(2)结合统计数据,写一条发现的结论,并给出适当的建议.【变式8-2】.(2023春•句容市期末)为了了解2023年某地区4万名高中生、初中生、小学生3分钟跳绳
成绩情况,从这三类学生群体中各抽取了 的学生进行检测.整理样本数据,并结合2019年抽样结果,
得到下列统计图.(1)本次检测抽取高中生、初中生、小学生共 名,其中初中生 名;
(2)根据抽样的结果,估计2023年该地区4万名学生3分钟跳绳成绩合格的高中生人数为 名;
(3)比较2019年与2023年抽样学生3分钟跳绳成绩合格率情况,写出一条正确的结论.
【变式8-3】.(2023春•忻州期末)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林
区某种树木的总材积量,随机选取了10棵这种树本,测量每棵树的根部横截面积(单位: 和材积量
(单位: ,得到如下数据:样本号 1 2 3 4 5 6 7 8 9 10
根部横截面 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06
积
材积量 0.25 0.40 0.22 0.64 0.61 0.36 0.46 0.42 0.40
(1)估计该林区一棵这种树木平均根部横截面积与平均材积量.
(2)现测量了该林区部分这种树木的根部横截面积,经过测算得到这种树木的根部横截面积总和为
.已知树木的材积量与其根部横截面积近似成正比.利用以上数据估计该林区这种树木的总材积量.