文档内容
第 20 章 数据的分析 章节复习卷(10 个知识点+50
题练习)
知识点
知识点1.调查收集数据的过程与方法
(1)在统计调查中,我们利用调查问卷收集数据,利用表格整理数据,利用统计图描述数
据,通过分析表和图来了解情况.
(2)统计图通常有条形统计图,扇形统计图,折线统计图.
(3)设计调查问卷分以下三步:①确定调查目的;②选择调查对象;③设计调查问题.
(4)统计调查的一般过程:
①问卷调查法﹣﹣﹣﹣﹣收集数据;
②列统计表﹣﹣﹣﹣﹣整理数据;
③画统计图﹣﹣﹣﹣﹣描述数据.
知识点2.算术平均数
(1)平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的
一项指标.
(2)算术平均数:对于n个数x ,x ,…,x ,则 = (x +x +…+x )就叫做这n个数的
1 2 n 1 2 n
算术平均数.
(3)算术平均数是加权平均数的一种特殊情况,加权平均数包含算术平均数,当加权平均
数中的权相等时,就是算术平均数.
知识点3.加权平均数
(1)加权平均数:若 n个数x ,x ,x ,…,x 的权分别是w ,w ,w ,…,w ,则
1 2 3 n 1 2 3 n
x1w1+x2w2+…+xnwnw1+w2+…+wn叫做这n个数的加权平均数.
(2)权的表现形式,一种是比的形式,如4:3:2,另一种是百分比的形式,如创新占
50%,综合知识占30%,语言占20%,权的大小直接影响结果.
(3)数据的权能够反映数据的相对“重要程度”,要突出某个数据,只需要给它较大的
“权”,权的差异对结果会产生直接的影响.
(4)对于一组不同权重的数据,加权平均数更能反映数据的真实信息.
知识点4.计算器-平均数(1)如果是普通计算器,那么只能把所有的数字相加,然后除以数字的个数.
(2)如果是科学记算器,那么可以用如下方法:
①调整计算器的模式为STAT模式.
②依次输入数据,每次输入数据后按DATA键确认数据的输入.
③输入完毕后,按x¯键,即可获得平均数了.
(3)由于计算器的型号不同,可以按照说明书中的方法进行操作.
知识点5.中位数
(1)中位数:
将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中
间位置的数就是这组数据的中位数.
如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.
(2)中位数代表了这组数据值大小的“中点”,不易受极端值影响,但不能充分利用所有
数据的信息.
(3)中位数仅与数据的排列位置有关,某些数据的移动对中位数没有影响,中位数可能出
现在所给数据中也可能不在所给的数据中出现,当一组数据中的个别数据变动较大时,可
用中位数描述其趋势.
知识点6.众数
(1)一组数据中出现次数最多的数据叫做众数.
(2)求一组数据的众数的方法:找出频数最多的那个数据,若几个数据频数都是最多且相
同,此时众数就是这多个数据.
(3)众数不易受数据中极端值的影响.众数也是数据的一种代表数,反映了一组数据的集
中程度,众数可作为描述一组数据集中趋势的量..
知识点7.极差
(1)极差是指一组数据中最大数据与最小数据的差.
极差=最大值﹣最小值.
(2)极差是刻画数据离散程度的一个统计量.它只能反映数据的波动范围,不能衡量每个
数据的变化情况.
(3)极差的优势在于计算简单,但它受极端值的影响较大.
知识点8.方差
(1)方差:一组数据中各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差.
(2)用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个结果叫方差,通常用s2来表示,计算公式是:
s2= [(x ﹣ )2+(x ﹣ )2+…+(x ﹣ )2](可简单记忆为“方差等于差方的平均
1 2 n
数”)
(3)方差是反映一组数据的波动大小的一个量.方差越大,则平均值的离散程度越大,稳
定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.
知识点9.计算器-标准差与方差
由于不同的计算器,其操作不完全相同,可以根据计算器的说明书进行操作.
以如图的计算器为例说明:
首先,按2ndf键,再按on/c(清零)键,即进入统计状态,右上角有stat显示.
接着,进入数据输入存
储状态,输入一个数据后按M+键,即对数据进行储存,可显示1,表示输入了第一个数据,
依次再输入,
显示2,为第二个数据.数据输入完成后,就可进行计算,按2ndf,再按RM,即显示为平
均值,其他同此.
先按2ndf键再按其他键,表示选择的是该键上方的功能.
知识点10.统计量的选择
(1)一般而言,一组数据的极差、方差或标准差越小,这组数据就越稳定.但这并不是绝
对的,有时多数数据相对集中,整体波动水平较小,但个别数据的偏离仍可能极大地影响
极差、方差或标准差的值.从而导致这些量度数值较大,因此在实际应用中应根据具体问
题情景进行具体分析,选用适当的量度刻画数据的波动情况,一般来说,只有在两组数据
的平均数相等或比较接近时,才用极差、方差或标准差来比较两组数据的波动大小.
(2)平均数、众数、中位数和极差、方差在描述数据时的区别:①数据的平均数、众数、
中位数是描述一组数据集中趋势的特征量,极差、方差是衡量一组数据偏离其平均数的大
小(即波动大小)的特征数,描述了数据的离散程度.②极差和方差的不同点:极差表示
一组数据波动范围的大小,一组数据极差越大,则它的波动范围越大;方差和标准差反映
了一组数据与其平均值的离散程度的大小.方差(或标准差)越大,数据的历算程度越大
稳定性越小;反之,则离散程度越小,稳定性越好
练习卷
一.调查收集数据的过程与方法(共6小题)
1.(2023春•梁平区期末)某商场为了解用户最喜欢的家用电器,设计了如下尚不完整的
调查问卷:
该商场准备在“①制冷电器,②微波炉,③冰箱,④电饭锅,⑤空调,⑥厨房电器”中选取四个作为问卷问题的备选项目,你认为最合理的是
A.①②③④ B.①③⑤⑥ C.③④⑤⑥ D.②③④⑤
2.(2022春•广平县校级月考)已知某校共有七,八,九三个年级,每个年级有4个班,
每个班的人数在 之间,为了解该校学生家庭的教育消费情况,现设计了如下的调查
方案.
方案一:给全校每个班都发一份问卷,由班长填写完成;
方案二:把问卷发送到随机抽取的七年级某个班的家长微信群里,通过网络提交完成:
方案三:给每个班学号分别为1,5,10,15,20的同学各发一份问卷,填写完成.以上哪
种调查方案能较好的获得该校学生家庭的教育消费情况,并说明其他两个调查方案的不足
之处.
3.(2024春•邢台期中)学校召开运动会,30名学生要统一购买运动鞋,需要的数据是
A.每个学生鞋的码数 B.一部分学生鞋的码数
C.每个学生的身高 D.每个学生喜欢的牌子
4.(2024春•建邺区校级期中)为了了解某校九年级 1200学生的体重情况,
请你运用所学的统计知识,将解决上述问题要经历的几个重要步骤进行排序.
①收集数据;②设计调查问卷;③用样本估计总体;④整理数据;⑤分析数
据.则正确的排序为 .(填序号)
5.下面是某同学对全班同学在家完成数学作业的方式与用时进行的调查,他设计了一个调
查问卷,这一问卷设计的是否合理?你会做怎样的调整?
调查问卷:______年 ______月 ______日
姓名 完成方式 完成时间
:独立完 :抄作业
成
6.(2022•北京)甲工厂将生产的Ⅰ号、Ⅱ号两种产品共打包成 5个不同的包裹,编号分
别为 , , , , ,每个包裹的重量及包裹中Ⅰ号、Ⅱ号产品的重量如下:包裹编号 Ⅰ号产品重量 Ⅱ号产品重量 包裹的重量
吨 吨 吨
5 1 6
3 2 5
2 3 5
4 3 7
3 5 8
甲工厂准备用一辆载重不超过19.5吨的货车将部分包裹一次运送到乙工厂.
(1)如果装运的Ⅰ号产品不少于9吨,且不多于11吨,写出一种满足条件的装运方案
(写出要装运包裹的编号);
(2)如果装运的Ⅰ号产品不少于9吨,且不多于11吨,同时装运的Ⅱ号产品最多,写出
满足条件的装运方案 (写出要装运包裹的编号).
二.算术平均数(共6小题)
7.(2023•肥西县一模) 、 、 、 、 五名学生在一次语文测验中的平均成绩是
80分,而 、 、 三同学的平均成绩是78分,那么下列说法一定正确的是
A. 、 的成绩比其他三个都好
B. 、 两人的平均成绩是82分
C.最高分得主不是 、 、 、
D. 、 中至少有一个成绩不少于83分
8.(2023春•嵊州市校级期中)已知一组数据5,4, ,3,8的平均数为5,则 的值是
.
9.(2023春•永顺县期末)已知一组数据 , , , , 的平均数为2,则另一组
新数据 , , , , 的平均数是 .
10.(2024春•新昌县期中)已知一组数据是8,4,7, ,10,其平均数是7.4,则 的
值为
A.7.4 B.8 C.9 D.10
11.(2023春•思明区期末)某校教师为了对学生零花钱的使用进行教育指导,对全班 50
名学生每人一周内的零花钱数额进行了调查统计,并绘制了下表:零花钱数额 元 5 10 15 20
学生人数 15 20 5
(1)求 的值;
(2)求这50名学生一周内的零花钱数额的平均数;
(3)若老师随机抽查一名学生,询问其一周内的零花钱数额,得到的回答最可能是几元?
简要说明理由.
12.(2024春•泰兴市期中)定义:对于两个正数 和 , , 的算术平均数 ,
, 的调和平均数 .
【观察归纳】(用“ ”、“ ”或“ ”填空)
①若 , ,则 ;②若 , ,则 ;
③若 , ,则 ;
【猜想验证】
①猜想:对于两个正数 和 ,则 ;(用“ ”、“ ”、“ ”、“ ”
或“ ”填空)
②请验证你的猜想.
【拓展应用】
甲、乙两港口分别位于长江的上、下游,相距 ,若一艘游轮顺流航行的速度为 ,
逆流航行速度为 ,比较该游轮在静水中的速度和往返两港口的平均速度
的大小.
三.加权平均数(共6小题)
13.(2024•杭州模拟)我国古代科举制度始于隋成于唐,兴盛于明.明代会试分南卷、北
卷、中卷,按 的比例录取,若某年会试录取人数为100,则中卷录取人数为
A.10 B.35 C.55 D.75
14.(2024春•如皋市期中)某学校规定学生的音乐成绩由三项组成:乐理知识占 ,
演唱技能占 ,乐器演奏占 ,该校小颖同学乐理知识、演唱技能、乐器演奏三项的得分依次是:95分,90分,85分,则小颖同学的音乐成绩为 分.
15.(2024春•南宁期中)小明参加“强国有我”主题演讲比赛,其演讲形象、内容、效
果三项的成绩分别是70分、90分、80分.若将三项得分依次按 的比例确定最终成
绩,则小明的最终比赛成绩为 分.
16.(2024•宣化区一模)某校八年级学生某科目期末评价成绩是由完成作业、单元检测、
期末考试三项成绩构成的,如果期末评价成绩80分以上(含80分),则评为“优秀”.
下面表中是小张和小王两位同学的成绩记录:
完成作业 单元测试 期末考试
小张 70 90 80
小王 60 75
(1)若按三项成绩的平均分记为期末评价成绩,请计算小张的期末评价成绩;
(2)若按完成作业、单元检测、期末考试三项成绩按 的权重来确定期末评价成绩.
①请计算小张的期末评价成绩为多少分?
②小王在期末(期末成绩为整数)应该最少考多少分才能达到优秀?
17.(2023春•南皮县期中)据物业公司统计,某小区一月份1日至5日每天用水量情况如
图所示.那么这5天的平均用水量是
A.5吨 B.4吨 C.3.5吨 D.3吨
18.(2024春•仓山区校级期中)某校为了了解八年级学生一天做数学作业所用时间的情
况,抽取了50名学生进行了调查.如表反映了说抽取的50名学生某一天做数学作业所用
时间的情况.
所用时间 组中值 人数
5 4
8
20
3545 5
55 3
(1) , , .
(2)利用组中值求这50名学生在这一天做数学作业的平均时间.
(3)估计该校八年级学生一天做数学作业所用的平均时间.
四.计算器-平均数(共2小题)
19.(昆明期末)某同学用计算器求20个数据的平均数时,错将一个数据75输入为15,
那么由此求出的平均数与实际平均数的差是 .
20.(宁都县期末)某同学使用计算器求30个数据的平均数时,错将其中一个数据105输
成了15,则由此求出的平均数与实际平均数的差是多少?
五.中位数(共6小题)
21.(2023春•海阳市期中)射击比赛中,某队员10次射击成绩如图所示,则该队员成绩
(单位:环)的中位数为
A.2 B.8 C.8.5 D.9
22.(2024春•洞头区期中)某班五个兴趣小组人数分别为4,5, ,6,7,已知这组数
据的平均数是5,则这组数据的中位数是 .
23.(2024春•北仑区校级期中)为弘扬传统文化,某校在读书节举行了“诗词竞赛”,
某班20名同学参加了此次竞赛,他们的得分情况如下表所示,则全班20名同学的成绩的
中位数是 .
人数 2 7 7 4
70 80 90 100
成绩(分
24.(2024春•洞头区期中)为了推进全民阅读,共创“书香洞头”,学校开展了“阅读
月”活动,活动后随机抽取了50名学生的一个月课外阅读时间,并整理数据如表:
一个月课外阅读时间(小时) 10 11 12 13 146 8 11 15 10
人数(人
(1)求出上述样本数据的平均数和中位数.
(2)若该校学生人数为800人,请估计一个月课外阅读时间达到12小时及以上的学生约
有多少人.
25.(2024•甘井子区校级一模)已知一组数据如下:12,15,19,8,6,10,则这组数据
的中位数为
A. B.13.5 C.11 D.9
26.(2024春•鼓楼区校级期中)每年6月5日为世界环境日,某中学为增强学生的环保意
识,开展了关于保护环境的知识竞赛,经过班级推荐,共有 50名学生参赛,其成绩统计如
下:
成绩(单位:
分)
人数(单位: 2 8 12 16 12
人)
其中 分的成绩如下
81 81 82 82 83 84 84 84 85 85 86 87 87 88 88 90
请回答:
(1)直接写出此次竞赛成绩的中位数;
(2)根据表格估计此次竞赛成绩的平均数;
(3)根据数据分析,请写出一条你认为正确的结论.
六.众数(共6小题)
27.(2023春•上城区校级期中)数据 ,0,2,2,3,3,3的众数是 .
28.(2024春•余姚市期中)已知一组数据2,0,2,4, 则这组数据的中位数和众数分
别是
A.2和2 B.2和4 C.4和4 D.2和
29.(2023春•马尾区校级期末)若某公司25名员工年薪的情况如表,则该公司全体员工
年薪的众数是年薪 万 30 14 9 6 4 3.5 3
元
员工数 1 2 3 4 5 6 4
人
A.30万元 B.6万元 C.4万元 D.3.5万元
30.(2023春•奉化区校级期中)在一次数学测验中,五位同学的成绩分别是 90、 、
80、85、85,若这五位同学成绩的众数与平均数恰好相等,则他们成绩的中位数是 .
31.(2023春•嵊州市校级期中)为进一步提升校园阅读氛围,在第25个“世界读书日”
之际,学校开展了“读书四月(单位:小时)的样本数据,参与统计人数为 50人,结果统
计如下:
四月课外阅读 9 10 11 12 13
时间(小时)
人数 7 16 10 9 8
求出上述样本数据的众数、中位数及平均数;
32.(2023春•大荔县期末)2022年3月25日,教育部印发《义务教育课程方案和课程标
准 年版)》,优化了课程设置,将劳动从综合实践活动课程中独立出来.某校为了
解该校学生一周的课外劳动情况,随机抽取部分学生调查了他们一周的课外劳动时间,将
数据进行整理并制成如一统计图.
请根据图中提供的信息,解答下列的问题:
(1)求图1中的 ,本次调查数据的中位数是 ,本次调查数据的众数是 ;
(2)若该校共有2000名学生,请根据统计数据,估计该校学生一周的课外劳动时间不小
于 的人数.七.极差(共4小题)
33.(2023春•丹江口市期末)10名同学周末体育户外运动时间的统计结果如下表,以下
说法错误的是
户外运动时间(小 2.5 3 3.5 4
时)
人数 1 4 3 2
A.极差是1.5 B.平均数是3.25 C.众数是3 D.中位数是3.25
34.(2023春•兰山区期末)在八年级某次体育课的排球垫球测试中,其中8位同学的垫
球数量(单位:个)分别是20,25,35,40,42,45,45,50,关于这组数据,下列说法
不正确的是
A.中位数是41 B.平均数是37.5
C.众数是45 D.最大值与最小值的差是30
35.(2023•甘州区校级开学)如果一组数据 ,0,1,3, 的极差是7,那么 的值是
.
36.(2023春•确山县期末)为了让师生更规范地操作教室里的一体机设备,学校信息中
心制作了“教室一体机设备培训“视频,并在视频课时间进行播放.结束后为了解初一、
初二各班一体机管理员对设备操作知识的掌握程度,信息中心对他们进行了相关的知识测
试现从初一、初二年级各随机抽取了15名一体机管理员的成绩,得分用 表示,共分成4
组: , , , ,对得分进行整理分析,
给出了下面部分信息:
初一年级一体机管理员的测试成绩在 组中的数据为:85,81,88;
初二年级一体机管理员的测试成绩:71,76,81,82,83,86,86,88,89,90,93,
95,100,100,100;
成绩统计表如表:(注 极差为样本中最大数据与最小数据差)
年级 平均数 中位数 最高分 众数 极差
初一 88 98 98 32
初二 88 88 100
(1) , , ;(2)通过以上数据分析,你认为哪个年级的一体机管理员对一体机设备操作的知识掌握更
好?并说明理由(写出一条理由即可).
八.方差(共6小题)
37.(2023春•上城区校级期中)数据1,3,2,5,4的方差为
A.1 B.2 C.3 D.4
38.(2024•长汀县二模)已知一组数据 ,2,3,4, 的众数为3,则方差为 .
39.(2024•江阳区模拟)以下是小李记录的自己一周内每天校外锻炼的时间(单位:分
钟),62,68,70,62,70,70,88,则下列关于小李该周每天校外锻炼时间的描述,正
确的是
A.众数为62分钟 B.中位数为62分钟
C.平均数为70分钟 D.方差为0
40.(2024•郑州模拟)二仙坡是黄土高原“中国苹果优势产业带”的核心区,培育的
12000多亩绿色果品基地.该基地引进培育了甲、乙、丙、丁四个品种的苹果树.为了了
解每种苹果树的产量情况,从每个品种中随机抽取10棵进行采摘,经统计每种苹果树10
棵产量的平均数 和方差 如下表:
甲 乙 丙 丁
194 196 188 191
平均数
9.2 8.6 8.9 9.7
方差
若从这四个品种中选出一种产量既高又稳定的苹果树进行种植,应选的品种为 .
41.(2024•莲池区一模)在一次体操比赛中,6个裁判员对某运动员的打分数据(动作完
成分)分别为:8.8,9.5,9.6,9.6,9.7,9.8对打分数据有以下两种处理方式.
方式一:不去掉任何数据,用6个原始数据 方式二:去掉一个最高分和一个最低分,用
进行统计 剩余的4个数据进行统计
平均数 中位数 方差 平均数 中位数 方差
9.5 9.6
(方差(1)分别求上述表格中 , , 的值;
(2)你认为把哪种方式统计出的平均分作为该运动员的最终得分更合理?写出你的判断并
说明理由.
42.(2024•保康县模拟)“惜餐为荣,敛物为耻.”为了解落实“光盘行动”的情况,某
校调研了七、八年级部分班级某一天的厨余垃圾质量,并作出如下统计分析.
【收集数据】七、八年级各随机抽取10个班厨余垃圾质量的数据(单位: .
【整理数据】进行整理和分析(厨余垃圾质量用 表示,共分为四个等级: . ;
; ; . .
【描述数据】下面给出了部分信息,绘制如下统计图:
七年级10个班厨余垃圾质量:0.6,0.7,0.7,0.7,1.3,1.3,1.6,1.7,2,2.4.
八年级10个班厨余垃圾质量中 等级包含的所有数据为:1.1,1.1,1.1,1.3.
【分析数据】七、八年级抽取的班级厨余垃圾质量统计表如下:
年级 平均数 中位数 众数 方差 等级所占百分比
七年级 1.3 1.2 0.352
八年级 1.3 1.1 0.24
根据以上信息,解答下列问题:
(1)填空: , , ;
(2)该校八年级共有30个班,估计八年级这一天厨余垃圾质量符合 等级的班级数;
(3)根据以上信息,请你任选一个统计量,分析在此次“光盘行动”中,该校七、八年级
的哪个年级落实得更好?并说明理由.
九.计算器-标准差与方差(共2小题)
43.(泰州)某工厂为了选拔1名车工参加加工直径为 的精密零件的技术比赛,随
机抽取甲、乙两名车工加工的5个零件,现测得的结果如下表,请你用计算器比较 、的大小
甲 10.05 10.02 9.97 9.96 10
乙 10 10.01 10.02 9.97 10
A. B. C. D.
44.用计算器求方差的一般步骤是:
①使计算器进入 状态;
②依次输入各数据;
③按求 的功能键,即可得出结果.
一十.统计量的选择(共6小题)
45.(2024春•鼓楼区校级期中)八年级某班正在筹备班班有歌声比赛,班长对全班同学
进行了问卷调查.他将三首备选歌曲编号,让每位同学选取其中一首.下列调查数据中你
认为最值得关注的是
A.中位数 B.平均数 C.众数 D.加权平均数
46.(2023春•荣昌区期末)在平均数、中位数、众数、方差等几个统计量中,最能刻画
数据波动(离散)程度的量是 .
47.(2022春•武宣县期末)某校举办“成语听写大赛”11名学生进入决赛,他们所得分
数互不相同,比赛共设5个获奖名额,某学生知道自己的分数后,要判断自己能否获奖,
他应该关注的统计量是 (填“平均数”或“中位数” .
48.(2024•高青县一模)学校准备设计一款女生校服,对全校女生喜欢的颜色进行了问卷
调查,统计如下表所示:
颜色 黄色 绿色 白色 紫色 红色
学生人数 100 180 220 80 750
学校决定采用红色,可用来解释这一现象的统计知识是
A.平均数 B.中位数 C.众数 D.方差
49.(2023春•诸暨市期中)某商贸公司10名销售员上月完成的销售额情况如表:
销售额 3 4 5 6 8 9 13
(万元)
销售员人 1 3 2 1 1 1 1数
(1)求销售额的中位数、众数,以及平均每人完成的销售额.
(2)如果以销售额的中位数作为每月定额任务指标,那么没有完成定额任务的销售员有多
少人?
(3)若要从平均数,中位数,众数中选一个作为每月定额任务指标,你认为选哪一个统计
量比较合适?请说明理由.
50.(2023春•苍溪县期末)广元地处秦岭南麓,是南北的过渡带,既有南方的湿润气候
特征,又有北方天高云淡、艳阳高照的特点,优越的气候条件非常适合猕猴桃的种植.某
果品店购进了300箱猕猴桃,每箱质量为5千克,由于保存的问题会有一些损耗.现随机
抽取20箱,去掉损耗的猕猴桃后称得每箱的质量(单位:千克)如下表所示:
质量(千克) 4.5 4.6 4.7 4.8 4.9 5
2 1 7 3 1
数量(箱
分析数据:
平均数 众数 中位数
4.75
(1)直接写出表格中 , , 的值;
(2)平均数、众数、中位数都能反映这组数据的集中趋势,请根据以上样本数据分析的结
果,任意选择其中一个统计量,估算这300箱猕猴桃共损坏了多少千克.