文档内容
20.1 数据的集中趋势
知识点1:平均数、众数与中位数
总体、个体、样本、样本容量是统计学中特有的规定,准确把握教材,明确所考查的对象是解决有
关总体、个体、样本、样本容量问题的关键。
平均数、众数、中位数都是用来描述数据集中趋势的量。平均数的大小与每一个数据都有关,任何
一个数的波动都会引起平均数的波动,当一组数据中有个数据太高或太低,用平均数来描述整体趋势则不
合适,用中位数或众数则较合适。中位数与数据排列有关,个别数据的波动对中位数没影响;当一组数据
中不少数据多次重复出现时,可用众数来描述。
1.平均数有算术平均数和加权平均数
平均数的求法: = (x+x+…+x);
1 2 n
加权平均数计算公式为: = (xf+xf+…+xf),其中f,f,…,f 代表各数据的权.
1 1 2 2 k k 1 2 k
2.中位数的求法
数据从大到小或从小到大排好顺序以后,若为偶数个数,就是最中间的两个数加起来除以 2,即两个
数的平均数;若为奇数个数,就是中间个数.
3.众数:指一组数据中出现次数最多的数.
【例题1】(2020•株洲)数据12、15、18、17、10、19的中位数为( )
A.14 B.15 C.16 D.17
【答案】C
【解析】首先将这组数据按大小顺序排列,再利用中位数定义,即可求出这组数据的中位数.15+17
把这组数据从小到大排列为:10,12,15,17,18,19,则这组数据的中位数是 =16.
2
【例题2】(2020•陕西)王大伯承包了一个鱼塘,投放了2000条某种鱼苗,经过一段时间的精心喂养,
存活率大致达到了90%.他近期想出售鱼塘里的这种鱼.为了估计鱼塘里这种鱼的总质量,王大伯随机捕
捞了20条鱼,分别称得其质量后放回鱼塘.现将这20条鱼的质量作为样本,统计结果如图所示:
(1)这20条鱼质量的中位数是 ,众数是 .
(2)求这20条鱼质量的平均数;
(3)经了解,近期市场上这种鱼的售价为每千克18元,请利用这个样本的平均数.估计王大伯近期售完
鱼塘里的这种鱼可收入多少元?
【答案】见解析。
【分析】(1)根据中位数和众数的定义求解可得;
(2)利用加权平均数的定义求解可得;
(3)用单价乘以(2)中所得平均数,再乘以存活的数量,从而得出答案.
【解析】(1)∵这20条鱼质量的中位数是第10、11个数据的平均数,且第10、11个数据分别为1.4、
1.5,
1.4+1.5
∴这20条鱼质量的中位数是 =1.45(kg),众数是1.5kg,
2
故答案为:1.45kg,1.5kg.
1.2×1+1.3×4+1.4×5+1.5×6+1.6×2+1.7×2
(2)x= =1.45(kg),
20
∴这20条鱼质量的平均数为1.45kg;
(3)18×1.45×2000×90%=46980(元),
答:估计王大伯近期售完鱼塘里的这种鱼可收入46980元.一、选择题
1.(2020•天水)某小组8名学生的中考体育分数如下:39,42,44,40,42,43,40,42.该组数据的
众数、中位数分别为( )
A.40,42 B.42,43 C.42,42 D.42,41
【答案】C
【解析】先将数据按照从小到大重新排列,再根据众数和中位数的定义求解可得.
将这组数据重新排列为39,40,40,42,42,42,43,44,
42+42
所以这组数据的众数为42,中位数为 =42
2
2.(2020•河北)如图是小颖前三次购买苹果单价的统计图,第四次又买的苹果单价是a元/千克,发现这
四个单价的中位数恰好也是众数,则a=( )
A.9 B.8 C.7 D.6
【答案】B
【解析】根据统计图中的数据和题意,可以得到a的值,本题得以解决.
由统计图可知,前三次的中位数是8,
∵第四次又买的苹果单价是a元/千克,这四个单价的中位数恰好也是众数,
∴a=8,
3.(2019湖南益阳)已知一组数据5,8,8,9,10,以下说法错误的是( )
A.平均数是8 B.众数是8 C.中位数是8 D.方差是8
【答案】D.
【解析】由平均数的公式得平均数=(5+8+8+9+10)÷5=8,
方差= [(5﹣8)2+(8﹣8)2+(8﹣8)2+(9﹣8)2+(10﹣8)2]=2.8,将5个数按从小到大的顺序排列为:5,8,8,9,10,第3个数为8,即中位数为8,
5个数中8出现了两次,次数最多,即众数为8,故选:D.
4.对某校八年级随机抽取若干名学生进行体能测试,成绩记为1分,2分,3分,4分共4个等级,将调查
结果绘制成如下条形统计图和扇形统计图.根据图中信息,这些学生的平均分数是( )
A.2.25 B.2.5 C.2.95 D.3
【答案】C
【解析】考点有扇形统计图,条形统计图,频数、频率和总量的关系,加权平均数。
由得4分的频数12,频率30%,得总量12÷30%=40。
由得3分的频率42.5%,得频数40×42.5%=17。
由得1 分的频数3,得频率3÷40=7.5%。
∴得2分的频率为1-(7.5%+42.5%+30%)=20%。
∴这些学生的平均分数是:1×7.5%+2×20%+3×42.5%+4×30%=2.95。
5.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:
用 电 量
120 140 160 180 200
(度)
户数 2 3 6 7 2
则这20户家庭该月用电量的众数和中位数分别
是( )
A.180,160 B.160,180 C.160,160 D.180,180
【答案】A
【解析】众数是在一组数据中,出现次数最多的数据,这组数据中,出现次数最多的是 180,故这组数据
的众数为180。
中位数是一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数)。由
此将这组数据重新排序为120,120,140,140,140,160,160,160,160,160,160,180,180,180,
180,180,180,180,200,200,∴中位数是第10和11个平均数,它们都是160,故这组数据的中位数为160。
6. 某中学举行歌咏比赛,以班为单位参赛,评委组的各位评委给九年级三班的演唱打分情况(满分100
分)如下表,从中去掉一个最高分和一个最低分,则余下的分数的平均分是( )
分数(分) 89 92 95 96 97
评委(位) 1 2 2 1 1
A.92分 B.93分 C.94分 D.95分
【答案】C
【解析】考点是加权平均数。先去掉一个最低分去掉一个最高分,再根据平均数等于所有数据的和除以数
据的个数列出算式进行计算即可:
由题意知,最高分和最低分为97,89,则余下的数的平均数=(92×2+95×2+96)÷5=94。
7. 某射击运动员在一次射击练习中,成绩(单位:环)记录如下:8,9,8,7,10.这
组数据的平均数和中位数分别是( )
A.8,8 B.8.4,8 C.8.4,8.4 D.8,8.4
【答案】B
【解析】平均数是指在一组数据中所有数据之和再除以数据的个数。因此,8,9,8,7,10的平均数为:
×(8+9+8+7+10)=8.4。
中位数是一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数)。由
此将这组数据重新排序为7,8,8,9,10,∴中位数是按从小到大排列后第3个数为:8。
8. 2019年5月某日我国部分城市的最高气温统计如下表所示:
城 市 武汉 成都 北京 上海 海南 南京 拉萨 深圳
气 温
27 27 24 25 28 28 23 26
(℃)
请问这组数
据的平均数是( )
A.24 B.25 C.26 D.27
【答案】C
【解析】根据算术平均数的求法,求这组数据的算术平均数,用8个城市的温度和÷8即可:
(27+27+24+25+28+28+23+26)÷8=208÷8=26(℃)
9. 在体育达标测试中,某校初三5班第一小组六名同学一分钟跳绳成绩如下:93,138,98,152,138,
183;则这组数据的极差是( )
A.138 B.183 C.90 D.93【答案】C
【解析】根据一组数据中的最大数据与最小数据的差叫做这组数据的极差的定义,可得
极差为183﹣93=90。故选C。
10. 为了解长城小区“全民健身”活动的开展情况,随机对居住在该小区的40名居民一周的体育锻炼时间
进行了统计,结果如下表:
锻炼时间(时) 3 4 5 6 7
人数(人) 6 13 14 5 2
这40名居民一周体育锻炼时间的中位数是( )
A.4小时 B.4.5小时 C.5小时 D.5.5小时
【答案】C
【解析】中位数是一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均
数)。由此这组数据的中位数是按从小到大排列后第20和21个数的平均数,它们都为5。故这40名居民
一周体育锻炼时间的中位数是5小时。故选C。
二、填空题
11.(2020•青岛)某公司要招聘一名职员,根据实际需要,从学历、经验和工作态度三个方面对甲、乙
两名应聘者进行了测试,测试成绩如下表所示.如果将学历、经验和工作态度三项得分按 2:1:3的比例
确定两人的最终得分,并以此为依据确定录用者,那么 将被录用(填甲或乙).
应聘者 甲 乙
项目
学历 9 8
经验 7 6
工作态度 5 7
【答案】乙.
【解析】根据加权平均数的定义列式计算,比较大小,平均数大者将被录取.
9×2+7×1+5×3 20 8×2+6+7×3 43
∵x = = ,x = = ,
甲 2+1+3 3 乙 2+1+3 6
∴x <x ,
甲 乙
∴乙将被录用.
12.某射击小组有20人,教练根据他们某次射击的数据绘制成如图所示的统计图,则这组数据的众数
是________.【答案】7
【解析】众数是在一组数据中,出现次数最多的数据。根据条形统计图可知,环数为5,6,7,8,9,10
的人数依次为:1,2,7,6,3,1,其中环数7出现了7次,次数最多,即为这组数据的众数。
13. 某果园有苹果树100棵,为了估计该果园的苹果总产量,小王先按长势把苹果树分成了A、B、C三个
级别,其中A级30棵, B级60棵, C级10棵,然后从A、B、C三个级别的苹果树中分别随机抽取了3棵、
6棵、1棵,测出其产量,制成了如下的统计表.小李看了这个统计表后马上正确估计出了该果园的苹果总
产量,那么小李的估计值是________千克.
苹果树长势 A级 B级 C级
随机抽取棵数(棵) 3 6 1
所抽取果树的平均产量(千克) 80 75 70
【答案】7600。
【解析】利用样本估计总体的方法结合图表可以看出:A级每颗苹果树平均产量是80千克,B级每颗苹果
树平均产量是75千克,C级每颗苹果树平均产量是70千克,用A级每颗苹果树平均产量是80千克×30棵
+B级每颗苹果树平均产量是75千克×60棵+C级每颗苹果树平均产量是70千克×10棵=该果园的苹果总
产量7600。
三、解答题
14.(2020•湘潭)“停课不停学”.突如其来的新冠肺炎疫情让网络学习成为了今年春天一道别样的风
景.隔离的是身体,温暖的是人心.“幸得有你,山河无恙”.在钟南山、白衣天使等人众志成城下,战
胜了疫情.在春暖花开,万物复苏之际,某校为了解九年级学生居家网络学习情况,以便进行有针对性的
教学安排,特对他们的网络学习时长(单位:小时)进行统计.现随机抽取20名学生的数据进行分析:
收集数据:4.5,6,5.5,6.5,6.5,5.5,7,6,7.5,8,6.5,8,7.5,5.5,6.5,7,6.5,6,6.5,5
整理数据:
时长x(小时) 4<x≤5 5<x≤6 6<x≤7 7<x≤8
人数 2 a 8 4
分析数据:
项目 平均数 中位数 众数数据 6.4 6.5 b
应用数据:
(1)填空:a= ,b= ;
(2)补全频数直方图;
(3)若九年级共有1000人参与了网络学习,请估计学习时长在5<x≤7小时的人数.
【答案】见解析。
【分析】(1)根据各组频数之和等于数据总数,可得5<x≤6范围内的数据;找出数据中次数最多的数据
即为所求;
(2)根据(1)中的数据画图即可;
(3)先算出样本中学习时长在5<x≤7小时的人数所占的百分比,再用总数乘以这个百分比即可.
【解析】(1)由总人数是20人可得在5<x≤6的人数是20﹣2﹣8﹣4=6(人),所以a=6,
根据数据显示,6.5出现的次数最多,所以这组数据的众数b=6.5;
故答案为:6,6.5;
(2)由(1)得a=6.
频数分布直方图补充如下:
6+8
(3)由图可知,学习时长在5<x≤7小时的人数所占的百分比= ×100%=70%,
20
∴1000×70%=700(人).
∴学习时长在5<x≤7小时的人数是700人.
15.在开展“学雷锋社会实践”活动中,某校为了解全校1200名学生参加活动的情况,随机调查了50名学
生每人参加活动的次数,并根据数据绘成条形统计图如下:(Ⅰ)求这50个样本数据的平均数、众数和中位数;
(Ⅱ)根据样本数据,估算该校1200名学生共参加了多少次活动.
【答案】见解析。
【解析】(Ⅰ)观察条形统计图,可知这组样本数据的平均数是:
132731741855
x 3.3
50 。
∵在这组样本数据中,4出现了18次,出现的次数最多,
∴这组数据的众数是4。
∵将这组样本数据按从小到大的顺序排列,其中处在中间的两个数都是3,
∴这组数据的中位数是3。
(Ⅱ)∵这组样本数据的平均数是3.3,
∴估计全校1200人参加活动次数的总体平均数是3.3,
∴3.3×1200=3960。
∴估计该校学生共参加活动约为3960次。
16.为了了解某学校初四年纪学生每周平均课外阅读时间的情况,随机抽查了该学校初四年级m名同学,对
其每周平均课外阅读时间进行统计,绘制了如下条形统计图(图一)和扇形统计图(图二):
(1)根据以上信息回答下列问题:
①求m值.
②求扇形统计图中阅读时间为5小时的扇形圆心角的度数.③补全条形统计图.
(2)直接写出这组数据的众数、中位数,求出这组数据的平均数.
【答案】见解析。
【解析】考点有众数;扇形统计图;条形统计图;加权平均数;中位数.
(1)①根据2小时所占扇形的圆心角的度数确定其所占的百分比,然后根据条形统计图中2小时的人数求
得m的值;②求得总人数后减去其他小组的人数即可求得第三小组的人数;
①∵课外阅读时间为2小时的所在扇形的圆心角的度数为90°,
∴其所占的百分比为 = ,
∵课外阅读时间为2小时的有15人,
∴m=15÷ =60;
②第三小组的频数为:60﹣10﹣15﹣10﹣5=20,
补全条形统计图为:
(2)利用众数、中位数的定义及平均数的计算公式确定即可.
∵课外阅读时间为3小时的20人,最多,
∴众数为 3小时;
∵共60人,中位数应该是第30和第31人的平均数,且第30和第31人阅读时间均为3小时,
∴中位数为3小时;
平均数为: ≈2.92小时.
17.某校学生会向全校1 900名学生发起了献爱心捐款活动,为了解捐款情况,学生会随机调查了部分学生
的捐款金额,并用得到的数据绘制了如下统计图1和图2,请根据相关信息,解答下列问题:(1)本次接受随机抽样调查的学生人数为 ,图1中m的值是 ;
(2)求本次调查获取的样本数据的平均数、众数和中位数;
(3)根据样本数据,估计该校本次活动捐款金额为10元的学生人数.
【答案】见解析。
【解析】(1)50 32
(2)∵ = =16(元),
这组样本数据的平均数是16元;
众数为10元,
中位数为15元.
(3)1 900×32%=608(人).
该校本次活动捐款金额为10元的学生约有608人.
18. 我们约定:如果身高在选定标准的±2%范围之内都称为“普通身高”.为了了解某校九年级男生中具
有“普遍身高”的人数,我们从该校九年级男生中随机抽出 10名男生,分别测量出他们的身高(单位:
cm),收集并整理如下统计表:
(1)计算这组数据的三个统计量:平均数、中位数、众数;
(2)请你选择其中一个统计量作为选定标准,找出这10名男生中具有“普遍身高”是哪几位男生?并说
明理由.
【答案】见解析。
【解析】(1)根据平均数、中位数、众数的定义进行计算即可得解。
(1)平均数为:(163+171+173+159+161+174+164+166+169+164)÷10=166.6(cm)。
∵身高从小到大排列如下:159、161、163、164、164、166、169、171、173、174,
∴中位数:(166+164)÷2=165(cm)。∵这组数据中出现最多的是164,∴众数:164(cm)。
(2)根据(1)中求出的数据,求出普遍身高的取值范围,然后确定学生序号即可。
若选中位数作为标准:
身高x满足165×(1﹣2%)≤x≤165×(1+2%),解得,161.7≤x≤168.3。
此时①⑦⑧⑩男生的身高具有“普遍身高”。
若选众数作为标准:
身高x满足164×(1﹣2%)≤x≤164×(1+2%),解得,160.72≤x≤167.28。
此时①⑤⑦⑧⑩男生的身高具有“普遍身高”。
19.(2019河南)某校为了解七、八年级学生对“防溺水”安全知识的掌握情况,从七、八年级各随机抽
取50名学生进行测试,并对成绩(百分制)进行整理、描述和分析.部分信息如下:
a.七年级成绩频数分布直方图:
b.七年级成绩在70≤x<80这一组的是:
70 72 74 75 76 76 77 77 77 78 79
c.七、八年级成绩的平均数、中位数如下:
年级 平均数 中位数
七 76.9 m
八 79.2 79.5
根据以上信息,回答下列问题:
(1)在这次测试中,七年级在80分以上(含80分)的有 人;
(2)表中m的值为 ;
(3)在这次测试中,七年级学生甲与八年级学生乙的成绩都是78分,请判断两位学生在各自年级的排名
谁更靠前,并说明理由;
(4)该校七年级学生有400人,假设全部参加此次测试,请估计七年级成绩超过平均数76.9分的人数.
【答案】见解析。【解析】(1)在这次测试中,七年级在80分以上(含80分)的有15+8=23人,
故答案为:23;
(2)七年级50人成绩的中位数是第25、26个数据的平均数,而第25、26个数据分别为78、79,
∴m= =77.5,
故答案为:77.5;
(3)甲学生在该年级的排名更靠前,
∵七年级学生甲的成绩大于中位数78分,其名次在该班25名之前,
八年级学生乙的成绩小于中位数78分,其名次在该班25名之后,
∴甲学生在该年级的排名更靠前.
(4)估计七年级成绩超过平均数76.9分的人数为400× =224(人).
【点评】本题主要考查频数分布直方图、中位数及样本估计总体,解题的关键是根据直方图得出解题所需
数据及中位数的定义和意义、样本估计总体思想的运用.