文档内容
24.4 数据的分组
一、教学目标
【知识与技能】
1.理解组内离差平方和的含义与计算.
2.经历数据分类的活动,知道按照组内离差平方和最小的原则
对数据进行分类的方法.
【过程与方法】
经历数据分组优化的实践过程,体会统计决策的科学性。通过小
组合作探究,感受“优化分组”对数据规律的提炼作用。
【情感态度与价值观】
培养用数学方法解决实际问题的意识。体会合理分组对数据分析
的重要性,形成严谨的数据观念。
二、 课型
新授课
三、课时
第1课时 共1课时
四、教学重难点
1 / 10【教学重点】
组内离差平方和的计算方法;理解找最优分组的逻辑.
【教学难点】
离差平方和统计意义的理解;从数学最优解到实际意义的转化.
五、 课前准备
教师:课件、三角尺、直尺等.
学生:三角尺、铅笔、练习本.
六、教学过程
(一)导入新课(出示课件2-3)
超市商品从“牛奶、面包、牙膏、洗发水”变成“食品区、日用
品区、生鲜区”,能快速找到你要的东西.
校医需分析七年级某班20名学生的身高分布:
155,155,156,157,158,159,160,161,162,162,163,
165,165,166,167,167,168,169,172,178.
若想分为 3 组制作频数分布表,等距分组法(如 150-160,160-
170,170-180)可能存在什么问题?
学生答:有的组人数过多(如 160-170集中12人),有的组过少
2 / 10(170-180仅2人),无法清晰反映分布特征。
教师问:是否存在更科学的分组方法,使得每组内部数据尽可能
相似?如何衡量“组内差异度”?
(二)探索新知
1.出示课件5-12,数据的合理分组原则——组内离差平方和最
小
教师出示问题:
一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然
后根据笔试成绩确定一部分应聘者进入面试.将10名应聘者的笔试
成绩(百分制)按从小到大的顺序排列如下:
58 64 68 75 76 83 85 89 90 92
你认为哪一部分应聘者应当进入面试?
选择笔试成绩好的进入面试,那么怎样才算好呢?标准是什么呢?
师生一起解答:
例如,前三名或85分及以上为好成绩,其余为不太好的成绩.
但是83分和85分的差距很小,若以“85分及以上”为好成绩的
标准,则85分属于好成绩,而83分属于不太好的成绩.
3 / 10这么看,有些标准没有考虑数据自身的特点.从公司确定面试应
聘者的角度看,把笔试成绩相对接近的分到同一组,是一种较合理
的做法.
因此,笔试成绩可以根据组内差异最小的原则进行分组.
教师引导学生进行数据分组:
要使分组后的组内差异最小,将笔试成绩按从小到大的顺序排列,
使相互最接近的笔试成绩挨在一起,然后进行分组,可以发现,10
个笔试成绩按顺序排列形成了9个间隔,如下. 每个间隔都可以把
笔试成绩分成好和差两组,共有9种分法.
教师问:怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔
试成绩好和差两组的组内差异最小?
学生答:利用离差平方和刻画组内数据的离散程度,进而对数据
进行分组。
教师引导学生计算离差平方和:
一般地,设有一般地,设有n个数据x ,x ,…,x ,假设这些
1 2 n
4 / 10数据都不相等,其平均数记为x,则离差平方和为d2=(x -x)2+
1
(x -x)2+…+(x -x)2.
2 n
如果把这组数据分为两组,前m(m<n)个数据为一组(称为
第一组),后(n-m)个数据为一组(称为第二组),那么这n个数
据的离差平方和可以分解为两类离差平方和:一类反映两个组内数
据的离散程度,另一类反映两组数据之间的差异程度.
它们的平均数分别记为x 和x ,离差平方和分别为
1 2
=(x -x )2+(x -x )2+…+(x -x )2,
d2 1 1 2 1 m 1
1
=(x -x )2+(x -x )2+…+(x -x )2.
d2 m+1 2 m+2 2 n 2
2
=(x -x)2+(x -x)2+…+(x -x)2
d2 1 2 n
=(x -x)2+(x -x)2+…+(x -x)2+(x -x)2+
1 2 m m+1
(x -x)2+…+(x -x)2
m+2 n
=(x -x + x - x )2+(x -x + x - x )2+…+
1 1 1 2 1 1
(x -x + x - x )2+(x -x + x - x )2+(x -
m 1 1 m+1 2 2 m+2
x +
2
x - x )2+…+(x -x + x - x )2
2 n 2 2
5 / 10=(x -x )2+(x -x )2+…+(x -x )2+(x -x )2+
1 1 2 1 m 1 m+1 2
(x -x )2+…+(x -x )2
m+2 2 n 2
= + + m(x -x)2+(n-m)(x -x)2.
d2 d2 1 2
1 2
教师归纳总结:
其中 + 称为组内离差平方和,表示两个组内数据的离散程度;
d2 d2
1 2
= m(x -x)2+(n-m)(x -x)2,称为组间离差平方和,表示
d2 1 2
12
两个组间的差异.
一个合理的分组原则是使组内离差平方和达到最小,组间离差平
方和达到最大.由于总体离差平方和d2不变,只需考虑使组内离差平
方和达到最小即可.
学生根据组内离差平方和最小原则解答问题:
教师问:根据组内离差平方和最小的原则,能使笔试成绩相差较
小的应聘者分在同一组,计算这9种分法的组内离差平方和(结果
保留小数点后一位).
师生共同分析:第一组1个、第二组9个数据,计算组内离差平
6 / 10方和;第一组2个、第二组8个数据,计算组内离差平方和;
……
如下表所示.
可以发现,当按第5个间隔分组时,组内离差平方和最小.
因此,分法为{58,64,68,75,76}和{83,85,89,90,92}.
考点 利用组内离差平方和最小原则对数据分组
例 10个城市某月的每日最高温度的平均数(简称平均高温)
如下表所示.
根据平均高温的组内离差平方和最小的原则,把这10个城市分
为两组.(出示课件13)
7 / 10师生共同分析解答:
解:
将表中的数据按从小到大排列,可得
-11 -3 3 3 9 10 12 17 21 22
将它们分成两组共有9种情况,分别计算组内离差平方和(结果
保留小数点后一位),如下表所示.
观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,
组内离差平方和最小.
因此,按组内离差平方和最小的分法为{北京,石家庄,呼和浩
特,哈尔滨}和{上海,广州,海口,成都,贵阳,昆明}.
出示课件16,学生自主练习后口答,教师订正.
(三)课堂练习(出示课件18)
8 / 10练习课件第18页题目,约用时10分钟.
(四)课堂小结(出示课件19)
(五)课前预习
预习下节课(数学活动第1课时)的相关内容.
知道数学活动的步骤
七、课后作业
1、教材第185页练习第2题,习题24.4第1,2题.
2、培优练习24.4第6,9题.
八、板书设计
24.4 数据的分组
组内离差平方和:
例题
9 / 10考点
九、教学反思:
成功之处:通过对比常规分组与最有分组,学生直观感知“组内
更紧凑、组间更分离”的分布优势.学生经历排序→分割→计算→比
较一系列活动, 理解优化算法的逻辑,体现实际需求与数学模型的
辩证思考.增强学生的统计意识和解决实际问题的能力,体会数学来
源于生活,应用于生活.
补救措施:适当增加一些实例,让学生通过实践操作,独立分析寻
求解决实际问题的数学方法,增强应用数学的意识.
10 / 10