文档内容
第二十四章 数据的分析
24.3 数据的四分位数
教学设计
课题 24.3 数据的四分位数 授课人
1.理解四分位数的概念,掌握四分位数的计算方法.
教学目标 2.理解箱线图的构成及其意义,能够绘制和解读箱线图.
3.能够通过四分位数和箱线图分析数据的分布特征.
教学重点 理解四分位数,掌握四分位数的算法
教学难点 通过四分位数分析数据的离散程度
授课类型 新授课 课时 1
教学步骤 师生活动 设计意图
复习导入 回顾方差的计算公式,并说明方差的意义. 通过回顾
旧知为学
习新知做
好准备.
方差越大,数据的波动越大;方差越小,数据的波动越小.
方差的适用条件:当两组数据的平均数相等或相近时,才利用方
差来判断它们的波动情况.
探究新知 某银行有 A 和 B 两个理财经营团队.近三年,这两个团队分别 通过问题
负责经营12项理财产品,收益率(单位:%)如下: 探究和讨
论,帮助
A: 4.77 3.98 6.44 4.89 2.15 3.85
学生理解
3.64 3.21 3.18 2.02 4.11 4.10 数据的四
分 位 数 .
B: 3.18 3.84 3.99 3.67 3.40 3.60
通过观察
4.10 4.21 4.15 4.44 3.87 3.91 和讨论,
帮助学生
如果你是一位购买理财产品的投资人,会选择哪个团队的产品?
发现数据
我们用产品收益率的平均数和方差来进行分析: 的四分位
数,并掌
,可以看出团队 B的平均收益率略高,
握 其 应
但差别不大;
用.
,可以看出团队 B收益率的波动较小,
产品收益率的稳定性要好于团队A.
因此,如果你是稳健性投资者,那么应该选择团队 B经营的理财
产品;如果你是激进型投资者,那么应该选择团队 A经营的理财
产品.
思考
如果投资者还想进一步了解两个团队理财产品收益率的具体情况,例如收益率大部分在什么范围,哪些范围比较集中等信
息,那么产品收益率的平均数和方差能反映出这些信息吗?
平均数和方差虽然可以反映产品收益率的集中趋势和离散程
度,但无法反映出投资客户关心的这些信息.因此,我们需要能
反映产品收益率更多分布信息的统计量.
一组数据按从小到大的顺序排列,中位数是从中间点把数据
分成2等份.将数据分成100等份的每一分点处的值叫作这组数据
的百分位数.相比中位数,百分位数可以较全面地反映出数据的
分布信息.
由于每个团队的产品收益率的数据个数不多,我们可以用三
个特殊的百分位数来刻画.
如图所示,把团队A的产品收益率按从小到大的顺序排列,
得到这组数据的中位数为 3.915,这个值把所有数据分成 2 等
份,所有数据中小于这个值的占50%,称3.915为这组数据的50%
分位数.
在3.915左侧和右侧的数据中,还可以分别得到它们各自的
中位数3.195和4.44,所有数据中小于这两个值的分别占 25%和
75%,称3.195 和4.44分别为这组数据的 25%分位数和75%分位
数.
小结
由于3.195,3.915,4.44这三个值把这组按由小到大顺序排
列的数据分成四等份,所以称它们为这组数据的四分位数,从小
到大分别称为这组数据的第一四分位数、第二四分位数(中位
数)、第三四分位数,分别记为Q ,Q ,Q .
1 2 3
由团队A产品收益率的三个四分位数,可以大致看出其产品
收益率的分布情况.其产品收益率小于3.195%的项目数占总数的
25%,产品收益率小于3.915%的项目数占总数的一半,产品收益
率大于 4.44%的项目数占总数的 25%.产品收益率在 3.195%至
4.44%之间的项目数占总数的50%.
类似地,如图,可以得到团队B产品收益率的三个四分位数
分别为3.635,3.89,4.125.
由团队B产品收益率的三个四分位数可以知道,其产品收益
率小于3.635%的项目数占总数的25%,产品收益率小于3.89%的
项目数占总数的一半,产品收益率大于4.125%的项目数占总数的
25%.产品收益率在3.635%至4.125%之间的项目数占总数的50%.为了更加直观地观察产品收益率的分布特征,我们可以用产
品收益率的三个四分位数及最小值、最大值这五个数值画出箱线
图.
团队A产品收益率的箱线图如下图所示,它主要由矩形箱体
和从箱体延伸出的两条水平线段(称为须线)构成.
箱线图中最左侧和最右侧的竖直线段分别表示这组数据的最
小值和最大值,中间箱体的左端竖线表示第一四分位数,箱体中
部的竖线表示第二四分位数(中位数),箱体的右端竖线表示第
三四分位数,整个箱体的长度为第三四分位数减去第一四分位数
的差,称为四分位距.由箱线图,容易看出产品收益率分布的大致
情况,如分布的范围、中位数的大小、集中的范围、分布是否对
称等.
类似地,可以画出团队B产品收益率的箱线图,如下图所示.
箱线图也可以按竖直方向画.为了便于比较两个团队产品收益
率的分布特征,把两个箱线图按竖直方向并列画在同一幅图中,
如图所示.
从图中可以发现,两个团队产品收益率的中位数几乎相等
(表示中位数的水平线段差不多高),但团队 A的产品收益率波
动明显比团队B的大(团队A的箱体和须线比团队B的长),这与
用平均数、方差比较的结果是一致的.
从箱线图中,还可以看出分布的一些其他特征,例如,团队
B的产品收益率分布比团队A的更对称(中位数对应的水平线段
在箱子的中间位置),团队A有约25%的产品收益率高于团队B
的最高产品收益率,也有约 25%的产品收益率低于团队 B的最低
产品收益率,等等.
小结
按从小到大的顺序排列的一组数据,可以按以下步骤确定其四分位数:
先找出这组数据的中位数,作为这组数据的第二四分位数;
然后找出中位数左侧和右侧的数据各自的中位数,分别作为这组
数据的第一四分位数和第三四分位数.利用一组数据的三个四分位
数,以及最小值、最大值可以刻画这组数据的大致分布情况.
(链接例题)
典例精析 【例1】根据下表中的数据,分别计算甲、乙两地气温的四分位 通过例题
数,在同一幅图中画出箱线图,据此比较甲、乙两地的气温特 和练习帮
点. 助学生掌
握所学知
识,培养
学生的应
用能力.
【解】将表中两地的气温(单位:℃)分别按从小到大的顺序排
列,可得
甲地 9 10 11 12 13 14 16 16 18 21 21 23 24
乙地 11 12 13 14 15 15 16 17 17 18 19 20 21
甲、乙两地气温各有13个数据.甲地气温的最小值为9,最大值
为24,三个四分位数分别为
乙地气温的最小值为 11,最大值为 21,三个四分位数分别为
在同一幅图中画出两地气温的箱线图,如图所示.
可以看出,甲、乙两地气温的中位数相同,但甲地气温的波动明
显比乙地的大,甲地约有25%时刻的气温高于乙地的最高温度,
约有25%时刻的气温低于乙地的最低温度.
随堂检测 1.若一组数据的平均数、中位数、众数都相等,则这组数据可能 通过设置
是( B ) 随 堂 检
测,及时
A. 1,2,3,4,5 B. 1,2,2,2,3
获知学生
C. 1,1,1,2,2 D. 1,1,2,2,3 对所学知
识的掌握
2.数据集{12, 15, 18, 22, 24, 27, 30}的第一四分位数是
情况,明
1 5 ,第三四分位数是 2 7 .
确哪些学
3.某次考试分数的第90百分位数是95分,说明至少有 9 0 %的 生需要在
课后加强
学生分数不超过95分.
辅导,达
4.某小组 8 名学生的数学成绩分别为 75,80,85,90,90, 到全面提95,100,100. 高 的 目
的.
(1) 求这组数据的平均数、中位数、众数;
(2) 计算第三四分位数.
解:(1) 平均数:
(75 + 80 + 85 + 90 + 90 + 95 + 100 + 100)÷8 = 90;
将数据从小到大排序为 75,80,85,90,90,95,100,100,
中位数为(90 + 90)÷2 = 90;众数是 90 和 100.
(2)8×75% = 6,第三四分位数是第 6 个数和第 7 个数的平均
值,即(95 + 100)÷2 = 97.5.
课堂小结 巩固所学
知识,加
深对本节
知识的理
解.
作业布置
板书设计 24.3 数据的四分位数
例题解析
教学反思