文档内容
24.3 数据的四分位数
1.理解四分位数的概念及计算方法.
2.掌握箱线图的构成及在数据分析中的作用.
3.能够根据原始数据计算并绘制箱线图,通过解读箱线图,提升从
图表中提取信息的能力.
重点:四分位数的计算步骤及箱线图绘制方法.
难点:箱线图的解读.
知识链接:上节课我们进一步学习了方差,回顾一下相关知识.
创设情境——见配套课件
探究点一:四分位数
问题1:(教材P176问题):某银行有A和B两个理财产品经营团
队.近三年,这两个团队分别负责经营12项理财产品,收益率(单
位:%)如下:
A 4.77 3.98 6.44 4.89 2.15 3.85 3.64 3.21 3.18
2.02 4.11 4.10
B 3.18 3.84 3.99 3.67 3.40 3.60 4.10 4.21 4.15
4.44 3.87 3.91
如果你是一位购买理财产品的投资者,会选择哪个团队的产品?
用产品收益率的平均数和方差来刻画这两个团队的经营水平.通过计
算,可以得到A和B两个团队产品收益率的平均数和方差分别为x
A
≈3.862,s2≈1.327;x ≈3.863,s2≈0.117.可以看出,团队B的
A B B
产品收益率的平均数稍大于团队A,但差别不大;团队A的产品收
益率的方差明显大于团队B,即团队B的产品收益率的稳定性要好
于团队A.因此,如果你是稳健型投资者,那么应该选择团队B经营的理财产品;如果你是激进型投资者,那么应该选择团队A经营的
理财产品.
问题2:(教材P176思考)如果投资者还想进一步了解两个团队理
财产品收益率的具体情况,例如收益率大部分在什么范围,哪些范
围比较集中等信息,那么产品收益率的平均数和方差能反映出这些
信息吗?
平均数和方差虽然可以反映产品收益率的集中趋势和离散程度,但
无法反映出投资客户关心的这些信息.因此,我们需要能反映产品收
益率更多分布信息的统计量.
概念引入:一组数据按从小到大的顺序排列,中位数是从中间点把
数据分成2等份,将数据分成100等份的每一分点处的值叫作这组
数据的百分位数.相比中位数,百分位数可以较全面地反映出数据的
分布信息.
问题3:由于每个团队的产品收益率的数据个数不多,我们可以用
三个特殊的百分位数来刻画.把团队A的产品收益率按从小到大的顺
序排列,容易得到这组数据的中位数为3.915,这个值把所有数据
分成2等份,所有数据中小于这个值的占50%,称3.915为这组数
据的50%分位数.在3.915左侧和右侧的数据中,还可以分别得到它
们各自的中位数3.195和4.44,所有数据中小于这两个值的分别占
25%和75%,称3.193和4.44分别为这组数据的25%分位数和
75%分位数.由于3.195,3.915,4.44这三个值把这组按由小到大
顺序排列的数据分成四等份,所以称它们为这组数据的四分位数.求
出团队A产品收益率的三个四分位数.
2.02 2.15 3.18 | 3.21 3.64 3.85 | 3.98 4.10
4.11 | 4.77 4.89 6.44
3.195 3.915
4.44第一四分位数 第二四分位数 第三四
分位数
归纳总结:把所有数据由小到大排列并分成四等份,处于三个分割
点位置的数据就是四分位数.第一四分位数,又称下四分位数,等于
该样本中所有数据由小到大排列后第25%的数据;第二四分位数,
又称中位数,等于该样本中所有数据由小到大排列后第50%的数据;
第三四分位数,又称上四分位数,等于该样本中所有数据由小到大
排列后第75%的数据.如果数据的个数是偶数,那么中位数是中间
两个数的平均数,可用相似的处理方式计算第一、第三四分位数.第
一、第二、第三四分位数分别记为Q ,Q ,Q .
1 2 3
问题4:求出团队B产品收益率的三个四分位数.
答案见配套课件.
问题5:由团队A产品收益率和团队B产品收益率的三个四分位数,
观察其产品收益率的分布情况.
团队A产品:其产品收益率小于3.195%的项目数占总数的25%,
产品收益率小于3.915%的项目数占总数的一半,产品收益率大于
4.44%的项目数占总数的25%.产品收益率在3.195%至4.44%之间
的项目数占总数的50%.
团队B产品:其产品收益率小于3.635%的项目数占总数的25%,
产品收益率小于3.89%的项目数占总数的一半,产品收益率大于
4.125%的项目数占总数的25%,产品收益率在3.635%至4.125%
之间的项目数占总数的50%.
探究点二:箱线图
为了更加直观地观察产品收益率的分布特征,我们可以用产品收益
率的三个四分位数及最小值、最大值这五个数值画出箱线图.团队A
产品收益率的箱线图如图所示,它主要由矩形箱体和从箱体延伸出
的两条水平线段(称为须线)构成.箱线图中最左侧和最右侧的竖直
线段分别表示这组数据的最小值和最大值,中间箱体的左端竖线表示第一四分位数,箱体中部的竖线表示第二四分位数(中位数),
箱体的右端竖线表示第三四分位数,整个箱体的长度为第三四分位
数减去第一四分位数的差,称为四分位距.由箱线图,容易看出产品
收益率分布的大致情况,如分布的范围、中位数的大小、集中的范
围、分布是否对称等.
问题6:画出团队B产品收益率的箱线图.
问题7:箱线图也可以按竖直方向画.为了便于比较两个团队产品收
益率的分布特征,把两个箱线图按竖直方向并列画在同一幅图中,
如图所示,你有哪些发现?
答案见配套课件.
归纳总结:按从小到大的顺序排列的一组数据,可以按以下步骤确
定其四分位数:先找出这组数据的中位数,作为这组数据的第二四
分位数;然后找出中位数左侧和右侧的数据各自的中位数,分别作
为这组数据的第一四分位数和第三四分位数.利用一组数据的三个四
分位数,以及最小值、最大值可以刻画这组数据的大致分布情况.
【对应训练】教材P180练习第1题.
(教材P179例)根据教材第173页表24.2-5中的数据,分别
计算甲、乙两地气温的四分位数,在同一幅图中画出箱线图,据此
比较甲、乙两地的气温特点.
答案见配套课件.【对应训练】教材P180练习第2题和第3题.
1.一组数据23,11,14,31,16,17,19,27的上四分位数是(
D )
A.14 B.15 C.23 D.25
2.兴趣小组9名同学的数学成绩(单位:分)分别为80,68,90,
88,96,89,70,98,91,则下列说法正确的是( D )
A.中位数是88.5B.上四分位数是91 C.下四分位数是80 D.以上
说法都不对
3.如图是某班学生1min跳绳次数的箱线图,从中我们可以得到信息:
(1)该班学生1min跳绳次数最多相差 4 7 次;
(2)四分位距为 1 2 .
4.在某场男排半决赛中,C队击败D队晋级决赛.下面的箱线图反映
了两队队员发球速度情况,请比较两队发球速度的差异.
解:C队发球速度整体更高,中位数明显高于D队;C队发球速度
分布更集中,D队分布略宽,波动较大.
(其他课堂拓展题,见配套PPT)