当前位置:首页>文档>选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版

选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版

  • 2026-06-24 17:09:19 2026-06-24 17:09:19

文档预览

选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版
选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版
选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版
选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版
选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版
选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版
选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版
选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版
选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版
选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版
选择性必修第二册_高中三年全科资料_高中_高中电子教材_高中数学_沪教版

文档信息

文档格式
pdf
文档大小
39.425 MB
文档页数
7 页
上传时间
2026-06-24 17:09:19

文档内容

普通高中教科书 普 通 高 选择性必修 中 教 科 书 第 二 册 上 海 教 育 出 版 社 上 海 教 育 出 版 社 数 学 选 择 性 必 修 S H U X U E SHUXUE 普通高中教科书 选择性必修 第 二 册 第 二 册 定 价: 12.45元普通高中教科书 S H U X U E 选择性必修 第 二 册 上 海 教 育 出 版 社主 编 李大潜 王建磐 副 主 编 应坚刚 鲍建生 本册编写人员 程 靖 肖恩利 姚一隽 应坚刚 田万国 任升录 陈月兰 汪家录 责任编辑 曲春蕊 李 达 装帧设计 陆 弦 王 捷 周 吉 本册教材图片提供 图虫网(封面一幅图,P1一幅图,P2一幅图, P79一幅图,P115一幅图, P133一幅图);上海教育出版社有限公司(封底一幅图) 插图绘制 朱泽宇 普通高中教科书 数学 选择性必修 第二册 上海市中小学(幼儿园)课程改革委员会组织编写 出 版 上海教育出版社有限公司(上海市闵行区号景路159弄C座) 发 行 上海新华书店 印 刷 浙江临安曙光印务有限公司 版 次 2022年7月第1版 印 次 2022年7月第1次 开 本 890×1240 1/16 印 张 10 字 数 172 千字 书 号 978-7-5720-0187-1/G·0144 定 价 12.45 元 版权所有·未经许可不得采用任何方式擅自复制或使用本产品任何部分·违者必究 如发现内容质量问题,请拨打 021-64319241 如发现印、装质量问题,影响阅读,请与上海教育出版社有限公司联系. 电话021-64373213 全国物价举报电话:12315 声明 按照《中华人民共和国著作权法》第二十五条有关规定,我们已尽量寻找著作权人支 付报酬.著作权人如有关于支付报酬事宜可及时与出版社联系.前言 前 言 数学应该是绝大多数人一生中学得最多的一门功课.认真学习数学,努 力学好数学,不仅可以牢固地打好数学的知识基础,掌握一种科学的语言, 为走进科学的大门提供有力的工具和坚实的后盾;更重要地,通过认真而严 格的数学学习和训练,可以领会到数学的思想方法和精神实质,造就一些特 有而重要的素质和能力,形成自己的数学素养,让人变得更加聪明,更有智 慧,更有竞争力,终身受用不尽.从这个意义上,可以毫不夸张地说,数学 教育看起来似乎只是一种知识教育,但本质上是一种素质教育,其意义是十 分深远的. 中学阶段的数学学习,应该为学生今后的成长和发展奠定坚实的基础, 编写教材也要力求遵循这一根本宗旨.那种以种种名义,将一些“高级”或“时 髦”的东西,不顾实际情况地下放进中学的教材,和数学的基础训练“抢跑道” 的做法,是不可取的.同时,数学学科是一个有机联系的整体,一定要避免 知识的碎片化,从根本上改变单纯根据“知识点”来安排教学的做法.人为地 将知识链条打断,或将一些关键内容以“减负”的名义删去,只会造成学生思 维的混乱,影响学生对有关知识的认识与理解,实际上反而会加重学生学习 的负担,是不值得效法的.在任何情况下,都要基于课程标准,贯彻“少而 精”“简而明”的原则,精心选择与组织教材内容,抓住本质,返璞归真,尽可 能给学生以明快、清新的感受,使学生能更深入地领会数学的真谛,让数学 成为广大学生喜闻乐见的一门课程. 怎么才算“学好了数学”呢?对这个问题是需要一个正确的认识的.作为 一门重思考与理解的学科,数学学习要强调理解深入、运作熟练和表达明晰 这三个方面.这儿所说的“运作”泛指运算、推理及解题等环节.三者的关键是 深入的理解,只有不仅知其然、而且知其所以然,才能掌握数学的精髓,更 好地实现另外两方面的要求.如果只满足于会解题,甚至以“刷题”多与快为 荣,但不求甚解,就难以和数学真正结缘,是不值得鼓励与提倡的.表达能 1 书书书前言 力的培养也要引起足够的重视.要使表述简明清晰并不是一件容易的事,别 人三言两语就说清楚了的,自己却颠三倒四、不得要领,能够说真正弄懂了 数学吗?! 为了帮助学生学好数学,也为了帮助教师教好数学,本教材秉承上述理 念,在编写上做了认真的探索与实践,希望能成为广大师生的良师益友,更 好地发挥引路和示范的作用.书中各章的章首语,虽只有不到一页的篇幅, 但却是该章入门的一个宏观向导,务请认真注意.各章末的内容提要,简明 扼要地列出了该章的核心内容,希望对复习能起到较好的帮助.各章的主体 内容,包括正文、练习及复习题以及边注,更是字斟句酌、精心编写的.希 望广大同学养成认真阅读及钻研教材的习惯,这样就一定会发现,学习中所 碰到的种种问题,原则上都可以从教材中找到答案,大家的学习方法和自学 能力也一定会得到极大的提升,从而牢牢掌握住学习数学的主动权. 本套教材涵盖《普通高中数学课程标准(2017年版2020年修订)》所规定 的必修课程和选择性必修课程的内容,共分七册,包括必修四册、选择性必 修三册,其中必修第四册和选择性必修第三册是数学建模的内容.必修前三 册和选择性必修前两册共同构建了高中数学的知识体系和逻辑结构;数学建 模内容与数学知识的逻辑结构没有直接的关系,不依附于特定知识性内容的 教学,而在于强调数学知识在解决实际问题中的应用,强调它的活动性、探 索性和综合性.因此,两册数学建模教材不是前三册或前两册教材的后继, 而且都包含比教学课时数要求更多的内容,供各个年段灵活地、有选择地使 用,以实现数学建模的教学目标. 2020年6月 2目 录 第5章 导数及其应用 5.1 导数的概念及意义 2 5.2 导数的运算 12 5.3 导数的应用 21 内容提要 36 复习题 37 第6章 计数原理 6.1 乘法原理与加法原理 40 6.2 排列 46 6.3 组合 57 6.4 计数原理在古典概率中的应用 66 6.5 二项式定理 69 内容提要 76 复习题 76 第7章 概率初步(续) 7.1 条件概率与相关公式 80 7.2 随机变量的分布与特征 89 7.3 常用分布 101 内容提要 112 复习题 113 1 书书书目录 第8章 成对数据的统计分析 8.1 成对数据的相关分析 116 8.2 一元线性回归分析 125 8.3 2×2列联表 138 内容提要 146 复习题 146 2第5章 导数及其应用 初等数学可以帮助我们对匀速运动进行描述和分析, 也能够顺利解决一些具有规则形状的物体的度量问题.然 而,人类在实际生活中所面临的问题往往更为复杂.例如, 运动中速度可以不断变化,图形的边界不再具有规则的形 状,等等.要处理这一类问题,本质上要有处理变化和变化 中的瞬时状态的数学工具,这就需要用到高等数学,特别 是微积分的知识. 由于系统深入地介绍高等数学的内容不是高中课程所 能承担的任务,因此本章将用比较直观和粗略的方式引入 微积分中的一个最基本的概念———导数,为研究函数性质 提供一个有力的工具,并展示其在解决变速运动等现实问 题中的一些应用. 由于知识基础不足且为了避免产生理解上的困难及误 导,本章中的某些结论没有给出证明,而仅作形式化的表 述.希望同学们对导数的基本内涵及其应用有所认识和体 会,并对未来在大学课程中继续深入学习微积分抱有渴望. 书书书5 导数及其应用 5.1 导数的概念及意义 在本节中,我们将学习如何刻画运动物体的瞬时速度,以及 如何确定一条曲线上一点处的切线,通过这些例子初步认识导数 这一表示函数瞬时变化率的数学概念. 1 导数的概念 当我们乘坐高铁时,常常会在车厢内看到如图511所示的 列车信息显示屏.如何理解图中“速度 303km/h”呢? 当物体作匀速运动时,运动的速度狏等于距离狊除以运动时 狊 间狋,即狏= .但是,如果一个作变速运动的物体在时间段狋内 图511 狋 的运动距离是狊,上面的公式所给出的只能是这段运动过程中运 狊 动物体的平均速度狏= . 狋 仅用一个时间段内的平均速度难以准确地描述在该时间段 内变速运动的过程.为了精准地描述变速运动,一个自然的想 法是把整个运动时间分割成若干个小的时间段,并分别求每个 时间段内的平均速度.可以想象,随着时间段的分割越来越精 细,利用分段的平均速度就可以越来越精确地对整个运动过程 进行描述. 以自由落体运动为例,已知物体下落的距离犱(单位:m)与 1 时间狋(单位:s)满足函数关系犱= 犵狋2 ,其中犵是重力加速度. 2 若近似地取犵=10m/s2 ,则犱=5狋2. 考虑从狋=1到狋=3(用区间符号记作[1,3])时间段内的自由 犱(3)-犱(1) 落体运动.它的平均速度是 =20(m/s).如果把这段 3-1 时间分成[1,2]与[2,3]两段,那么在这两个时间段内自由落体的平均 犱(2)-犱(1) 犱(3)-犱(2) 速度 分 别 是 =15(m/s)与 =25(m/s). 2-1 3-2 25.1 导数的概念及意义 而如果以0.5s为间隔把[1,3]分为4个时间段,可以得出这4个 时间段内的平均速度分别是12.5m/s、17.5m/s、22.5m/s与 27.5m/s.由此可见,随着时间段的不断细分,自由落体的运动 状态确实得到了越来越精确的描述.这种做法其实蕴含着“极限” 这个朴素而深刻的思想. 先把时间段分割,在越来越小的时间段内对运动进行分析, 再从整体上得到对运动状态越来越精确的描述,这就是被称为 “微积分”的数学工具给我们提供的解决此类问题的基本途径.在 这里,我们只介绍如何寻找适当的数学工具刻画运动物体在某一 时刻的瞬时速度.这里的瞬时速度指的是,运动物体在临近指定 时刻的某个时间段内的平均速度在时间段长度越来越小的变化过 程中所趋近于的一个稳定值.下面的例子展现了利用平均速度趋 近瞬时速度的过程. 例1 自由落体运动中,物体下落的距离犱(单位:m)与 时间狋(单位:s)近似满足函数关系犱=5狋2.试求物体在狋=2时 的瞬时速度. 解 对不同时间段长度值|犺|,狋=2附近时间段[2+犺,2] (犺<0)或者[2,2+犺](犺>0)内的平均速度为 犱(2+犺)-犱(2) 5×(2+犺) 2-5×22 狏= = , 犺 犺 左边的式子在犺>0 时是显然的.在犺<0 得到表51. 时,时间段[2+犺,2]上 的平均速度一开始应写 犱(2)-犱(2+犺) 表51 为 = |犺| 犱(2)-犱(2+犺) 犺(<0) [2+犺,2]上的狏 犺(>0) [2,2+犺]上的狏 ,它和 -犺 犺>0时一样,也可统一 -0.1 19.5 0.1 20.5 犱(2+犺)-犱(2) 地写为 . -0.01 19.95 0.01 20.05 犺 -0.001 19.995 0.001 20.005 -0.0001 19.9995 0.0001 20.0005 -0.00001 19.99995 0.00001 20.00005 … … … … 在表51中,我们通过不断缩小犺的绝对值,发现在犺趋近 于0时,平均速度趋近于一个确定的值20.因此,从表中数值我 们可以初步判断物体在狋=2时的瞬时速度为20m/s. 下面用数学的计算与推理证实我们的判断. 35 导数及其应用 当犺≠0时,狋=2附近时间段[2+犺,2](犺<0)或者[2,2+犺] (犺>0)的平均速度是 犱(2+犺)-犱(2) 5×(2+犺) 2-5×22 20犺+5犺2 狏= = = =20+5犺. 犺 犺 犺 因为当犺趋近于0时,狏趋近于20,所以物体在狋=2时的瞬时 速度为20m/s. 用瞬时速度的说法,图511中所示的高铁速度可解释为: 在9时30分的某一瞬间(列车信息屏的时间显示只精确到分,但 瞬时速度在时间上的精确度远高于分),列车以303km/h的瞬时 速度前进. 例1告诉我们,研究运动物体的瞬时速度,本质上就是在已知 函数关系狔=犳(狓)的前提下,对于自变量某个给定值狓,赋予狓 0 0 一个变化量犺,分析当犺趋近于0时,函数值的变化量 犳(狓+犺)-犳(狓) 犳(狓+犺)-犳(狓)相对于自变量变化量犺的比值 0 0 0 0 犺 是否趋近于某个稳定值. 犳(狓+犺)-犳(狓) 如果这个稳定值存在,就说明 0 0 在犺趋近 犺 犳(狓+犺)-犳(狓) 于0时有极限,并把这个极限值记作lim 0 0 ,称 犺 犺→0 为函数狔=犳(狓)在狓=狓 处的导数(derivative),记作犳′(狓), 0 0 即有 犳(狓+犺)-犳(狓) 犳′(狓)=lim 0 0 . 0 犺 犺→0 因此,在满足函数关系犱=犳(狋)的运动中,函数犱=犳(狋)在 狋=狋处的导数犳′(狋)就是狋时刻的瞬时速度. 0 0 0 犳(狓+犺)-犳(狓) 一般地,对于一个函数狔=犳(狓),通常将 0 0 称 犺 为函数狔=犳(狓)在以狓 和狓+犺为端点的区间上的平均变化率, 0 0 犳(狓+犺)-犳(狓) 而犳′(狓)=lim 0 0 就是函数狔=犳(狓)在狓=狓 处 0 犺 0 犺→0 的瞬时变化率.平均变化率反映了一个函数在一个区间上的平 均变化情况,而瞬时变化率则反映了该函数在某个自变量狓 0 处的瞬时变化情况. 45.1 导数的概念及意义 例2 已知在使用某种杀菌剂狋小时后室内的细菌数量为 犳(狋)=105+104狋-103狋2. (1)求犳′(10); (2)犳′(10)的实际意义是什么? 解 (1)当犺≠0时,在使用杀菌剂10小时附近的时间段 [10+犺,10](犺<0)或者[10,10+犺](犺>0)内,细菌数量关于时 间的平均变化率为 犳(10+犺)-犳(10) 犺 105+104 (10+犺)-103 (10+犺) 2-(105+104×10-103×102 ) = 犺 -104犺-103犺2 = 犺 = -104-103犺, 从而,令犺趋近于0,就得到 犳′(10)=lim(-104-103犺)=-104. 犺→0 (2)犳′(10)的实际意义是细菌数量在狋=10时的瞬时变化率. 它表明在狋=10附近,细菌数量大约以每小时104 的速率减少. 练习5.1(1) 1.自由落体运动中,物体下落的距离犱(单位:m)与时间狋(单位:s)近似满足函数关 系犱=5狋2. (1)求物体在[2,4]时间段内的平均速度; (2)求物体在狋=3时的瞬时速度; (3)求物体在狋=犪(犪>0)时的瞬时速度. 2.将石子投入水中,水面产生的圆形波纹不断扩散. (1)当半径狉从犪增加到犪+犺(犺>0)时,求圆周长相对于半径的平均变化率; (2)当半径狉=犪时,求圆周长相对于半径的瞬时变化率. 2 导数的几何意义 在上一节中谈到,在研究物体的变速运动时,我们可以通过 把时间分成若干个小的时间段,并计算每个时间段内物体的平均 55 导数及其应用 速度,以近似地描述物体的运动状况.当时间段的划分越来越细 时,对运动的描述就越来越精确.特别地,在一个时间点附近的 时间段长度越来越小时,如果相应的平均速度趋近于一个稳定 值,这个稳定值就是运动物体在这个时间点的瞬时速度. 在几何学中有类似的情境:为了研究一条曲线的特性,我们 可以把曲线划分成小段,并把连接每一小段两端点的线段看作曲 线的这一小段的近似.当曲线的划分越来越细时,由这些小线段 所连接起来的折线就越来越接近于原来的曲线. 我们把连接曲线上任意两点的直线称为该曲线的一条割线 (secantline).如图512,给定曲线上的一点犘,考虑以犘为 ︵ 端点的一条小曲线段犘犙和割线犘犙.像平均速度趋近于瞬时速 ︵ 度那样,当曲线段犘犙取得越来越短,即点犙越来越靠近点犘 时,如果割线犘犙趋近于一条确定的直线,那么我们就将这条 直线称为曲线在点犘处的切线(tangentline).就像瞬时速度是 物体在给定时刻的运动状态的最好描述一样,在点犘处的切线 是曲线在点犘附近性质的最好描述. 图512 切线这个术语我们并不陌生,在平面几何的学习中已定义过 圆的切线,并讨论过它的性质.那里所定义的圆的切线是否与上 面这个新定义一致呢? 例3 如图513,曲线狔=槡2-狓2 (-槡2≤狓≤槡2)是圆 狓2+狔2=2在狓轴及其上方的部分,犘(1,1)和犙(0,槡2)是该曲 线上的两点. (1)求割线犘犙的斜率; 图513 1 (2)对正整数狀,令狓=1- ,狔=槡2-狓2 ,犙(狓,狔) 狀 狀 狀 狀 狀 狀 狀 均在该圆周上,且随着狀的增大越来越接近点犘.借助信息技术 工具,适当地计算一些割线犘犙 的斜率,观察并总结当狀逐渐 狀 65.1 导数的概念及意义 增大时,割线犘犙 的斜率的变化趋势. 狀 解 (1)割线犘犙的斜率是 狔-狔 槡2-1 犽 = 犙 犘= =1-槡2. 犘犙 狓-狓 0-1 犙 犘 (2)割线犘犙 的斜率是 狀 ( ) ( ) 槡 1 2 2-1- -1 ( ) 狔 -狔 狔-狔 狀 槡 1 2 犽 = 犙 狀 犘= 狀 犘= =狀1- 2-1- . 犘犙 狓 -狓 狓-狓 1 狀 狀 犙 犘 狀 犘 1- -1 狀 狀 借助计算器或计算机可以得到表52中关于犽 的近似值(结果 犘犙 狀 精确到0.000000001): 表52 狀 犙 犽 狀 犘犙狀 1 (0.000000000,1.414213562) -0.414213562 5 (0.800000000,1.166190379) -0.830951895 10 (0.900000000,1.090871211) -0.908712115 100 (0.990000000,1.009900985) -0.990098525 1000 (0.999000000,1.000999001) -0.999000999 10000 (0.999900000,1.000099990) -0.999900010 100000 (0.999990000,1.000010000) -0.999990000 1000000 (0.999999000,1.000001000) -0.999999000 10000000 (0.999999900,1.000000100) -0.999999898 … … … 观察表52可知,当狀逐渐增大时,割线犘犙 的斜率逐渐 狀 减小,并趋近于-1. 由例3可以看出,根据现在的定义,曲线在点犘(1,1)处的 切线的斜率是-1,容易求得它的点斜式方程是狔-1=-(狓-1), 即狓+狔-2=0.另一方面,因为平面几何所定义的圆的切线垂直 → 于过切点的半径,即向量犗犘=(1,1)是切线的法向量,用直线的 点法式方程可求出切线的方程也是狓+狔-2=0.这就说明,对于 圆来说,两个切线的定义一致. 75 导数及其应用 对于任意曲线狔=犳(狓),如何从定义出发求它在点犘 (狓,犳(狓))处的切线? 0 0 例3给我们的启示是先求切线的斜率,且进一步揭示了斜率 的求法:如果记犳(狓)=槡2-狓2 ,那么 狔-狔 犳(狓+犺)-犳(狓) 犽 = 狀 犘= 0 0 , 犘犙 狓-狓 犺 狀 狀 犘 1 其中狓=1,犺=- .当狀增大时,犺趋近于0,犽 的稳定值就是 0 狀 犘犙 狀 犳(狓+犺)-犳(狓) lim 0 0 . 犺 犺→0 这个方法适用于一般情况.如图514,在曲线上点犘的附 图514 近取 一 点 犙(狓 +犺,犳(狓 +犺)), 割 线 犘犙 的 斜 率 0 0 犳(狓+犺)-犳(狓) 0 0 就是函数狔=犳(狓)在以狓 和狓+犺为端点的 犺 0 0 区间上的平均变化率.当点犙沿曲线趋近于点犘时,割线犘犙 的斜率趋近于某一稳定值,这个稳定值 犳(狓+犺)-犳(狓) lim 0 0 犺 犺→0 就是函数狔=犳(狓)在狓=狓 处的瞬时变化率犳′(狓).因此,函 0 0 数狔=犳(狓)在狓=狓 处的导数犳′(狓)就是曲线狔=犳(狓)在点 0 0 犘(狓,犳(狓))处 切 线 的 斜 率.从 而,函 数狔=犳(狓)在 点 0 0 犘(狓,犳(狓))处的切线方程为 0 0 狔-犳(狓)=犳′(狓)(狓-狓). 0 0 0 例4 已知犳(狓)=狓2 ,求曲线狔=犳(狓)在点犘(1,1)处 的切线方程. 解 先求曲线狔=犳(狓)在点犘(1,1)处切线的斜率犳′(1): 当犺≠0时, 犳(1+犺)-犳(1) (1+犺) 2-12 = =2+犺, 犺 犺 从而当犺趋近于0时, 犳′(1)=lim(2+犺)=2. 犺→0 因此,曲线狔=狓2 在点犘(1,1)处切线的斜率为2.于是,所求 切线方程为 85.1 导数的概念及意义 狔-1=2(狓-1), 即 狔=2狓-1. 例5 已知犳(狓)=狓3 ,求曲线狔=犳(狓)在点犘(0,0)处 的切线方程. 解 先求曲线狔=犳(狓)在点犘(0,0)处切线的斜率犳′(0): 当犺≠0时, 犳(犺)-犳(0)犺3-03 = =犺2 , 犺 犺 从而当犺趋近于0时, 犳′(0)=lim犺2=0. 犺→0 因此,曲线狔=狓3 在点犘(0,0)处切线的斜率为0.于是,所求 切线方程为 狔=0. 在例5中,函数狔=狓3 在狓=0处的导数为零,即曲线狔=狓3 在点犘(0,0)处的切线斜率为零,此时曲线的切线是一条水平直线. 通常,我们将导数为零的点称为函数的驻点(stationary 尝试寻找例3和 例4中函数的驻点. point),曲线在其驻点处的切线是一条水平直线.例如,狓=0是 函数狔=狓3 的驻点. 练习5.1(2) 1.已知犳(狓)=3狓2 ,分别求曲线狔=犳(狓)在点犘(-1,3)和点犙(1,3)处的切线方程. 2.借助函数图像,判断下列导数的正负(可利用信息技术工具): ( ) ( ) π 1 (1)犳′ ,其中犳(狓)=sin狓; (2)犳′(0),其中犳(狓)= 狓 . 4 2 习题5.1 犃组 1 1.自由落体运动的位移犱(单位:m)与时间狋(单位:s)满足函数关系犱= 犵狋2 (犵为 2 重力加速度). 95 导数及其应用 (1)分别求[4,4.1]、[4,4.01]、[4,4.001]这些时间段内自由落体的平均速度; (2)求狋=4时的瞬时速度; (3)求狋=犪(犪>0)时的瞬时速度; 5 (4)借助(3)的结果,求狋= 时的瞬时速度. 2 2.竖直向上发射的火箭熄火时上升速度达到100m/s,此后其位移犎(单位:m)与时 间狋(单位:s)近似满足函数关系犎=100狋-5狋2. (1)分别求火箭在[0,2]、[2,4]这些时间段内的平均速度; (2)求火箭在狋=2时的瞬时速度; (3)熄火后多长时间火箭上升速度为0? 3.某水管的流水量狔(单位:m3 )与时间狋(单位:s)满足函数关系狔=犳(狋),其中 犳(狋)=3狋. (1)求犳(狋)在狋=犪处的导数犳′(犪); (2)犳′(犪)的实际意义是什么? (3)随着犪的取值变化,犳′(犪)是否发生变化?为什么? 4.将石子投入水中,水面产生的圆形波纹不断扩散.计算: (1)当半径狉从犪增加到犪+犺(犺>0)时,圆面积相对于半径的平均变化率; (2)当半径狉=犪时,圆面积相对于半径的瞬时变化率. 5.函数狔=犳(狓)的图像如图所示. (1)求割线犘犙的斜率; (2)当点犙沿曲线向点犘运动时,割线犘犙的斜率会变大 还是变小? 6.已知犳(狓)=-狓2 ,求曲线狔=犳(狓)在下列各点处的切 线斜率,并说明这些斜率的值是如何随着自变量的变化而变 化的: (第5题) (1)狓=-2; (2)狓=-1; (3)狓=0; (4)狓=1; (5)狓=2. 7.借助函数图像,判断下列导数的正负: ( ) π (1)犳′- ,其中犳(狓)=cos狓; (2)犳′(3),其中犳(狓)=ln狓. 4 犅组 1.已知车辆启动后的一段时间内,车轮旋转的角度和时间(单位:秒)的平方成正比, 且车辆启动后车轮转动第一圈需要1秒. (1)求车轮转动前2秒的平均角速度; 1 05.1 导数的概念及意义 (2)求车轮在转动开始后第3秒的瞬时角速度. 2.根据导数的几何意义,求函数狔=槡4-狓2 在下列各点处的导数: (1)狓=-1; (2)狓=0; (3)狓=1. 3.已知函数狔=犳(狓)在狓=1处的切线方程为狔=4狓-3,求犳(1)和犳′(1). 4.如图,已知直线犾是曲线狔=犳(狓)在狓=3处的切线,求犳′(3). (第4题) 1 15 导数及其应用 5.2 导数的运算 在本章5.1节的学习中,我们已经了解到一个函数在某点处 导数的概念.从导数的定义中不难发现:给定函数狔=犳(狓),在 导数存在的前提下,对于不同的狓,总有一个确定的导数值 0 犳′(狓)与之对应.换句话说,如果用狓表示自变量,那么狔′= 0 犳′(狓)也是一个关于狓的函数.称为函数狔=犳(狓)的导函数 (derivedfunction,也简称为导数),其中 犳(狓+犺)-犳(狓) 犳′(狓)=lim . 犺 犺→0 求一个函数的导(函)数的过程常简称为求导. 如果能够求出函数狔=犳(狓)的导数狔′=犳′(狓),那么求该函 数在某点处导数的问题就可以通过简单的代入求值来解决. 1 基本初等函数的导数 根据导数的定义,可以求出一些基本初等函数的导数. 常数函数、幂函 例1 求常数函数狔=犆的导数. 数、指数函数、对数函 数、三角函数、反三角 函数被称为基本初等 解 记犳(狓)=犆.当犺≠0时, 函数. 犳(狓+犺)-犳(狓) 犆-犆 0 = = =0. 犺 犺 犺 因此,当犺趋近于0时,犳′(狓)=lim0=0. 犺→0 对于例1中的函数狔=犳(狓),坐标平面中的相应曲线狔= 犳(狓)是平行于狓轴的直线狔=犆,连接该直线上任何两点的割线 都是这条直线本身,从而该直线上任何一点处的切线也是这条直 线本身.由此可见,该直线上任何一点处的切线的斜率都是0, 即对任何给定的狓,都有犳′(狓)=0.由此推出犳′(狓)=0.这就 0 0 从导数的几何意义诠释了例1的结论. 类似的分析适用于函数狔=犽狓+犫.记犳(狓)=犽狓+犫.直线狔 =犽狓+犫上任何一点处的切线都是这条直线本身,从而都具有斜 率犽,即对任何给定的狓,都有犳′(狓)=犽.由此推出犳′(狓)=犽. 0 0 1 25.2 导数的运算 这个从几何上推出的结论也可用导数的定义来验证. 例2 求函数狔=犽狓+犫的导数. 解 记犳(狓)=犽狓+犫.当犺≠0时, 犳(狓+犺)-犳(狓)犽(狓+犺)+犫-(犽狓+犫)犽犺 = = =犽. 犺 犺 犺 因此,当犺趋近于0时,犳′(狓)=lim犽=犽. 犺→0 例3 求下列幂函数狔=犳(狓)的导数,其中: (1)犳(狓)=狓2 ; (2)犳(狓)=狓-1 ; (3)犳(狓)=狓1. 2 解 (1)当犺≠0时, 犳(狓+犺)-犳(狓) (狓+犺) 2-狓2 2狓犺+犺2 = = =2狓+犺. 犺 犺 犺 因此,当犺趋近于0时,犳′(狓)=lim(2狓+犺)=2狓. 犺→0 (2)当犺≠0时, 犳(狓+犺)-犳(狓) (狓+犺) -1-狓-1 狓-(狓+犺) -1 = = = . 犺 犺 狓(狓+犺)犺 狓(狓+犺) -1 1 因此,当犺趋近于0时,犳′(狓)=lim =- =-狓-2. 狓(狓+犺) 狓2 犺→0 (3)当犺≠0时, 犳(狓+犺)-犳(狓) 槡狓+犺-槡狓 = 犺 犺 (槡狓+犺-槡狓)(槡狓+犺+槡狓) = 犺(槡狓+犺+槡狓) 1 = . 槡狓+犺+槡狓 1 1 1 因此,当犺趋近于0时,犳′(狓)=lim = = 狓-1. 2 2 槡狓+犺+槡狓 2槡狓 犺→0 为了更便捷地处理求导问题,我们通常将以下基本初等函数 的导数作为公式使用: (1)(犆′)=0,犆为常数; 我们已经推导了 公式(1)以及公式(2) (2)(狓 α ′)=α狓 α-1 ,α为常数; 的一些特殊情况.如 果对这些公式的完整 (3)(e狓′)=e狓 ; 推导过程感兴趣,可 参阅高等数学的有关 1 (4)(ln狓′)= ; 教科书. 狓 (5)(sin狓′)=cos狓; (6)(cos狓′)=-sin狓. 1 35 导数及其应用 1 例4 已知函数狔=犳(狓),其中犳(狓)= .求犳′(2). 狓2 解 因为 ( ) 1′ 犳′(狓)= =(狓-2′)=-2狓-2-1=-2狓-3 , 狓2 所以 1 犳′(2)=-2×2-3=- . 4 例5 求正弦函数狔=sin狓的驻点. π 解 因为狔′=cos狓,而cos狓=0的解是狓=犽π+ (犽∈犣), 从函数图像上看, 2 这些驻点有什么特殊 性质? π 所以当且仅当狓=犽π+ (犽∈犣)时,正弦函数狔=sin狓的导数为 2 π 零,即正弦函数狔=sin狓的驻点为狓=犽π+ (犽∈犣). 2 练习5.2(1) 1.用导数的定义求函数狔=狓2+3狓-5的导数. 2.用公式求下列函数狔=犳(狓)的导数,其中: (1)犳(狓)=槡3狓2 ; (2)犳(狓)=狓 π . π 3.求余弦函数狔=cos狓在狓= 处的导数. 2 4.证明函数狔=ln狓与狔=e狓 没有驻点. 探究与实践 在我们熟悉的基本初等函数中,有哪些函数的图像存在水平切线?有哪些函数的图像 在所有点处切线的斜率均大于0?尝试从导数公式和函数图像两个角度进行探究. 2 导数的四则运算 基本初等函数可以通过四则运算产生新的初等函数.这些初 等函数的求导可以通过以下的“导数四则运算法则”归结为基本初 1 45.2 导数的运算 等函数的求导. 对函数狔=犳(狓)与狔=犵(狓),以下等式成立: (7)(犳(狓)±犵(狓)′)=犳′(狓)±犵′(狓); (8)(犳(狓)犵(狓)′)=犳′(狓)犵(狓)+犳(狓)犵′(狓); ( ) 犳(狓)′犳′(狓)犵(狓)-犳(狓)犵′(狓) (9) = ,其中犵(狓)≠0. 犵(狓) (犵(狓)) 2 用导数的定义可以推导出这些公式.这里只推导关于积的求 导公式(8),其余的留给有兴趣的同学自行完成. 由导数的定义, 犳(狓+犺)犵(狓+犺)-犳(狓)犵(狓) =犳(狓+犺)犵(狓+犺)-犳(狓)犵(狓+犺)+犳(狓)犵(狓+犺)-犳(狓)犵(狓) =[犳(狓+犺)-犳(狓)]犵(狓+犺)+犳(狓)[犵(狓+犺)-犵(狓)], 于是可得 犳(狓+犺)犵(狓+犺)-犳(狓)犵(狓) 犺 犳(狓+犺)-犳(狓) 犵(狓+犺)-犵(狓) = 犵(狓+犺)+犳(狓) . 犺 犺 所以,当犺趋近于0时,就有 (犳(狓)犵(狓)′)=犳′(狓)犵(狓)+犳(狓)犵′(狓). 例6 证明:对函数狔=犳(狓)与任何常数犆,都有 (10)(犆犳(狓)′)=犆犳′(狓). 证明 用积的求导公式和常数函数的求导公式,得到 (犆犳(狓)′)=(犆′)犳(狓)+犆犳′(狓)=犆犳′(狓). 例7 求下列函数狔=犳(狓)的导数,其中: 狓2 (1)犳(狓)=狓2sin狓; (2)犳(狓)= ; 狓+2 (3)犳(狓)=(狓-2) 2. 解 (1)用积的求导公式以及幂函数与正弦函数的求导公 式,得到 犳′(狓)=(狓2sin狓′)=(狓2′)sin狓+狓2 (sin狓′)=2狓sin狓+狓2cos狓. 1 55 导数及其应用 (2)用商的求导公式、和的求导公式以及幂函数与常数函数 的求导公式,得到 ( ) 狓2 ′ (狓2′)(狓+2)-狓2 (狓+2′) 2狓(狓+2)-狓2 狓2+4狓 犳′(狓)= = = = . 狓+2 (狓+2) 2 (狓+2) 2 (狓+2) 2 (3)先把函数表达式展开,得犳(狓)=狓2-4狓+4,再用和、 差的求导公式、公式(10)以及幂函数与常数函数的求导公式, 得到 犳′(狓)=(狓2′)-(4狓′)+(4′)=2狓-4. 1 例8 设实数犪>0且犪≠1,求证:(log狓′)= . 犪 狓ln犪 ln狓 证明 先用换底公式,有log狓= ,再由公式(10)以及 犪 ln犪 对数函数的求导公式,得到 ( ) ln狓′ 1 1 (log狓′)= = (ln狓′)= . 犪 ln犪 ln犪 狓ln犪 练习5.2(2) 求下列函数狔=犳(狓)的导数,其中: 2 (1)犳(狓)=3e狓-狓e+e; (2)犳(狓)=cos狓- ; 狓 (3)犳(狓)=(2狓+1) 3 ; (4)犳(狓)=槡狓sin狓; 1 狓2-1 (5)犳(狓)=狓ln狓- ; (6)犳(狓)= ; 狓2 狓 狓2-1 (7)犳(狓)= ; (8)犳(狓)=tan狓. 狓2+1 3 简单复合函数的导数 在本节例7第(3)小题中,为了求犳(狓)=(狓-2) 2 的导数,我们 先借助于完全平方公式将(狓-2) 2 化为狓2-4狓+4,再利用导数四则 运算法则求导.从另一个角度看,函数狔=(狓-2) 2 也可以看作由两 个函数狔=狌2 、狌=狓-2“套”在一起所构成的新函数.像这样,如果 一个函数狔=犳(狌)的自变量狌又是另一个变量狓的函数狌=犵(狓), 那么就可将狔直接看作变量狓的函数而得到一个新函数狔= 1 65.2 导数的运算 犳(犵(狓)),这个新函数被称为两个函数的复合函数(compositefunction). 在对复合函数求导数时,往往不是把两个预先给定的函数先 复合成较复杂的函数,然后直接求导,而是反过来,先引进一个 中间变量,把原来的函数看作两个相对简单的函数的复合,再利 用复合函数的求导法则求其导数,从而使求导过程得到简化.例 如,函数狔=(狓-2) 2 可看作由函数狔=狌2 与狌=狓-2复合而成, 而函数狔=sin2狓可看作由函数狔=sin狌与狌=2狓复合而成. 我们不讨论一般复合函数的求导问题,仅考虑由狔=犳(狌)与 狌=犪狓+犫(犪≠0)复合而成的狔=犳(犪狓+犫)型复合函数的求导法则. 因为当犺≠0时,有 犳(犪(狓+犺)+犫)-犳(犪狓+犫) 犳(狌+犪犺)-犳(狌) =犪· , 犺 犪犺 且注意到犺趋近于0当且仅当犪犺趋近于0,所以 犳(犪(狓+犺)+犫)-犳(犪狓+犫) 犳(狌+犪犺)-犳(狌) lim =犪lim . 犺 犪犺 犺→0 犪犺→0 这就给出了狔=犳(犪狓+犫)型复合函数的如下求导法则: (11)(犳(犪狓+犫)′)=犪犳′(狌),其中狌=犪狓+犫. 例9 求狔=ln(2-5狓)的导数. 解 将狔=ln(2-5狓)看作由狔=ln狌与狌=2-5狓复合而 成,则 5 5 狔′=-5(ln狌′)=- = . 狌 5狓-2 例10 设实数犪>0且犪≠1,求证:(犪狓′)=犪狓ln犪. 证明 因为犪狓=eln犪狓 =e狓ln犪 ,可以把狔=e狓ln犪 看作由狔=e狌 与狌=狓ln犪复合而成,所以 狔′=(e狌′)ln犪=e狌ln犪=e狓ln犪ln犪=犪狓ln犪, 即(犪狓′)=犪狓ln犪. 练习5.2(3) 1.利用狔=犳(犪狓+犫)型复合函数的求导法则求下列函数的导数: (1)狔=(3-2狓) 2 ; (2)狔=sin2狓. 1 2.尝试用两种不同的方法求狔= 的导数. 2狓-1 1 75 导数及其应用 3.求曲线狔=21-3狓 在点(0,2)处的切线方程. 4.求下列函数的导数: ln(2狓+1) (1)狔=3狓槡2-狓; (2)狔= . 狓 探究与实践 按以下步骤探究复合函数求导的一般规律: 1.分别求狔=(狓3-2) 2 、狔=狌2 与狌=狓3-2的导数,并探索三个导数之间的联系; 2.分别求狔=sin2狓+sin狓-1、狔=狌2+狌-1与狌=sin狓的导数,并探索三个导数 之间的联系; 3.根据上述两个特例,猜想复合函数求导的一般规律,并用一些实例验证你的猜想. 习题5.2 犃组 1.求下列函数狔=犳(狓)的导数: (1)犳(狓)=π; (2)犳(狓)=槡3狓5 ; 1 (3)犳(狓)= . 狓3 π 2.求曲线狔=cos狓在狓= 处的切线方程. 2 3.已知曲线狔=狓3 在原点以外某点犘处切线的斜率为犪. (1)求点犘的坐标; (2)判断犪的正负. 4.求曲线狔=狓3-3狓+5平行于狓轴的切线及其切点坐标. 1 5.求曲线狔= 平行于直线狔=-狓的切线及其切点坐标. 狓 6.求下列函数狔=犳(狓)的导数: (1)犳(狓)=2狓e-e2 ; (2)犳(狓)=e狓cos狓; 狓-1 ln狓 (3)犳(狓)= ; (4)犳(狓)= . 狓-2 sin狓 7.用两种方法求函数狔=(狓-2)(3-4狓)的导数. 1 85.2 导数的运算 8.已知函数狔=犳(狓)与狔=犵(狓)满足条件犳(1)=2,犳′(1)=3,犵(1)=4与犵′(1)=5. 对于下列函数狔=犺(狓),求犺(1)和犺′(1): 1 1 (1)犺(狓)=2犵(狓)- 犳(狓); (2)犺(狓)=2犵(狓)犳(狓)- ; 3 3 2犵(狓)-1 (3)犺(狓)= . 3犳(狓) 9.利用狔=犳(犪狓+犫)型复合函数的求导法则,求下列函数的导数: 狓 (1)狔=槡2狓-5; (2)狔=cos ; 2 1 (3)狔= . e狓+1 2 10.用两种方法求函数狔= 的导数. 狓-1 11.某种动物的体温犜(单位:℃)与太阳落山后经过的时间狋(单位:min)满足函数关 120 系犜= +15. 狋+5 (1)当狋=5时,求该动物体温的瞬时变化率; (2)在哪一时刻该动物体温的瞬时变化率是-2℃/min?(结果精确到0.1min) 12.已知某港口一天内潮水的深度狔(单位:m)与时间狋(单位:h)近似满足函数关系 ( ) π 5π 狔=3sin 狋+ ,0≤狋≤24.分别求上午6时与下午6时潮水涨(落)的速度. 12 6 犅组 1.已知一列火车从静止开始加速的一段时间内,其行驶速度狏(单位:m/s)与行驶时 间狋(单位:s)满足函数关系狏=0.4狋+0.6狋2. (1)求这段时间内火车行驶的加速度; (2)火车行驶到哪一时刻,其加速度为4m/s2 ? 2.直线狔=-狓+犫是下列函数的切线吗?如果是,请求出犫的值;如果不是,请说 明理由. 1 (1)狔=ln狓; (2)狔= . 狓 3.吹一个球形的气球时,气球半径狉将随空气容量犞的增加而增大. (1)写出气球半径狉关于气球内空气容量犞的函数表达式; (2)求犞=1时,气球的瞬时膨胀率(即气球半径关于气球内空气容量的瞬时变化率). 4.判断下列求导结果是否正确.如果不正确,请指出错在哪里,并予以改正. 1 95 导数及其应用 ( ) sin狓′ 1 cos狓 1 (1) =- sin狓- ; (2)(ln(2-狓)′)= . 狓 狓2 狓 2-狓 5.求过点(0,-1)且与曲线狔=2狓2 相切的直线的方程. 6.已知一罐汽水放入冰箱后的温度狓(单位:℃)与时间狋(单位:h)满足函数关系 狓=4+16e-2狋. (1)求狓′(1),并解释其实际意义; 5 (2)已知摄氏度狓与华氏度狔(单位:)满足函数关系狓= (狔-32),求狔关于狋的 9 导数,并解释其实际意义. 7.求下列函数狔=犳(狓)的导数,其中: 2 e狓-e-狓 (1)犳(狓)=狓2sin3狓- ; (2)犳(狓)= . 槡狓 e狓+e-狓 2 05.3 导数的应用 5.3 导数的应用 在对函数的研究中,单调性与极大(小)值、最大(小)值是重 要的主题之一.但限于初等数学所能提供的工具,在很多常见函 数面前,我们往往束手无策,而导数则为我们研究函数的这些性 质提供了通用和便捷的手段. 本章引入的定理大多需要高等数学的知识才能严格证明,但 同学们可以借助一些熟悉的函数(如二次函数)来验证这些结论的 合理性. 1 利用导数研究函数的单调性 函数的单调性研究的是在一个区间内函数是否严格增或严格减, 即函数值是否随着自变量的增大而增大,或随着自变量的增大而减 小.导数是函数的瞬时变化率,反映了在自变量发生变化的瞬间,函 数值随之发生的增减变化,因此,导数是研究函数单调性的最佳工 具.特别地,从导数的正负就可以直接判断函数的单调性: 定理 在区间犐上,若犳′(狓)>0,则函数狔=犳(狓) 对一些你熟悉的 函数,借助信息技术 在该区间严格增;若犳′(狓)<0,则函数狔=犳(狓)在该区 工具,从数值和图像 两个角度进行尝试, 间严格减. 获得的结论一致吗? 在导数值都存在的情况下,导数值由正变负或由负变正的过 程中会出现导数等于零的点,即函数的驻点.因此,要把函数的单 调增区间和单调减区间划分出来,就要先找到函数的驻点.找到驻 点后,再看驻点两侧导数值的正负是否发生变化,如果发生变化 了,此驻点就成为单调增区间与单调减区间的分界点. 例1 已知犳(狓)=狓2-4狓+2,求函数狔=犳(狓)的单调 区间. 解 先求函数的驻点:犳′(狓)=2狓-4.令犳′(狓)=0,解得 2 15 导数及其应用 狓=2.此函数只有一个驻点. 当狓>2时,犳′(狓)>0,函数狔=犳(狓)严格增; 当狓<2时,犳′(狓)<0,函数狔=犳(狓)严格减. 因此,函数狔=犳(狓)的单调增区间为(2,+∞),单调减区 间为(-∞,2). 用已经学过的二 次函数知识验证这个 结果. 例2 已知犳(狓)=狓3+狓2-狓-1,求函数狔=犳(狓)的 单调区间. 解 对函数求导,得犳′(狓)=3狓2+2狓-1.令犳′(狓)=0, 1 解得狓=-1,狓= .此函数有两个驻点. 1 2 3 1 当狓<-1或狓> 时,犳′(狓)>0,函数狔=犳(狓)严格增; 利用信息技术工 3 具绘制这个函数的图 像以验证结果. 1 当-1<狓< 时,犳′(狓)<0,函数狔=犳(狓)严格减. 3 ( ) 1 因此,函数狔=犳(狓)的单调增区间为(-∞,-1)及 ,+∞ , 3 ( ) 1 单调减区间为 -1, . 3 注意,有时驻点并不是单调增区间与单调减区间的分界点. 例3 已知犳(狓)=狓3 ,求函数狔=犳(狓)的单调区间. 此例表明,犳′(狓) >0并不是函数在一 解 对函数求导,得犳′(狓)=3狓2.令犳′(狓)=0,解得 个区间上严格增的必 要条件. 狓=0,所以此函数在狓=0时有唯一的驻点.但是,由于永远成 立犳′(狓)≥0,驻点两侧导数值的正负没有发生变化,因此该驻 点不是单调区间的分界点.此函数的单调增区间为(-∞,+∞). 在讨论中,我们也要注意函数没有定义的点.这样的点也可 能成为单调增区间与单调减区间的分界点. 例4 已知犳(狓)=狓-2 ,求函数狔=犳(狓)的单调区间. 解 该函数在狓=0处没有定义.当狓≠0时,犳′(狓)= -2狓-3 ,因为方程犳′(狓)=0无解,所以函数狔=犳(狓)没有驻点. 但当狓>0时,犳′(狓)<0,犳(狓)严格减;当狓<0时,犳′(狓)>0, 犳(狓)严格增.可见,函数狔=犳(狓)的单调增区间为(-∞,0),单 调减区间为(0,+∞),而其分界点恰是该函数没有定义的点. 上面我们用导数值的正负来判断函数在某区间上的单调性. 2 25.3 导数的应用 除此之外,导数值还可用以判断函数变化速度的快慢:导数 犳′(狓)是函数狔=犳(狓)在点狓 处的切线的斜率,它描述了曲线 0 0 狔=犳(狓)在点狓 附近相对于狓轴的倾斜程度:当犳′(狓)>0 0 0 时,犳′(狓)越大,曲线狔=犳(狓)在点狓 附近相对于狓轴倾斜程 0 0 度越大,函数值狔=犳(狓)递增得越快;而当犳′(狓)<0时, 0 犳′(狓)越小,曲线狔=犳(狓)在点狓 附近相对于狓轴倾斜程度越 0 0 大,函数值狔=犳(狓)递减得越快.总之,导数的绝对值越大,函 数图像就越“陡峭”,也就是函数值的变化速度越快. 例5 已知在区间(0,1)上犳′(狓)>1.在图531所示的 图像中,哪些有可能表示函数狔=犳(狓)?为什么? (1) (2) (3) (4) 图531 解 在区间(0,1)上,因为犳′(狓)>1,所以函数图像中每一 点处切线的斜率都应大于1.在图531中,由观察可知: 图(1)中的曲线越来越“陡峭”,在区间(0,1)上各点处的切线 斜率始终大于1; 图(2)中的曲线由“陡峭”变得“平缓”,在区间(0,1)的右半段 的切线斜率小于1; 图(3)中的曲线由“平缓”变得“陡峭”,在区间(0,1)的左半段 的切线斜率小于1; 图(4)中的曲线越来越“平缓”,在区间(0,1)上各点处的切线 斜率始终小于1. 因此,只有图531(1)中的图像有可能表示函数狔=犳(狓). 练习5.3(1) 1.利用导数研究下列函数的单调性,并说明所得结果与你之前的认识是否一致: (1)狔=e狓 ; (2)狔=ln狓; (3)狔=犪狓2+犫狓+犮,其中犪≠0. 2.确定下列函数的单调区间: (1)狔=狓e狓 ; (2)狔=4狓3-9狓2+6狓+7. 2 35 导数及其应用 2 利用导数研究函数的极值 观察图532中函数狔=犳(狓)的图像,其中有一些特殊的 点,在这些特殊点的左右两侧附近,函数的单调性发生了改变. 例如,函数在点(狓,犳(狓))的左侧附近严格增,右侧附近严格 1 1 减,此处出现了一个“山峰”;又如,函数在点(狓,犳(狓))的左 2 2 侧附近严格减,右侧附近严格增,此处出现了一个“山谷”. 图532 换句话说,在狓=狓 附近存在一个小区间,该区间内其他自变 1 量所对应的函数值都不大于犳(狓),此时,就说函数狔=犳(狓)在 1 狓=狓处取得极大值犳(狓),而点狓称为函数狔=犳(狓)的极大值点. 1 1 1 类似地,在狓=狓附近存在一个小区间,该区间内其他自变量所对 2 应的函数值都不小于犳(狓),此时,就说函数狔=犳(狓)在狓=狓 处 2 2 取得极小值犳(狓),而点狓称为函数狔=犳(狓)的极小值点. 2 2 因此,图532所示的函数有三个极大值点狓、狓、狓, 1 3 5 还有三个极小值点狓、狓、狓. 2 4 6 极大值和极小值统称为极值,而极大值点和极小值点则统称 为极值点. 在导数都存在的前提下,极值点一定是相应函数单调增区间 及单调减区间的分界点,从而是函数的驻点,函数曲线在该点的 切线是水平的.但反过来,我们却不能说一个函数的驻点一定是 其极值点.例如,在函数狔=狓3 中,点狓=0虽是其驻点,但不 是极值点,因为这个函数在整个区间(-∞,+∞)上是严格增的. 因此,要找到函数狔=犳(狓)的极值点,通过犳′(狓)=0找到驻 0 点狓=狓 只是第一步,还要根据驻点附近犳′(狓)的符号才能断定 0 狓 是否为犳(狓)的极值点. 0 2 45.3 导数的应用 具体地说,我们有如下定理: 定理 设点狓=狓 是函数狔=犳(狓)的驻点. 0 (1)若在点狓 的左侧附近有犳′(狓)>0,而在狓 的右 0 0 侧附近有犳′(狓)<0,则函数狔=犳(狓)在狓 处取得极大值; 0 (2)若在点狓 的左侧附近有犳′(狓)<0,而在狓 的右 0 0 侧附近有犳′(狓)>0,则函数狔=犳(狓)在狓 处取得极小值. 0 例6 已知犳(狓)=-狓2+6狓-1,求函数狔=犳(狓)的单调 区间和极值. 解 对函数求导,得犳′(狓)=-2狓+6.令犳′(狓)=0,解得 狓=3,从而狓=3为函数狔=犳(狓)的唯一驻点.把该驻点与其两 侧的区间列表如下: 把驻点与驻点所 表53 划分的区间列表,可以 简明清晰地呈现函数 狓 (-∞,3) 3 (3,+∞) 的增减情况和极值点. 犳′(狓) + 0 - 犳(狓)  极大值8  因此,狔=犳(狓)在区间(-∞,3)内严格增,在区间(3,+∞) 内严格减,在狓=3处取得极大值犳(3)=8. 例7 求正弦函数狔=sin狓的单调区间和极值. 解 这是一个周期为2π的周期函数.记犳(狓)=sin狓,求导 π 可得犳′(狓)=cos狓.令犳′(狓)=0,解得狓=2犽π± ,犽∈犣.将不 2 同驻点及其所划分出的区间在一个周期上的情况列表如下: 表54 ( ( π π 2犽π- , 2犽π+ , π 2 π 2 π 狓 2犽π- ) 2犽π+ )2(犽+1)π- 2 π 2 π 2 2犽π+ 2(犽+1)π- 2 2 犳′(狓) 0 + 0 - 0 犳(狓)极小值-1  极大值1  极小值-1 因此,对任意给定的犽∈犣,正弦函数狔=sin狓在区间 2 55 导数及其应用 ( ) ( ) π π π π 2犽π- ,2犽π+ 内严格增,在区间 2犽π+ ,2(犽+1)π- 2 2 2 2 π π 内严格减,在狓=2犽π- 时取得极小值-1,在狓=2犽π+ 时取 2 2 得极大值1. 1 例8 已知犳(狓)= 狓3-狓+2,求函数狔=犳(狓)的单调 3 区间和极值. 解 对函数求导,得犳′(狓)=狓2-1.令犳′(狓)=0,解得两 个驻点狓=-1,狓=1.列表如下: 1 2 表55 狓 (-∞,-1) -1 (-1,1) 1 (1,+∞) 犳′(狓) + 0 - 0 + 8 4 犳(狓)  极大值  极小值  3 3 因此,函数狔=犳(狓)的单调增区间为(-∞,-1)及(1,+∞), 单调减区间为(-1,1).狔=犳(狓)在狓=-1处取得极大值犳(-1)= 8 4 ,在狓=1处取得极小值犳(1)= . 3 3 练习5.3(2) 1.求余弦函数狔=cos狓的单调区间和极值. 2.求函数狔=狓3-3狓的单调区间和极值. 3 利用导数研究函数的最值 在许多理论和现实的问题中,常常需要求函数的最大值或者 最小值(统称为最值).最值反映了函数在定义域上整体的情况, 而极值则仅考虑函数在某点附近的局部特征.有时最值和极值是 一致的,如函数狔=sin狓;但有时却不一致,如图532所示的 函数.当然,一个函数的极值与最值可能都不存在,如函数 狔=狓3.但是,如果考虑一个在闭区间上的连续函数,函数的最 大值与最小值一定存在. 上面所说的一个区间犐上的连续函数,可以直观地理解为在 2 65.3 导数的应用 区间犐上图像为一条连绵不断的曲线的函数.更精确及普适的连续 函数的定义,要用到严格的极限语言,在高等数学中才能给出. 例9 已知犳(狓)=-狓2+6狓-1,求函数狔=犳(狓)在区 间[0,7]上的最大值与最小值. 解 由本节例6可知,函数狔=-狓2+6狓-1的驻点为狓=3, 比较犳(3)=8,犳(0)=-1,犳(7)=-8,可知该函数在[0,7]上的 最大值是8,最小值是-8,如图533所示. 在例9中,我们对驻点处与区间两端点处的函数值进行比 图533 较,其中最大的就是最大值,最小的就是最小值.在导数存在的 前提下,闭区间上的连续函数的最值原则上都可以按照这样的方 为什么只要比较 法求出. 这几个点的函数值(甚 至不必分析驻点是不 1 是极值点),就可以求 例10 已知犳(狓)= 3 狓3-狓+2,求函数狔=犳(狓)在 出最值? [0,3]上的最大值与最小值. 1 解 由本节例8可知,函数狔= 狓3-狓+2的两个驻点为 3 狓=-1,狓=1. 1 2 由于驻点狓 =-1不在区间[0,3]内,因此只需比较 1 4 1 犳(1)= ,犳(0)=2,犳(3)=8,可知函数狔= 狓3-狓+2在 3 3 4 [0,3]上的最大值是8,最小值是 . 3 4 利用导数研究二次函数 导数为研究函数的单调性、极值与最值提供了有力的工具. 利用这一工具,我们可以对熟悉的二次函数狔=犪狓2+犫狓+犮 (犪≠0)进行回顾和再认识.以下仅讨论犪>0的情况,犪<0的情 况也可以用类似的方法获得相应的结果. 首先,可以利用导数的正负来判断函数狔=犪狓2+犫狓+犮(犪>0) 的单调性,同时求出它的极值. 记犳(狓)=犪狓2+犫狓+犮.对该函数求导,可得犳′(狓)=2犪狓+犫, 犫 令犳′(狓)=0,解得函数有唯一驻点狓=- .可以列表如下: 0 2犪 2 75 导数及其应用 表56 ( ) ( ) 犫 犫 犫 狓 -∞,- - - ,+∞ 2犪 2犪 2犪 犳′(狓) - 0 + 4犪犮-犫2 犳(狓)  极小值  4犪 ( ) 犫 因此,函数狔=犳(狓)的单调减区间为 -∞,- ,单调增 2犪 此处所得结果与你 ( ) 之前的认识是否一致? 方法是不是更简便? 犫 犫 区间为 - ,+∞ .狔=犳(狓)在狓=- 处取得极小值 2犪 0 2犪 ( ) 犫 4犪犮-犫2 犳- = .这个极小值也是该函数在区间(-∞,+∞) 2犪 4犪 上的最小值. 知道了该函数的单调区间之后,结合函数的零点,就可以解 决相应的不等式问题. 我们已经知道,求二次函数狔=犪狓2+犫狓+犮(犪>0)的零点, 就是求一元二次方程犪狓2+犫狓+犮=0(犪>0)的实根. 令Δ=犫2-4犪犮,我们已知:当Δ>0时,方程有两个不相等 -犫-槡犫2-4犪犮 -犫+槡犫2-4犪犮 的实根狓= ,狓= ;当 Δ=0 1 2犪 2 2犪 犫 时,方程有两个相等的实根狓=狓=- ;当Δ<0时,方程无 1 2 2犪 实根. 上述方程犪狓2+犫狓+犮=0的实根就是函数狔=犪狓2+犫狓+犮 的零点;再结合函数狔=犳(狓)的单调性,我们就可以求得使 犳(狓)≥0(或犳(狓)≤0)的 狓 的 取 值 范 围, 也 就 是 不 等 式 犪狓2+犫狓+犮≥0(或犪狓2+犫狓+犮≤0)的解集. 记犳(狓)=犪狓2+犫狓+犮.为了解不等式犪狓2+犫狓+犮≥0(犪>0), 可以分以下三种情况讨论: (1)当Δ>0时,比较函数零点与驻点的大小关系,有 -犫-槡犫2-4犪犮 -犫+槡犫2-4犪犮 狓= <狓<狓= . 1 2犪 0 2 2犪 因为狔=犳(狓)在区间(-∞,狓)上严格减,所以 0 2 85.3 导数的应用 当狓∈(-∞,狓)时,犳(狓)>犳(狓)=0; 1 1 当狓∈(狓,狓)时,犳(狓)<犳(狓)=0. 1 0 1 同样地,因为狔=犳(狓)在区间(狓,+∞)上严格增,所以 0 当狓∈(狓,狓)时,犳(狓)<犳(狓)=0; 0 2 2 当狓∈(狓,+∞)时,犳(狓)>犳(狓)=0. 2 2 4犪犮-犫2 此外,犳(狓)=犳(狓)=0,犳(狓)= <0. 1 2 0 4犪 因此, 该不等式的解 集 为 (- ∞,狓]∪ [狓,+ ∞), ( ) 1 2 ] [ -犫-槡犫2-4犪犮 -犫+槡犫2-4犪犮 即 -∞, ∪ ,+∞ . 2犪 2犪 犫 (2)当Δ=0时,有狓=狓=狓=- ,由函数单调性可 1 2 0 2犪 知,当狓∈(-∞,+∞)时,均有犳(狓)≥犳(狓)=犳(狓)= 0 1 犳(狓)=0.因此,该不等式的解集为犚. 2 (3)当Δ<0时,由函数单调性可知,当狓∈(-∞,+∞) ( ) 犫 4犪犮-犫2 时,均有犳(狓)≥犳(狓)=犳- = >0.因此,该不等 0 2犪 4犪 式的解集为犚. 综合以上分 ( 析可得:当Δ>0时,不等式犪狓2+犫狓+犮≥ ) 0 ] [ -犫-槡犫2-4犪犮 -犫+槡犫2-4犪犮 (犪>0)的解集为 -∞, 2犪 ∪ 2犪 ,+∞ ; 知道了函数的单调 性和零点,相应的不等 式问题就迎刃而解了. 当Δ≤0时,该不等式的解集为犚.这就很方便地得到必修课程 第2章中的相应结论. 练习5.3(3) 1.判断下列说法是否正确,并说明理由: (1)函数在某区间上的极大值不会小于它的极小值; (2)函数在某区间上的最大值不会小于它的最小值; (3)函数在某区间上的极大值就是它在该区间上的最大值; (4)函数在某区间上的最大值就是它在该区间上的极大值. 2.求函数狔=狓2-6狓+5,狓∈[1,4]的值域. 熿 3 燄 3.求函数狔=狓3-3狓在区间 - ,0 上的最大值与最小值. 燀 2 燅 2 95 导数及其应用 5 利用导数解决实际问题 前面已经看到,导数可用来研究函数在某区间上的最大 (小)值,从而对解决何时利润最大、何时用料最省等优化问 题发挥着重要作用. 例11 图534是一张边长为3的正方形硬纸板,先在 它的四个角上裁去边长为狓的四个小正方形,再折叠成无盖纸 盒.当裁去的小正方形边长狓发生变化时,纸盒的容积犞会随 之发生变化.当狓在什么范围内变化时,容积犞随着狓的增大 而增大?当狓在什么范围内变化时,容积犞随着狓的增大而减 小?当狓取何值时,容积犞最大?最大值是多少?(纸板厚度 忽略不计) 图534 解 由题意,得 ( ) 3 犞(狓)=狓(3-2狓) 2 ,狓∈ 0, . 2 求导可得 犞′(狓)=12狓2-24狓+9. 1 3 为求驻点,令12狓2-24狓+9=0,得狓= 与狓= ,后者不 1 2 2 2 在定义域内,舍去. ( ) ( ) 1 1 3 容易算出,当狓∈ 0, 时,犞′(狓)>0;当狓∈ , 时, 2 2 2 1 犞′(狓)<0.因此,当狓在0到 之间变化时,容积犞随着狓的 2 1 3 增大而增大;当狓在 到 之间变化时,容积犞随着狓的增大而 2 2 3 05.3 导数的应用 ( ) 1 1 减小;而当狓= 时,容积犞 =2是极大值,也是最大值. 2 2 例12 已知某商品的成本犆与产量狇满足函数关系犆= 1 经济学中通常将 犆(狇),其中犆(狇)=100+ 4 狇2 ,并定义平均成本为犆=犆(狇), 犆′(狇)称为边际成本, 它代表产量为狇时, 犆(狇) 增加单位产量需付出 其中犆(狇)= . 的成本增加量. 狇 (1)比较犆′(10)和犆′(20),解释两者的大小代表了怎样的 实际意义; (2)当产量为多少时,平均成本最少? 1 解 (1)因为犆′(狇)= 狇,所以犆′(10)=5,犆′(20)=10, 2 有犆′(10)<犆′(20). 犆′(10)=5代表当产量为狇=10时,增加单位产量需付出的 成本增加量为5;而犆′(20)=10代表当产量为狇=20时,增加 单位产量需付出的成本增加量为10. 犆(狇) 100 狇 100 1 (2)平均成本犆(狇)= = + ,犆′(狇)=- + . 狇 狇 4 狇2 4 令犆′(狇)=0,得狇2=400,根据实际意义,可知狇>0,因 此,狇=20是其驻点. 当0<狇<20时,犆′(狇)<0,函数犆=犆(狇)严格减;而当狇> 20时,犆′(狇)>0,函数犆=犆(狇)严格增.因此,当产量狇=20时, 平均成本最少. 例13 如图535,将一根直径为犱的圆木锯成截面为 矩形的梁.问:矩形的高犺和宽犫应如何选择,才能使梁的抗弯 1 强度犠= 犫犺2 最大? 6 1 解 根据题意,可知犺2=犱2-犫2 ,所以犠(犫)= 犫(犱2-犫2 ), 6 图535 0<犫<犱. 1 1 槡3 求导,得犠′(犫)= 犱2- 犫2.令犠′(犫)=0,得到驻点犫= 犱. 6 2 3 槡3 由问题的实际意义,当犫= 犱时,梁的抗弯强度最大,此 3 2 槡6 时,犺2=犱2-犫2= 犱2 ,即犺= 犱. 3 3 3 15 导数及其应用 在很多情形下(如例11与例13),由实际问题本身的意义, 可知函数在区间内部必定存在最大值(或最小值),而区间内部只 有一个驻点,由此即可断定:该函数在区间内部的唯一驻点处取 得最大值(或最小值). 例14 一艘船航行所需的燃料费与船速的平方成正比.如 果船速是10km/h,那么每小时的燃料费是80元.已知该船航行 的其他费用为每小时480元,在100km的航程中,保持怎样的船 速可使航行总费用最少?(结果精确到1km/h) 解 设当船速为狓(km/h)时,每小时所需燃料费为犽狓2 元. 4 根据题意,当狓=10时,犽狓2=100犽=80,从而解得犽= . 5 因此,船在100km航程中的总费用为 ( ) 100 4 48000 狔=犳(狓)= 狓2+480 =80狓+ ,狓>0. 狓 5 狓 48000 求导,得犳′(狓)=80- ,令犳′(狓)=0,得狓=10槡6是唯 狓2 一驻点.当0<狓<10槡6时,犳′(狓)<0,函数狔=犳(狓)严格减; 而当狓>10槡6时,犳′(狓)>0,函数狔=犳(狓)严格增.因此,函数 狔=犳(狓)在狓=10槡6≈24(km/h)处取得最小值. 所以,在100km的航程中,保持约24km/h的船速可使航 行总费用最少. 练习5.3(4) 1.某商品的成本犆和产量狇满足函数关系犆=50000+200狇,该商品 1 的销售单价狆和产量狇满足函数关系狆=24200- 狇2.问:要使利润最 5 大,应如何确定产量? 2.采矿、采石或取土时,常用炸药包进行爆破,部分爆破呈圆锥漏 斗形状(如图),已知圆锥的母线长是炸药包的爆破半径犚,它的值是固 (第2题) 定的.问:炸药包埋多深可使爆破体积最大? 3 25.3 导数的应用 习题5.3 犃组 1.利用导数研究下列函数的单调性,并说明结果与你之前的认识是否一致: ( ) 1 狓 (1)狔= ; (2)狔=log狓. e 1 e ( ) 1 π π 2.利用导数判断函数狔= ,狓∈ - , 的单调性,并求出极值. cos狓 2 2 3.某函数图像如图所示,它在[犪,犫]上哪一点处取得最大值?它是极大值点吗?在哪 一点处取得最小值?它是极小值点吗? (第3题) 4.求下列函数的单调区间、极值点和极值: 1 (1)狔=狓2+2狓+3; (2)狔=狓+ ; 狓 (3)狔=3狓-狓3 ; (4)狔=狓2e狓. 5.证明:函数狔=狓3+4狓在(-∞,+∞)上严格增. 6.求函数狔=-狓3+12狓-1的单调减区间. 1 7.证明:函数狔=狓- 没有极值点. 狓 8.求函数狔=-狓3+12狓-1,狓∈[0,3]的值域. 犅组 1.判断下列函数在(-∞,+∞)上是否存在驻点,是否存在极值点,并说明理由: (1)狔=狓狀 ,狀为正奇数; (2)狔=狓狀 ,狀为正偶数. 2.已知函数狔=狓3+2犿狓2-狀狓+犿在狓=1处有极值0,求犿+狀的值. 3 35 导数及其应用 3.用长为18m的钢条制作一个如图所示的长方体框架.已知长方 体的长宽比为2∶1,问:该长方体的长、宽、高各为多少时,其体积 最大?最大体积是多少? 4.某分公司经销一品牌产品,每件产品的成本为4元,且每件产品 (第3题) 需向总公司交3元的管理费,预计当每件产品的售价为狓元(8≤狓≤11) 时,一年的销售量为(12-狓) 2 万件.问:当每件产品的售价为多少元时,该分公司一年的 利润犔最大?(结果精确到1元) 课后阅读 微 积 分 简 史 17世纪,两位科学巨匠伽利略(G.Galilei)和开普勒(J.Kepler)的一系列发现导致了 数学从古典数学向现代数学的转折.自然科学,特别是天文学和力学等学科的发展都需要 一种新的数学工具来研究运动和变化的过程,这促成了微积分的发明和发展. 朴素的积分学思想其实可以追溯到古希腊时代,在中国古代的数学中也有其踪迹,但 直到17世纪,微积分才出现重大突破.微积分主要来源于对四类问题的研究:面积、体 积、弧长问题;位移、速度、加速度关系问题;切线问题;最值问题.许多数学家对此作 出了贡献,这其中有卡瓦列利(F.Cavalieri)、费马(P.deFermat)、沃利斯(J.Wallis)、笛 卡儿(R.Descartes)和巴罗(I.Barrow)等.在经过了半个世纪的酝酿后,牛顿(I.Newton) 和莱布尼茨(G.Leibniz)分别独立地完成了微积分创立过程中最后也是最关键的一步.牛 顿和莱布尼茨的杰出贡献,不在于发现求切线和求面积的方法,而是给出了一般的无穷小 算法,同时又找出了微分学和积分学的互逆关系,现称为微积分基本定理,这一深刻的思 想已成为人类文明中的瑰宝. 牛顿对微积分问题的研究始于1664年秋,当时他正在剑桥大学读书.他因对笛卡儿 圆法产生兴趣而开始寻找更好的求切线方法.1665年11月,牛顿发明了“正流数术”(微分 法),次年5月又建立了“反流数术”(积分法).1666年10月,牛顿将前两年的研究成果整 理成一篇总结性论文,现以《流数简论》著称.这是历史上第一篇系统的微积分文献.在这 篇论文中,牛顿通过揭示微分和积分的互逆关系而将两者统一为一个整体.尽管如此,这 一论文在许多方面还是不成熟的.在其后的大约四分之一世纪的时间里,牛顿不断地完善 自己的微积分学说,先后著成了三篇微积分论文:《分析学》(1669)、《流数法》(1671)和 《求积术》(1691).它们真实地再现了牛顿创建微积分的思想历程. 与牛顿发明微积分的运动学背景不同,莱布尼茨创立微积分首先是出于对几何学问题 的思考.1673年,他因在帕斯卡(B.Pascal)的有关论文中获得启迪,而提出自己的“微分 3 45.3 导数的应用 三角形”理论.在对微分三角形的研究中,莱布尼茨逐渐认识到什么是求曲线的切线和求 曲线下的面积的实质,并发现了这两类问题的互逆关系.由此他建立起一种更一般的算 法,并将以往解决这两类问题的各种结果和技巧加以统一. 刚刚诞生的微积分以其神奇的效果赢得了普遍的关注,但在理论上却是粗糙和不完美 的,后世的许多数学家为其理论的建立和完善作出了不懈的努力,特别是欧拉(L.Euler)、 达朗贝尔(J.dAlembert)、波尔查诺(B.Bolzano)、柯西(A.L.Cauchy)和维尔斯特拉斯 (K.Weierstrass)等人作出了重要的贡献.直到19世纪后半叶,现代意义的严密的微积分 与数学分析理论才真正成形.特别值得一提的是,1859年,我国历史上首部微积分中文教 科书《代微积拾级》在上海出版,标志着高等数学的传入.此书的原作者为美国数学家罗密 士(E.Loomis),译者为中国数学家李善兰和英国人伟烈亚力(A.Wylie). 微积分的创立具有划时代的意义,它开辟了数学的新时代,使数学获得了极大的发 展,取得了空前的繁荣,诸如微分方程、复变函数、微分几何等数学分支都应运而生.微 积分给出了一整套的科学方法,开创了科学的新纪元,并因此加强和加深了数学的巨大作 用与应用.有了微积分,人类才有能力把握运动和变化,进而推动了工业革命,促进了大 工业生产,最终有了现代化的社会.微积分不仅极大地促进了天文学、力学、物理学等基 础学科的发展,还在现代化学、生物学、工程学、地理学、经济学等自然科学、社会科学 及应用科学各个分支获得了极其广泛的应用.几乎所有现代技术领域,如机械、仪器仪 表、建筑、航海、航空航天、信息与通讯等,其技术的发展和产品的设计也都以微积分为基本 数学工具. 纵观微积分的历史之旅,有着说不完的数学故事.请同学们课后查阅有关书籍和资 料,认真地进行回顾和小结. 3 55 导数及其应用 内容提要 1.导数的概念及意义 (1)导数的概念:函数狔=犳(狓)在狓=狓 处的导数犳′(狓),是函数在狓=狓 附近的 0 0 0 犳(狓+犺)-犳(狓) 平均变化率 0 0 当犺趋近于0时所趋近的稳定值,记作 犺 犳(狓+犺)-犳(狓) 犳′(狓)=lim 0 0 . 0 犺 犺→0 把自变量值狓 对应到犳′(狓)所给出的函数记作狔=犳′(狓),称为狔=犳(狓)的导函数,简称 0 0 导数. (2)导数的物理意义:在满足函数关系犱=犳(狋)的运动中,该函数在狋=狋处的导数 0 犳′(狋)就是狋时刻的瞬时速度. 0 0 (3)导数的几何意义:对于曲线狔=犳(狓),函数狔=犳(狓)在狓=狓 处的导数犳′(狓) 0 0 就是曲线在点(狓,犳(狓))处的切线斜率. 0 0 2.常用的求导公式与法则 (1)(犆′)=0,犆为常数; (2)(狓 α ′)=α狓 α-1 ,α为常数; (3)(e狓′)=e狓 ; 1 (4)(ln狓′)= ; 狓 (5)(sin狓′)=cos狓; (6)(cos狓′)=-sin狓; (7)(犳(狓)±犵(狓)′)=犳′(狓)±犵′(狓); (8)(犳(狓)犵(狓)′)=犳′(狓)犵(狓)+犳(狓)犵′(狓); ( ) ′ 犳(狓) 犳′(狓)犵(狓)-犳(狓)犵′(狓) (9) = ,其中犵(狓)≠0; 犵(狓) (犵(狓)) 2 (10)(犆犳(狓)′)=犆犳′(狓),犆为常数; (11)(犳(犪狓+犫)′)=犪犳′(狌),其中狌=犪狓+犫. 3.用导数研究函数 (1)函数的单调性:在区间犐上,若犳′(狓)>0,则函数狔=犳(狓)严格增;若犳′(狓)<0, 则函数狔=犳(狓)严格减. (2)函数的极值:若狓 是函数狔=犳(狓)的极值点,则犳′(狓)=0,即狓 是函数 0 0 0 狔=犳(狓)的驻点.反之,在狓 是函数狔=犳(狓)的驻点的前提下,若在狓 的左侧附近有 0 0 3 6复习题 犳′(狓)>0,在狓 的右侧附近有犳′(狓)<0,则狔=犳(狓)在狓 处取得极大值;若在狓 0 0 0 的左侧附近有犳′(狓)<0,在狓 的右侧附近有犳′(狓)>0,则狔=犳(狓)在狓 处取得极 0 0 小值. (3)连续函数在闭区间上必存在最值(最大值与最小值). 复习题 犃组 1.请根据图中的函数图像,将下列数值按从小到大的顺序排列: . ① 曲线在点犃处切线的斜率; ② 曲线在点犅处切线的斜率; ③ 曲线在点犆处切线的斜率; ④ 割线犃犅的斜率; ⑤ 数值0; (第1题) ⑥ 数值1. 2.已知犳(狓)=槡狓,犵(狓)=犽狓2. (1)求曲线狔=犳(狓)在点(4,2)处的切线方程; (2)若曲线狔=犵(狓)经过点(4,2),求它与(1)中切线的另一个交点. 3.从桥上将一小球掷向空中,小球相对于地面的高度犺(单位:m)和时间狋(单位:s) 近似满足函数关系犺=-5狋2+15狋+12.问: (1)小球的初始高度是多少? (2)小球在狋=0到狋=1这段时间内的平均速度是多少? (3)小球在狋=1时的瞬时速度是多少? (4)小球所能达到的最大高度是多少?何时达到? 4.已知犳(狓)=ln狓,犵(狓)=e狓 ,计算下列函数狔=犺(狓)在点狓=1处的导数值: (1)犺(狓)=3犳(狓)-5犵(狓); (2)犺(狓)=犳(狓)犵(狓); 犳(狓) (3)犺(狓)= ; (4)犺(狓)=犳(2狓+1)+犵(3狓-1). 犵(狓) 5.计算下列函数狔=犳(狓)的导数,其中: π 1 (1)犳(狓)= +sin(-狓); (2)犳(狓)=槡3狓- ; 2 狓3 ( ) 1 cos狓 (3)犳(狓)= 狓-5 (3-4狓); (4)犳(狓)= . 2 狓2 3 75 导数及其应用 6.求下列函数狔=犳(狓)的单调区间和极值点,其中: 2 (1)犳(狓)= 狓-1; (2)犳(狓)=2+狓-狓2 ; 3 (3)犳(狓)=狓3+狓2-8狓+7. 7.借助第6题的结果,求下列函数狔=犳(狓)在给定区间上的最大值和最小值,其中: 2 (1)犳(狓)= 狓-1,狓∈[0,3]; 3 (2)犳(狓)=2+狓-狓2 ,狓∈[-1,1]; (3)犳(狓)=狓3+狓2-8狓+7,狓∈[-3,3]. 犅组 1.已知狔=犳′(狓)的图像如图所示,求函数狔=犳(狓)在(-2,2)上 的单调区间和极值点. 2.若直线狔=狓是曲线狔=狓3-3狓2+犪狓的切线,求犪的值. 3.设函数狔=狓3+犪狓2+犫狓+犮的图像与狔=0在原点相切, 若函数的极小值为-4,求函数的表达式与单调减区间. (第1题) 4.某种型号的汽车在匀速行驶中每小时的耗油量狔(单位:L)关于行驶速度狓(单位: 1 3 km/h)满足函数关系狔= 狓3- 狓+8(0<狓≤120).已知甲、乙两地相距100km. 128000 80 问:当汽车保持怎样的速度匀速行驶时,从甲地到乙地的耗油量最小? 5.要建造一个给定容积犞的圆柱体蓄水池,已知池底单位造价为池侧面单位造价的 2倍.问:应如何选择蓄水池的底面半径狉和高犺,才能使总造价最低? 6.已知某厂生产一种产品的总成本犆(单位:万元)与产品件数狓满足函数关系 2 250000 犆=1200+ 狓3 ,产品单价犘(单位:万元)和产品件数狓满足函数关系犘2= .问: 75 狓 产量为多少件时,总利润最大? 拓展与思考 1.讨论函数狔=狓3+犪狓+犫的单调性.(可借助信息技术工具) 2.判断方程狓3+犪狓+犫=0有几个实根.(可借助信息技术工具) 3 8第6章 计数原理 自远古以来,数(狊犺ù)的概念就来源于数(狊犺ǔ)这个动 作.直到今天,精确地知道一个有限集合中元素的个数,仍 然是一类非常重要的问题.例如,在必修课程第12章中, 我们已经看到古典概率的计算往往需要用到一些集合的元 素个数之间的比值,但在那里,因为样本空间较小,大多 数计数都是通过枚举完成的.在本章里,我们将学习一些基 本的计数原理,以便能够解决更多的计数问题. 书书书6 计数原理 乘法原理 6.1 与加法原理 1 乘法原理 先看下面的问题: 如图611,从甲地到丙地,需经过乙地.其中,从甲地到 乙地有3条路线犃、犃、犃,而从乙地到丙地有2条路线犅、 1 2 3 1 犅.那么,从甲地经由乙地到丙地,共有多少种不同的走法? 2 从甲地到乙地有3种不同的走法,按其中任何一种走法到达 图611 乙地后,再由乙地到丙地又有2种不同的走法.于是,不同的走 法就有以下6种情形(其中符号犃犅 的含义是“先走路线犃, 1 1 1 再走路线犅”,其余类同): 1 犃犅、犃犅、犃犅、犃犅、犃犅、犃犅. 1 1 1 2 2 1 2 2 3 1 3 2 其中,每一种情形都可“从甲地经由乙地到丙地”.因此,从甲地 经由乙地到丙地共有 3×2=6 种不同的走法. 这里使用的就是下面的 乘法原理(分步计数原理) 做一件事,需要依次完成狀 个步骤,其中完成第一步有犪 种不同的方法,完成第二步 1 有犪种不同的方法,……,完成第狀步有犪 种不同的方 2 狀 法.那么完成这件事共有 犪犪…犪 1 2 狀 种不同的方法. 例1 一个三层的书架上共放有9本书,其中第一层放有 4本不同的语文书,第二层放有3本不同的数学书,第三层放有 2本不同的外语书.若从书架的第一、二、三层各取1本书,共 4 06.1 乘法原理与加法原理 有多少种不同的取法? 解 从书架的第一、二、三层各取1本书,可以分三个步骤 完成: 第一步:从第一层取1本语文书,有4种取法; 第二步:从第二层取1本数学书,有3种取法; 第三步:从第三层取1本外语书,有2种取法. 根据乘法原理,不同取法的种数为 4×3×2=24. 即从书架的第一、二、三层各取1本书,有24种不同的取法. 例2 用1、2、3、4、5可以组成多少个没有重复数字的 三位数? 解 要组成一个没有重复数字的三位数,可以分三个步骤 完成: 第一步:确定百位上的数字,从5个数字中任选一个,有5 种选法; 第二步:确定十位上的数字,因为不允许有重复数字,所以 从第一步余下的数字中任选一个,有4种选法; 第三步:确定个位上的数字,因为不允许有重复数字,所以 从前两步余下的数字中任选一个,有3种选法. 根据乘法原理,不同取法的种数为 5×4×3=60. 因此,可以组成60个没有重复数字的三位数. 例3 正整数540有多少个不同的正约数? 解 将540进行素因数分解,得 540=22×33×5. 因此,540的正约数都可以写成2犪3犫5犮 的形式,其中犪∈{0,1,2}, 犫∈{0,1,2,3},犮∈{0,1},通过犪、犫、犮的不同取值,可以得到 540的所有不同的正约数. 这样,确定540的正约数可以分下面三个步骤完成: 第一步:确定约数中犪的值,有犪=0,犪=1,犪=2共3种 可能; 第二步:确定约数中犫的值,有4种可能; 第三步:确定约数中犮的值,有2种可能. 4 16 计数原理 根据乘法原理,540的不同正约数的个数为 3×4×2=24. 因此,540有24个不同的正约数. 练习6.1(1) 1.公园有4个门,从一个门进,再从另一个门出,共有多少种不同的走法? 2.4名学生报名参加两项体育比赛,每人至少报一项,每项比赛参加的人数不限,共 有多少种不同的报名结果? 2 加法原理 再看下面的问题: 从甲地到乙地,可以乘飞机,可以乘轮船,也可以乘汽车. 一天中,飞机有4班,轮船有3班,汽车有2班.问:一天中乘 坐这些交通工具从甲地到乙地共有多少种不同的走法? 因为一天中乘飞机有4种走法,乘轮船有3种走法,乘汽车 有2种走法,其中每一种方法都可以实现从甲地到乙地的目的, 所以一天中乘坐这些交通工具从甲地到乙地共有 4+3+2=9 种不同的走法. 这里使用的就是下面的 每一类办法中的 加法原理(分类计数原理) 做一件事,完成它有狀类 每一种方法都可以单 办法,其中第一类办法有犪 种不同的方法,第二类办法有 独完成这件事情,这 1 是“加法原理”与“乘法 犪 种不同的方法,……,第狀类办法有犪 种不同的方法. 原理”的区别. 2 狀 那么完成这件事共有 犪+犪+…+犪 1 2 狀 种不同的方法. 例4 用1、2、3、4、5这五个数字可以组成多少个十位 数字大于个位数字的两位数? 解 十位数字大于个位数字的两位数可以分成四类: 十位为5,有51、52、53、54共4个; 4 26.1 乘法原理与加法原理 十位为4,有41、42、43共3个; 十位为3,有31、32共2个; 十位为2,只有21一个. 根据加法原理,十位数字大于个位数字的两位数共有4+3 +2+1=10个. 例5 如图612,从甲地到乙地有2条路,从乙地到丁地 有3条路;从甲地到丙地有4条路,从丙地到丁地有2条路.那么, 从甲地到丁地,如果每条路至多走一次,且每个地点至多经过一 次,有多少种不同的走法? 解 从甲地到丁地的走法可以分成两类: 第一类:从甲地经由乙地到丁地.这类走法可以分成两个步 图612 骤:先从甲地到乙地,有2种走法;再从乙地到丁地,有3种走 法.根据乘法原理,这一类走法的种数为 2×3=6. 第二类:从甲地经由丙地到丁地.这类走法可以分成两个步 骤:先从甲地到丙地,有4种走法;再从丙地到丁地,有2种走 法.根据乘法原理,这一类走法的种数为 4×2=8. 根据加法原理,从甲地到丁地共有 6+8=14 种不同的走法. 例6 在300和800之间,有多少个没有重复数字的 奇数? 解 一个三位奇数的个位上的数字必是奇数,且因为不允许 有重复数字出现,当一个奇数字(1、3、5、7、9)作为个位数时, 它就不能作为百位数.所以,符合条件的数可以按百位上的数字 是奇数或偶数分成两类: 第一类:百位上的数字是偶数.这样的三位数可以由以下三 个步骤确定: 第一步,百位上的数字从4和6中任选一个,有2种选法; 第二步,个位上的数字从1、3、5、7、9中任选一个,有5 种选法; 第三步,十位上的数字从余下的8个数字中任选一个,有8 4 36 计数原理 种选法. 根据乘法原理,这一类奇数的个数为 2×5×8=80. 第二类:百位上的数字是奇数.这样的三位数可以由以下三 个步骤确定: 第一步,百位上的数字从3、5、7中任选一个,有3种选法; 第二步,个位上的数字从余下的4个奇数中任选一个,有4 种选法; 第三步,十位上的数字从余下的8个数字中任选一个,有8 种选法. 根据乘法原理,这一类奇数的个数为 3×4×8=96. 根据加法原理,在300和800之间共有 80+96=176 个没有重复数字的奇数. 练习6.1(2) 1.在平面直角坐标系中,以1、2、3、4、5这五个数中的两个分别作为一个点的横 坐标和纵坐标,可以组成多少个位于直线狔=狓下方的点? 2.书架上放有6本不同的数学书和5本不同的语文书.从中任取一本,有多少种不同 的取法? 习题6.1 犃组 1.4名学生分别报名参加学校的足球队、篮球队和棒球队,每人限报其中的一支. 问:有多少种不同的报名方法? 2.某服装厂为学校设计了4种样式的上衣、3种样式的裤子.若取其中的一件上衣和 一条裤子配成校服,则可以配出多少种不同样式的校服? 3.在一种编码方式中,每个编码都是两位字符,规定第一位用数字0至9中之一,第 二位用26个小写英文字母中之一.这种编码方式共可以产生多少个不同的编码? 4.设集合犃={(狓,狔)|狓∈犣,狔∈犣,且|狓|≤6,|狔|≤7},则集合犃中有多少个 4 46.1 乘法原理与加法原理 元素? 5.从犪、犫、犮、犱、犲这5个元素中取出4个,放在4个不同的格子中,且元素犫不 能放在第二个格子里.问:一共有多少种不同的放法? 6.犃、犅、犆、犇、犈五人站成一排,如果犅必须站在犃的右边(犃、犅可以不相邻), 那么有多少种不同的排法? 犅组 1.乘积(犪+犪)(犫+犫+犫)(犮+犮+犮+犮)的展开式中有多少项? 1 2 1 2 3 1 2 3 4 2.如图,要接通从犃到犅的电路,不同的接通方法有多少种? (第2题) 3.用1、2、3、4、5、6组成没有重复数字的六位数,要求所有相邻两个数字的奇偶 性都不同,且1和2相邻.问:有多少个这样的六位数? 4.已知狆、狆、狆 是互不相同的素数,α、 β 、γ是正整数,狀=狆α狆 β 狆γ .问:狀有 1 2 3 1 2 3 多少个不同的正约数? 4 56 计数原理 6.2 排列 1 排列的定义 考虑下面两个问题: 问题1:从甲、乙、丙3名学生中任选2名,一名担任正班 长,另一名担任副班长.有多少种不同的选法? 这个问题就是从甲、乙、丙3名学生中,每次任选2名,按 照正班长在左、副班长在右的顺序排列,求一共有多少种不同的 排法. 首先确定正班长,在3名学生中,任选一名作为正班长,有 3种方法;然后确定副班长,当正班长选定后,副班长就只能在 其余的两人中选取,有2种方法.于是,根据乘法原理,从甲、 乙、丙3名学生中,每次任选2名,按照正班长在左、副班长在 右的顺序排列的不同方法共有 3×2=6 种,即有6种不同的选法. 问题1是从3个不同的元素犪、犫、犮中任取2个,并按序排 列,求一共有多少种不同的排列方法.所有的排列是 犪犫、犪犮、犫犪、犫犮、犮犪、犮犫. 这些排列的总数为3×2=6. 问题2:已知抛物线的方程为狔=犪狓2+犫狓+犮,其中犪、犫、 犮∈{1,2,3,4},且犪、犫、犮两两不同.求这样的抛物线的个数. 这个问题就是从4个不同的数字中,每次任取3个不同的数 字,按照狓2 的系数、狓的系数和常数项这样的顺序排列起来, 求一共有多少种不同的排法. 第一步,先确定狓2 的系数,从1、2、3、4这4个数字中任 取1个,有4种方法; 第二步,确定狓的系数,当狓2 的系数确定以后,狓的系数 4 66.2 排列 只能从余下的3个数字中任取1个,有3种方法; 第三步,确定常数项,当狓2 的系数和狓的系数都确定以 后,常数项只能从余下的2个数字中任取1个,有2种方法. 根据乘法原理,从4个不同的数字中,每次任取3个不同的 数字,分别作为狓2 的系数、狓的系数和常数项的方法共有 4×3×2=24 种.具体方法如图621所示( 中的数字从左至右依次为 狓2 的系数、狓的系数和常数项). 图621 以上两个问题的共同点在于,都是从若干个不同元素中选 取部分(或全部)元素,并按序排列,求一共有多少种不同的 排法. 定义 从狀个互不相同的元素中,取出犿(犿≤狀)个不同元 素按照一定的顺序排成一列,叫做从狀个元素中取出犿个元素 的一个排列(permutation). 从排列的定义可以看出,如果两个排列是相同的,不仅组成 这两个排列的元素完全相同,而且排列的顺序也是完全相同的. 如果所取的元素不完全相同,那么这两个排列是两个不同的排列 (如问题1中的犪犫与犪犮);如果所取的元素完全相同,但排列顺序 不同,那么这两个排列也是不同的排列(如问题2中的 与 ). 4 76 计数原理 例1 写出从犪、犫、犮、犱四个元素中任取两个不同元素 的所有排列. 解 先画出下面的树形图(图622): 图622 于是可知,所有的排列是犪犫、犪犮、犪犱、犫犪、犫犮、犫犱、犮犪、犮犫、 犮犱、犱犪、犱犫、犱犮. 例2 将6本不同的书排成一排,有多少种不同的排法? 解 考虑一排的6个位子(图623).将6本书排成一排, 相当于将这6本书分别放到这6个位子中,这是将全部6个元素 进行排列的问题. 从左至右将6个位子依次编号为1到6,完成一个排列可以 分为以下六个步骤: 图623 第一步:确定放在1号位上的书,有6种方法; 第二步:确定放在2号位上的书,有5种方法; 第三步:确定放在3号位上的书,有4种方法; 第四步:确定放在4号位上的书,有3种方法; 第五步:确定放在5号位上的书,有2种方法; 第六步:确定放在6号位上的书,有1种方法. 根据乘法原理,不同的排法数为 6×5×4×3×2×1=720. 于是,将6本不同的书排成一排,有720种不同的排法. 例3 10名学生排成两排照相,每排5人,共有多少种 不同的排列方式? 解 将第一排的5个位置从左至右编号,号码分别为1到5; 再将第二排的5个位置从左至右编号,号码分别为6到10.这 样,问题就转化为:10名学生排在编号为1到10的十个位置 上,共有多少种不同的排法? 这时,完成一个排列可以分为以 下十个步骤: 第一步:确定坐在1号位上的学生,有10种方法; 4 86.2 排列 第二步:确定坐在2号位上的学生,有9种方法; …… 第犽步:确定坐在犽号位上的学生,有11-犽种方法; …… 第十步:确定坐在10号位上的学生,有1种方法. 根据乘法原理,不同的排法数为 10×9×8×…×2×1=3628800. 练习6.2(1) 1.写出从犪、犫、犮、犱、犲这五个不同元素中任意取出两个元素的所有排列. 狓2 狔2 2.已知犕={1,2,3,4},且犿∈犕,狀∈犕,方程 + =1表示的曲线是椭圆.问: 犿 狀 可以有多少个不同的椭圆? 2 排列数的计算 怎样计算从狀个不同元素中取出犿个元素的排列的个数? 一般地,我们有下面的定义: 定义 从狀个互不相同的元素中,取出犿(犿≤狀)个不同元 素的所有排列的个数,叫做从狀个元素中取出犿个元素的排列 P是英文permuta tion的第一个字母.在 数,用符号犘犿 表示. 有些资料中也用符号 狀 A犿表示排列数. 狀 例如,问题1中的选法数可以表示为P2=6;问题2中的抛 3 物线个数可以表示为P3=24.下面研究排列数的计算公式. 4 求排列数P3 ,可以这样考虑:假定有排好顺序的3个位子 狀 (图624),从狀个互不相同的元素犪、犪、…、犪 中任取3个 1 2 狀 填空,一个位子填一个元素,每一种填法就得到一个排列;反过 来,任何一个排列都可以由这样的一种填法得到.因此,所有不 同填法的总数就是排列数P3. 狀 图624 4 96 计数原理 为了计算P3 ,可以分成以下三个步骤: 狀 第一步,确定1号位上的元素,这可以从狀个互不相同的元 素中任取一个填空,有狀种方法; 第二步,确定2号位上的元素,这可以从剩下的狀-1个互 不相同的元素中任取一个填空,有狀-1种方法; 第三步,确定3号位上的元素,这可以从剩下的狀-2个互 不相同的元素中任取一个填空,有狀-2种方法. 根据乘法原理,可以得到排列数为 P3=狀(狀-1)(狀-2). 狀 同样,求P犿 ,可以这样考虑:假定有排好顺序的犿个位子 狀 (图625),从狀个互不相同的元素犪、犪、…、犪 中任取犿 1 2 狀 个填空,一个位子填一个元素,每一种填法就得到一个排列;反 过来,任何一个排列都可以由这样的一种填法得到.因此,所有 不同填法的总数就是排列数P犿. 狀 图625 为了计算P犿 ,可以分成以下犿个步骤: 狀 第一步,确定1号位上的元素,这可以从狀个互不相同的元 素中任取一个填空,有狀种方法; 第二步,确定2号位上的元素,这可以从剩下的狀-1个互 不相同的元素中任取一个填空,有狀-1种方法; 第三步,确定3号位上的元素,这可以从剩下的狀-2个互 不相同的元素中任取一个填空,有狀-2种方法; 以此类推,当前面的犿-1个位子都被填好后,犿号位可以 从余下的狀-(犿-1)个互不相同的元素中任取一个填空,有狀- 犿+1种方法. 根据乘法原理,可以得到排列数为 P犿=狀(狀-1)(狀-2)…(狀-犿+1), 狀 其中犿及狀是正整数,且犿≤狀.这个公式叫做排列数公式. 5 06.2 排列 例4 用0、1、2、3、4、5这6个数字,可以组成多少 个没有重复数字的三位数? 解 解法一:用0到5这6个数字组成一个三位数,可以看 成从这6个数字中任取3个的一个排列(0排在百位的除外).由 于百位上的数字不能是0,因此可以分两个步骤考虑:先排百位 上的数字,再排十位和个位上的数字. 百位上的数字从1到5这5个数字中任取1个,有P1 种情 5 形;十位和个位上的数字,可以从余下的5个数字中任取2个, 有P2 种情形.根据乘法原理,所求的三位数的个数为 5 P1P2=5×5×4=100. 5 5 解法二:从0到5这6个数字中任取3个数字的排列数,减 去其中以0为排头的排列数,就是用这6个数字组成的没有重复 数字的三位数的个数. 从0到5这6个数字中任取3个数字的排列数为P3 ,其中以 6 0为排头的排列数为P2 ,因此所求的三位数的个数为 5 P3-P2=6×5×4-5×4=100. 6 5 解法三:由于0不能出现在百位上,因此可以根据数码中是 否有0和0出现在哪一位上进行分类讨论. 满足条件的三位数可以分成三类: 每一位数字都不是0的三位数有P3 个; 5 个位数字是0的三位数有P2 个; 5 十位数字是0的三位数有P2 个. 5 根据加法原理,符合条件的三位数的个数为 P3+P2+P2=60+20+20=100. 5 5 5 例5 (1)7个人站成一排.若甲和乙不能相邻排列,有 多少种不同的排法? (2)要将8本各不相同的教科书排成一排放在书架上,其中 数学书3本、外语书2本、物理书3本.如果3本数学书要排在 一起,2本外语书也要排在一起,那么有多少种不同的排法? 解 (1)解法一:因为甲和乙不能相邻,所以可以先考虑确 定甲和乙在排列中的位置,再进行排列. 将一排的7个位置从左向右依次编号为1到7,则甲和乙所 在位置的编号有以下15种情形: 5 16 计数原理 (1,3)、(1,4)、(1,5)、(1,6)、(1,7)、(2,4)、(2,5)、(2,6)、 (2,7)、(3,5)、(3,6)、(3,7)、(4,6)、(4,7)、(5,7). 这样,可以分两步找出符合条件的排列: 第一步,确定甲和乙在以上15种情形中的位置,有15×2 种情形; 第二步,确定余下5人在排列中的位置,有P5 种情形. 5 根据乘法原理,符合条件的排列的个数为 15×2×P5=30×120=3600. 5 解法二:因为甲和乙不能相邻,所以可以先将余下5人排列 好,相邻两人中间均留有一个空位,加上两端的空位,共有6个 空位,再将甲乙两人分别插入其中两个不同的空位即可. 这样,可以分两步找出符合条件的排列: 第一步,先对甲和乙以外的5人进行排列,共有P5 种情形, 5 这5人形成了6个空位; 第二步,再将甲和乙分别插入这6个空位中的2个,共有 P2 种情形. 6 根据乘法原理,符合条件的排列的个数为 P5P2=120×30=3600. 5 6 总之,7个人站成一排,若甲和乙不能相邻排列,共有3600 种排法. (2)分三个步骤完成这件事情: 第一步:将3本数学书和2本外语书都分别看作一本书,然 后连同其他3本物理书排成一排,有P5 种排法; 5 第二步:3本数学书的位置可以互换,有P3 种排法; 3 第三步:2本外语书的位置也可以互换,有P2 种排法. 2 根据乘法原理,不同排法的总数为 P5P3P2=120×6×2=1440. 5 3 2 例6 将犪、犫、犮、犱、犲、犳六个不同元素排成一列,其 中犪不在首位,犫不在末位.问:有多少种不同的排法? 解 根据犪所在的位置可以分以下两种情形: 若犪在末位,则余下5个元素可任意排列,这样的排列的个 数为 P5=5×4×3×2×1=120. 5 若犪不在末位,则因为犪不在首位,可以分三步找出符合条 5 26.2 排列 件的排列: 第一步,确定犪的位置,有4种情形; 第二步,确定犫的位置,有4种情形; 第三步,确定余下4个元素在排列中的位置,有P4 种情形. 4 根据乘法原理,犪不在首位和末位的排列的个数为 4×4×P4=16×4×3×2×1=384. 4 综上,满足条件的排列的个数为 120+384=504. 练习6.2(2) 1.5名篮球队员甲、乙、丙、丁、戊,排成一排. (1)共有多少种不同的排法? (2)若甲必须站在排头,有多少种不同的排法? (3)若甲不能站排头,也不能站排尾,有多少种不同的排法? 2.(1)配制某种染色剂,需要加入3种有机染料、2种无机染料和2种添加剂,其中 有机染料的添加顺序不可以相邻.为研究所有不同的添加顺序对染色效果的影响,总共要 试验多少次? (2)某展览馆计划展出10幅不同的画,其中水彩画1幅、油画4幅、国画5幅.现排 成一排陈列,要求同一品种的画必须连在一起,并且水彩画不放在两端.问:有多少种不 同的陈列方式? 3 排列数的性质 把狀个不同元素全部进行排列,叫做这狀个元素的全排列. 在排列数公式P犿=狀(狀-1)(狀-2)…(狀-犿+1)(1≤犿≤狀)中, 狀 令犿=狀,得知狀个元素的全排列总数是 P狀=狀(狀-1)(狀-2)…3·2·1. 狀 为方便起见,把乘积狀(狀-1)(狀-2)…3·2·1记作狀!,读 作狀的阶乘,那么狀个不同元素的全排列数可以写成 P狀=狀!. 狀 利用阶乘符号可以将排列数公式作如下变形: 5 36 计数原理 P犿=狀(狀-1)(狀-2)…(狀-犿+1) 狀 狀(狀-1)(狀-2)…(狀-犿+1)(狀-犿)…2·1 = (狀-犿)…2·1 狀! = . (狀-犿)! 即排列数公式还可写成 狀! P 狀 犿= (狀-犿)! . 为了使这个公式在犿=狀时也成立,我们规定 0!=1. 狀! 所以P 狀 犿= (狀-犿)! 在犿=0时也成立,即P 狀 0=1. 例7 设狀是一个不小于17的正整数,用排列数表示 (狀-16)(狀-15)…(狀-6). 解 根据排列数公式,可以得到 (狀-16)(狀-15)…(狀-6)=(狀-6)[(狀-6)-1][(狀-6)-2] …[(狀-6)-11+1] =P11 . 狀-6 例8 已知犿、狀是正整数,且犿≤狀.求证: (1)P犿=狀P犿-1 ; 狀 狀-1 (2)P犿+犿P犿-1=P犿 . 狀 狀 狀+1 证明 (1)根据排列数公式,可以得到 狀! 狀·(狀-1)! P 狀 犿= (狀-犿)! = [(狀-1)-(犿-1)]! =狀P犿-1. 狀-1 所以,P犿=狀P犿-1. 狀 狀-1 (2)根据排列数公式,可以得到 狀! 狀! P 狀 犿+犿P 狀 犿-1= (狀-犿)! +犿 (狀-犿+1)! 狀!(狀-犿+1)+狀!×犿 = (狀-犿+1)! 狀!(狀-犿+1+犿) = [(狀+1)-犿]! 5 46.2 排列 (狀+1)! = [(狀+1)-犿]! =P犿 . 狀+1 所以,P犿+犿P犿-1=P犿 . 狀 狀 狀+1 例9 解关于正整数狀的方程:P4 =140P3. 2狀+1 狀 烄2狀+1≥4, 解 首先,由排列数的定义,有 烅 由此解得狀≥3. 烆狀≥3, 此外,原方程可化为 (2狀+1)2狀(2狀-1)(2狀-2)=140狀(狀-1)(狀-2), 再化简,可得 (2狀+1)(2狀-1)=35(狀-2), 即 4狀2-35狀+69=0, 即 (狀-3)(4狀-23)=0. 23 舍去非整数的根狀= ,故 4 狀=3. 练习6.2(3) P7-P5 1.已知狀是正整数,且 狀 狀=89.求狀的值. P5 狀 2.已知狀为不小于2的正整数,求证:P狀+1-P狀=狀2P狀-1. 狀+1 狀 狀-1 习题6.2 犃组 1.用1、2、3、4可以组成多少个没有重复数字的四位正整数?其中有多少个偶数? 2.从1、2、3、4、5这5个数字中,任取2个不同的数字作为一个点的坐标,一共可 以组成多少个不同的点? 3.在方程犪狓+犫狔=0中,设系数犪、犫是集合{0,1,2,3,5,7}中两个不同的元素.求 这些方程所表示的不同直线的条数. 5 56 计数原理 4.将5个人排成一排,若甲和乙必须排在一起,则有多少种不同的排法? 5.从7名运动员中选4名组成接力队参加4×100米接力赛.问:甲、乙两人都不跑中 间两棒的排法有多少种? 6.从7名男生和5名女生中选取3人依次进行面试. (1)若参加面试的人全是女生,则有多少种不同的面试方法? (2)若参加面试的人中,恰好有1名女生,则有多少种不同的面试方法? 7.若犿为正整数,且犿<27,则(27-犿)(28-犿)…(34-犿)等于 ( ) A.P8 ; B.P27-犿 ; 27-犿 34-犿 C.P7 ; D.P8 . 34-犿 34-犿 8.求满足等式P3 =28P2 的正整数狀的值. 2狀 狀 9.解关于正整数狓的不等式P狓<6P狓-2. 8 8 犅组 1.有4张分别标有数字1、2、3、4的红色卡片和4张分别标有数字1、2、3、4的蓝 色卡片,从这8张卡片中取出4张排成一行.如果所取出的4张卡片所标数字之和等于 10,那么不同的排法共有多少种? 2.有6张连号的电影票,分给3名教师和3名学生,要求师生相间而坐.求不同分法 的种数. 3.在一张节目单中原有6个节目已排好顺序,现要插入3个节目,并要求不改变原有 6个节目前后相对顺序.问:一共有多少种不同的插法? 4.2名男生和4名女生排成一排.问:男生既不相邻也不排两端的不同排法共有多 少种? 5.在一次电影展中,某影院要在两天内放映12部参赛影片,每天只有6个时间段放 映6部参赛影片,每个时间段放映1部,其中甲、乙两部电影不能在同一天放映.问:有 多少种不同的排片方案? 6.从6人中选取4人分别去犃、犅、犆、犇四个城市游览,要求每个城市有一人游览, 而每人只游览一个城市,且这6人中,甲、乙两人都不去犃地游览.问:不同的选择方案 共有多少种? 5 66.3 组合 6.3 组合 1 组合的定义 考虑下面的问题:从甲、乙、丙3名学生中选出2名,有多 少种不同的选法? 这个问题与本章6.2节的问题1不同.6.2节的问题1是从3 个互不相同的元素中任取2个,并按序排列,求一共有多少种不 同的排列方法,这是排列问题;而本节所考虑的问题是,从3个 互不相同的元素中任取2个,不管怎样的顺序都看作同一组,求 一共有多少个不同的组.这就是所要研究的组合问题. 定义 从狀个互不相同的元素中,取出犿(犿≤狀)个不同元 素作为一组,叫做从狀个元素中取出犿个元素的一个组合 (combination). 上面的问题中要确定有几种不同的选法,就是要求从3个互 不相同的元素中取出2个不同元素的所有组合的个数.如果两个 组合中的元素完全相同,不管元素的顺序如何,这两个组合都是 相同的组合;而只有当两个组合中的元素不完全相同时,这两个 组合才是不同的组合.上面问题的所有组合有3个,分别是: 甲乙、乙丙、丙甲. 注意:组合“甲乙”与组合“乙甲”是相同的组合,而组合“甲乙”与 组合“乙丙”是不同的组合. 从排列和组合的定义可以看到,排列与元素的顺序有关,组 合与元素的顺序无关.例如,“甲乙”与“乙甲”是不同的排列,但 注意排列与组合 的区别. 它们是同一个组合. 例1 判断下列问题分别是排列问题还是组合问题: (1)从10名学生中任选5名去参观一个展览,求有多少种 不同的选法; (2)从1、2、3、4、5这5个数字中,每次任取2个不同的 5 76 计数原理 数作为一个点的坐标,求所有不同点的个数; (3)一个黄袋中装有四张分别写有1、3、5、7的卡片,另一 个红袋中装有四张分别写有2、8、16、32的卡片.从红袋和黄袋 中各任取一张卡片,问这两张卡片上的数相加所得的和有多少种; (4)有四本不同的书要分别送给四个人,每人一本,问一共 有多少种不同的送法. 请同学们思考本 例中各题的判断依据. 解 (1)组合问题;(2)排列问题;(3)组合问题;(4)排 列问题. 例2 甲、乙、丙、丁4支篮球队举行单循环赛(即任意 两支球队都要比赛一场). (1)写出每场比赛的两支球队; (2)写出冠亚军的所有可能情况. 解 (1)这是一个组合问题,将两支球队的组合用一个集合 表示,共有6个组合: {甲,乙}、{甲,丙}、{甲,丁}、{乙,丙}、{乙,丁}、{丙,丁}. (2)这是一个排列问题,即从4支球队中任意选取2支,按 照冠军和亚军顺序排列,共有12种排列方式(符号(甲,乙)表示 “甲是冠军,乙是亚军”): (甲,乙)、(甲,丙)、(甲,丁)、(乙,丙)、(乙,丁)、(丙,丁)、 (乙,甲)、(丙,甲)、(丁,甲)、(丙,乙)、(丁,乙)、(丁,丙). 练习6.3(1) 1.(1)写出从犪、犫、犮、犱、犲五个元素中任取两个不同元素的所有组合; (2)写出从犪、犫、犮、犱、犲五个元素中任取两个不同元素的所有排列. 2.平面上的6个点犃、犅、犆、犇、犈、犉中的任意3个点都不在同一条直线上,写 出所有以其中3个点为顶点的三角形. 2 组合数的计算 类似于排列数,我们给出组合数的定义: 定义 从狀个互不相同的元素中,取出犿(犿≤狀)个不同元 素的所有组合的个数,叫做从狀个元素中取出犿个元素的组合 5 86.3 组合 数,用符号犆犿 表示. 狀 因此,从甲、乙、丙3名学生中任选2名,有C2 种不同的 3 C是英文combina 方法. tion的第一个字母.在数 下面我们研究组合数C犿 的计算方法,这可以从组合数C犿 学文 ( 狀 献 ) 中,C 狀 犿也常记 狀 狀 作 . 犿 与排列数P犿 的关系入手. 狀 例如,从3个不同元素犪、犫、犮中取出2个不同元素的排列 与组合的关系如表61所示: 表61 组合 排列 犪,犫 犪,犫 犫,犪 犫,犮 犫,犮 犮,犫 犮,犪 犮,犪 犪,犮 从表61可以看到,对于每一个组合都有2种不同的排列. 因此,求从3个互不相同的元素中任取2个不同元素的排列数 P2 ,可以分成以下两步进行: 3 第一步,从3个互不相同的元素中任取2个不同元素,共有 C2 个不同的组合; 3 第二步,将每一个组合中的2个元素进行全排列,各有P2 2 个排列. 根据乘法原理,有 P2=C2P2 , 3 3 2 即 P2 C2= 3. 3 P2 2 一般地,从狀个互不相同的元素中任取犿个不同元素进行 排列,可以分成以下两步进行: 第一步,从狀个互不相同的元素中任取犿个不同元素,共 有C犿 个不同的组合; 狀 第二步,将每一个组合中的犿个元素进行全排列,各有P犿 犿 个排列. 这样,根据乘法原理,从狀个互不相同的元素中任取犿个 不同元素的排列数P犿 满足 狀 5 96 计数原理 P犿=C犿P犿 , 狀 狀 犿 因此 P犿 狀(狀-1)(狀-2)…(狀-犿+1) C 狀 犿= P 狀 犿 = 犿! , 犿 其中犿及狀是正整数,且犿≤狀.这个公式称为组合数公式. 例3 圆上有10个不同的点,以其中任意3个点为顶点, 可以组成多少个不同的三角形? 解 由于圆上的10个点中不可能有三点共线,因此以其中 任意3个点为顶点的三角形的个数,就是从10个互不相同的元 素中任取3个不同元素的组合数,即 10×9×8 C3 = =120. 10 3×2×1 因此,可以组成120个不同的三角形. 例4 某校高中一年级举行篮球赛.比赛时先分成两组, 其中1班、2班、3班、4班为第一组,5班、6班、7班、8班、 9班、10班为第二组.各组先进行单循环赛(即同组中的每两支 队都要比赛一场),然后由各组的前两名共4支队进行单循环赛 决出冠军和亚军.问:一共需要比赛多少场? 解 由题意,第一组单循环赛的比赛场数是C2 ;第二组单 4 循环赛的比赛场数是C2 ;各组的前两名共4支队再进行单循环 6 赛,还需要比赛C2 场.所以,这次篮球赛一共需要比赛的场 4 次为 C2+C2+C2=6+15+6=27. 4 6 4 例5 有甲、乙、丙三项任务,其中甲需2人承担,乙、 丙各需1人承担.现从10人中任选4人承担这三项任务,不同 的选法有多少种? 解 从10人中任选4人分配任务,可分成以下三个步骤: 第一步:从10人中任选2人承担甲任务,有C2 种选法; 10 第二步:从余下的8人中任选1人承担乙任务,有C1 种 8 选法; 第三步:从余下的7人中任选1人承担丙任务,有C1 种 7 选法. 6 06.3 组合 根据乘法原理,不同选法的种数为 10×9 C2C1C1= ×8×7=2520. 10 8 7 2 例6 某班要选举班干部,现有10名候选人. (1)从这10名候选人中任选5人组成班委,有多少种不同 的选法? (2)从这10名候选人中任选5人分别担任班委中五项不同 的职务,每项职务由一人担任,每人只担任一项职务,有多少种 不同的选法? 解 (1)从这10名候选人中任选5人组成班委,这是从10 个互不相同的元素中任取5个不同元素的组合问题,有 10×9×8×7×6 C5 = =252 10 5×4×3×2×1 种选法. (2)将选出的5名候选人按照职务的顺序排列,这是从10 个互不相同的元素中任取5个不同元素的排列问题,共有 P5 =10×9×8×7×6=30240 10 种选法. 练习6.3(2) 1.某班有20名男生、18名女生,现从中任选5人组成一个宣传小组,其中男生和女 生都有的选法有多少种? 2.从1、2、3、4、5这五个数字中任取两个不同的奇数和两个不同的偶数. (1)一共有多少种不同的选法? (2)可以组成多少个没有重复数字的四位奇数? 3 组合数的性质 在组合数公式 P犿 C犿= 狀(其中犿及狀是正整数,且犿≤狀) 狀 P犿 犿 狀! 中,将P 狀 犿= (狀-犿)! 代入,得 6 16 计数原理 狀! C 狀 犿= 犿!(狀-犿)! . 并规定C0=1.从而,上述公式对犿=0也成立. 狀 例7 已知犿是自然数,狀为正整数,且犿+1≤狀.求 犿+1 证:C犿= C犿+1. 狀 狀-犿 狀 证明 根据组合数公式,可以得到 犿+1 犿+1 狀! 狀-犿 C 狀 犿+1= 狀-犿 · (犿+1)!(狀-犿-1)! 狀! = 犿!(狀-犿)! =C犿. 狀 例8 已知犿是自然数,狀是正整数,且犿≤狀.求证: 这两个式子是组 合数的两个基本运算 (1)C犿=C狀-犿 ; 性质,在组合数的计 狀 狀 算、化简中起着非常 (2)C犿 =C犿+C犿-1. 重要的作用. 狀+1 狀 狀 证明 (1)根据组合数公式,可以得到 狀! 狀! C 狀 狀-犿= (狀-犿)![狀-(狀-犿)]! = 犿!(狀-犿)! =C犿. 狀 这个等式也可以根据组合数的定义得到.从狀个互不相同的 在计算C犿时,若 元素中任取犿个元素后,会剩下狀-犿个元素,因此,每一个从 狀 狀 犿> ,可利用此性 2 狀个互不相同的元素中任取犿个元素的组合,都唯一对应一个从 质,转化为C狀-犿来计算. 狀 狀个互不相同的元素中任取狀-犿个元素的组合;反过来,每一 个从狀个互不相同的元素中任取狀-犿个元素的组合,都唯一对 应一个从狀个互不相同的元素中任取犿个元素的组合.因此,从 狀个互不相同的元素中任取犿个元素的组合数,等于从狀个互不 相同的元素中任取狀-犿个元素的组合数,即C犿=C狀-犿. 狀 狀 (2)根据组合数公式,可以得到 狀! 狀! 利 用 能 组 否 合 类 数 似 的 于 定 (1 义 ), , C 狀 犿+C 狀 犿-1= 犿!(狀-犿)! + (犿-1)!(狀-犿+1)! 解释等式C犿 =C犿+ 狀+1 狀 狀!(狀-犿+1) 狀!犿 C犿-1? = + 狀 犿!(狀-犿+1)!犿!(狀-犿+1)! 6 26.3 组合 狀!(狀-犿+1+犿) = 犿!(狀-犿+1)! 狀!(狀+1) = 犿!(狀-犿+1)! (狀+1)! = 犿!(狀-犿+1)! =C犿 . 狀+1 例9 (1)计算C97 ; 100 (2)求满足等式C狀+1=C狀-1+C狀-2+C狀 的正整数狀. 狀+3 狀+1 狀 狀+1 解 (1)由性质C犿=C狀-犿 ,得 狀 狀 100×99×98 C97 =C3 = =161700. 100 100 3×2×1 (2)由性质C犿=C狀-犿 和C犿 =C犿+C犿-1 ,有 狀 狀 狀+1 狀 狀 C狀+1=C2 , 狀+3 狀+3 C狀-1+C狀-2+C狀 =C2 +C2+C1 =C2 +C2. 狀+1 狀 狀+1 狀+1 狀 狀+1 狀+2 狀 所以,已知等式可化为 C2 -C2 =C2. 狀+3 狀+2 狀 再由性质C犿 =C犿+C犿-1 ,有 狀+1 狀 狀 C1 =C2 , 狀+2 狀 即 狀(狀-1) 狀+2= , 2 即 狀2-3狀-4=0. 解得 狀=-1(舍去),狀=4. 1 2 故狀的值为4. 练习6.3(3) 1.解关于正整数狓的方程: (1)C狓2-狓=C5狓-5 ; 16 16 1 (2)C狓-2+C狓-3= P3 . 狓+2 狓+2 4 狓+3 2.观察下列等式及其所示的规律: 6 36 计数原理 C0+C1=C0+C1=C1 , 3 4 4 4 5 C0+C1+C2=C1+C2=C2 , 3 4 5 5 5 6 C0+C1+C2+C3=C2+C3=C3 , 3 4 5 6 6 6 7 并据此化简C0+C1+C2+C3+…+C狀 ,其中狀为正整数. 3 4 5 6 狀+3 习题6.3 犃组 1.平面上有10个点,其中有4个点在同一条直线上,除此以外,不再有三点共线. 问:由这些点可以确定多少条直线? 2.(1)从10男8女中任选5人,共有多少种不同的选法? (2)从10男8女中任选5人(男女都有)担任5项不同的工作,共有多少种不同的分 配方法? 3.从5名男生和3名女生中各任选2名参加一个歌唱小组,有多少种不同的选择 方案? 4.某批次200件产品中有5件次品,现从该批次中任取4件产品. (1)若4件产品都不是次品,则这样的取法有多少种? (2)若4件产品中至少有1件次品,则这样的取法有多少种? (3)若4件产品不都是次品,则这样的取法有多少种? 5.从5名外语系大学生中任选4名参加翻译、交通、礼仪三项义工活动,要求翻译有 2人参加,交通和礼仪各有1人参加.问:不同的分配方法共有多少种? 6.某小组共有10名学生,其中女生3名.现任选2名代表,则至少有1名女生当选 的选法有多少种? 7.设狀为正整数,求值: (1)C狀-1 +C2狀-3 ; (2)C3狀 +C3狀-1+C3狀-2+…+C17-狀. 2狀-3 狀+1 13+狀 12+狀 11+狀 2狀 8.求满足等式C犽=C2犽-3 的所有正整数犽. 18 18 犿+1 9.证明:C犿= C犿+1 ,其中犿是自然数,狀是正整数,且犿≤狀. 狀 狀+1 狀+1 犅组 1.把4本不同的书全部分给3名学生,每人至少1本,有多少种不同的分法? 2.袋中装有犿个红球和狀个白球,且犿≥狀≥2.这些红球和白球的大小及质地都相 6 46.3 组合 同.从袋中同时任取2个球,若2个球都是红球的取法总数是2个球颜色不同的取法总数 的整数倍,求证:犿必为奇数. 3.如图,在∠犃犗犅的两边犗犃、犗犅上分别有5个点和6个点(都不同于点犗),这连 同点犗在内的12个点可以确定多少个不同的三角形? (第3题) 4.有12名翻译人员,其中3人只能翻译英语,4人只能翻译法语,其余5人既能翻 译英语,也能翻译法语.从这12名翻译人员中任选6人,其中3人翻译英语,3人翻译法 语,有多少种不同的分配方法? 5.利用组合数的性质化简:C3+C3+C3+…+C3. 3 4 5 狀 6 56 计数原理 计数原理在 6.4 古典概率中的应用 我们知道,如果一次试验有狀个等可能出现的基本事件,而 随机事件犃包含犽个基本事件,那么事件犃发生的概率是 犽 犘(犃)= . 狀 当狀值较大时,枚举法难以使用,就需要利用排列组合的知识. 例1 一个罐子中有大小与质地完全相同的20个玻璃球, “大小与质地完全 其中4个是红色的,6个是黑色的,10个是白色的.经充分混合 相同”和“经充分混合” 这两个条件,保证了 后,从罐子中同时任取2个球,求下列事件的概率: 各个基本事件的发生 是等可能的. (1)2个球都是黑色的; (2)2个球的颜色不同. 解 随机地从20个球中取出2个球,可能出现的结果有C2 20 种,即所有的基本事件有C2 个. 20 (1)将“取出的2个球都是黑色的”这一事件记为犃.犃所包 含的基本事件有C2 个,因此事件犃的概率是 6 C2 3 犘(犃)= 6= . C2 38 20 (2)将“取出的2个球颜色不同”的事件记为犅.“取出的2个 球颜色不同”可以分为三种情况:(1)取出1个红球、1个黑球;(2) 取出1个黑球、1个白球;(3)取出1个白球、1个红球.由乘法原 理和加法原理,易知犅所包含的基本事件有C1C1+C1C1 +C1C1 4 6 6 10 10 4 个,所以事件犅的概率是 C1C1+C1C1 +C1C1 62 犘(犅)= 4 6 6 10 10 4= . C2 95 20 例2 在100件产品中有90件一等品、10件二等品,从 中随机抽取4件产品. (1)求恰好含1件二等品的概率; (2)求至少含有1件二等品的概率. (以上结果均精确到0.01) 6 66.4 计数原理在古典概率中的应用 解 从这100件产品中随机抽取4件产品,所有的基本事件 的个数为C4 . 100 (1)将“恰好含1件二等品”的事件记为犃.由乘法原理和加法 原理,易知犃所包含的基本事件有C3C1 个,所以事件犃的概率是 90 10 C3C1 1174800 90 10= ≈0.30. C4 3921225 100 (2)将“至少含有1件二等品”的事件记为犅.犅的对立事件 犅珚为“4件产品全是一等品”,而犅珚所包含的基本事件有C4 个, 90 所以 犘(犅珚)= C4 90= 2555190 , C4 3921225 100 从而事件犅的概率是 犘(犅)=1-犘(犅珚)≈0.35. 例3 某学习小组共有10名学生,求其中至少有2名学 生在同一月份出生的概率.(默认每月天数相同,结果精确 到0.001) 解 由于每名学生的出生月份可能是1月到12月中的任何 一个,因此10名学生的出生月份共有1210 种可能的排列,每个 排列对应一个基本事件,从而基本事件就有1210 个,且每个基本 事件发生的概率都相等.设犃表示事件“10名学生中没有任何2 名学生在同一月份出生”,那么10名学生的出生月份共有P10 种 12 可能的排列,即事件犃包含P10 个基本事件,所以事件犃的概 12 率是 P10 犘(犃)= 12. 1210 这样,“至少有2名学生在同一月份出生”的概率是 1-犘(犃)≈0.996. 练习6.4 1.袋中装有4个红球、3个黄球、3个白球,所有小球的大小与质地完全相同.从中 同时任取2个小球,求取出的2个球颜色相同的概率. 2.某校要从2名男生和4名女生中任选4人担任一项赛事的志愿者工作,每个人被选 中的可能性相同.求在选出的志愿者中,男生和女生都有的概率. 6 76 计数原理 习题6.4 犃组 1.将两颗质地均匀的骰子同时抛掷一次,求向上的点数之和为5的概率. 2.用1、2、3、4、5组成没有重复数字的三位数,从中随机地取一个,求取到的数为 奇数的概率. 犅组 1.从甲、乙、丙、丁、戊五人中任选两人参加一项活动,求甲、乙两人中至少有一人 被选中的概率. 2.在10件产品中有8件一等品、2件二等品,从中随机抽取2件产品.求取到的产品 中至多有1件二等品的概率. 3.某校高一年级举行演讲比赛,共有10名学生参赛,其中一班有3名,二班有2名, 其他班有5名.若采用抽签的方式确定他们的演讲顺序,求一班的3名学生恰好被排在一 起(指演讲序号相连)的概率. 6 86.5 二项式定理 6.5 二项式定理 1 杨辉三角和二项式定理 我们知道,对于任意的犪、犫,都有 (犪+犫) 2=犪2+2犪犫+犫2 , (犪+犫) 3=犪3+3犪2犫+3犪犫2+犫3 , (犪+犫) 4=犪4+4犪3犫+6犪2犫2+4犪犫3+犫4 , (犪+犫) 5=犪5+5犪4犫+10犪3犫2+10犪2犫3+5犪犫4+犫5. 我们把等式右边的代数式称为(犪+犫) 犽 的二项展开式,其 中犽=2,3,4,5.一般地,对于任意正整数狀,(犪+犫) 狀 的二项 展开式有什么规律呢? 在狀的取值不大的情况下,也可以利用下面的数阵求(犪+犫) 狀 的二项展开式中各项的系数: (犪+犫) 1 (犪+犫) 2 (犪+犫) 3 (犪+犫) 4 (犪+犫) 5 这个数阵的特点是:①每一行的第一个数和最后一个数都 是1.②每一行中,除了第一个数和最后一个数外,每个数等 请将特点①和特 点②用组合数的公式 于它“肩上”的两个数之和.③当狀为偶数时,最大的系数是 表示. 中间一项;当狀为奇数时,最大的系数是中间两项. 在我国数学家杨辉于1261年所著的《详解九章算法》中出现 了类似的图表(类似于图651),习惯上称之为杨辉三角,杨辉 杨辉,字谦光, 钱塘(今杭州)人.中 在该图旁注明 “贾宪用此术”,故亦称贾宪三角.它是中国古代 国南宋末年数学家、 数学教育家.约在13 数学的杰出研究成果之一. 世纪中叶至后半叶活 动于苏、杭一带. 6 96 计数原理 西方称类似表格 为帕斯卡三角形. 图651 一般地,我们有下面的 定理 设狀是正整数,等式 (犪+犫) 狀=C0犪狀+C1犪狀-1犫+C2犪狀-2犫2+…+C狉犪狀-狉犫狉+…+C狀犫狀 狀 狀 狀 狀 狀 称为二项式定理.犜 =C狉犪狀-狉犫狉 表示(犪+犫) 狀 的二项展 狉+1 狀 开式中的第狉+1项,其中狉=0,1,2,…,狀. 证明 当狀=1时, (犪+犫) 1=犪+犫=C0犪1犫0+C1犪0犫1. 1 1 假设狀=犽(犽为正整数)时, 在讨论二项式定 理相关内容时,我们 (犪+犫) 犽=C0犪犽犫0+C1犪犽-1犫1+C2犪犽-2犫2 约定犪0=犫0=1. 犽 犽 犽 +…+C狉犪犽-狉犫狉+…+C犽犪0犫犽. 犽 犽 则当狀=犽+1时,根据多项式的乘法运算规则,有 (犪+犫) 犽+1=(犪+犫)(犪+犫) 犽 =(犪+犫)(C0犪犽犫0+C1犪犽-1犫1+C2犪犽-2犫2 犽 犽 犽 +…+C狉犪犽-狉犫狉+…+C犽犪0犫犽 ) 犽 犽 =C0犪犽+1犫0+(C1+C0 )犪犽犫1+(C2+C1 )犪犽-1犫2 犽 犽 犽 犽 犽 +…+(C狉+C狉-1 )犪犽-狉+1犫狉 犽 犽 +…+(C犽+C犽-1 )犪1犫犽+C犽犪0犫犽+1. 犽 犽 犽 从而由性质C犿 =C犿+C犿-1 和C0=C狀=1,得 狀+1 狀 狀 狀 狀 (犪+犫) 犽+1 =C0 犪犽+1犫0+C1 犪(犽+1)-1犫1+C2 犪(犽+1)-2犫2 犽+1 犽+1 犽+1 7 06.5 二项式定理 +…+C狉 犪(犽+1)-狉犫狉+…+C犽+1犪0犫犽+1. 犽+1 犽+1 所以,由数学归纳法,对于犪、犫和正整数狀,都有 (犪+犫) 狀=C0犪狀犫0+C1犪狀-1犫1+C2犪狀-2犫2 狀 狀 狀 +…+C狉犪狀-狉犫狉+…+C狀犪0犫狀. 狀 狀 ( ) 1 例1 求狓+ 5的二项展开式. 狓 ( ) 1 解 由二项式定理,狓+ 5的二项展开式是 狓 10 5 1 狓5+5狓3+10狓+ + + . 狓 狓3 狓5 例2 求(3-2狓) 6 的二项展开式中狓3 项的系数. 解 由二项式定理,(3-2狓) 6 的二项展开式中的第狉+1项 为犜 =C狉36-狉 (-2狓) 狉 ,其中狉=0,1,2,…,6.令狉=3, 狉+1 6 得狓3 项的系数是C333 (-2) 3=-4320. 6 例3 利用(犪+1) 狀 的二项展开式,证明:1530-1是7 的倍数. 证明 由二项式定理,我们有 (犪+1) 狀=犪狀+C1犪狀-1+C2犪狀-2+…+C狀-1犪+C狀 狀 狀 狀 狀 =犪狀+C1犪狀-1+C2犪狀-2+…+C狀-1犪+1. 狀 狀 狀 在其中令犪=14,得 (14+1) 狀=14狀+14狀-1C1+14狀-2C2+…+14C狀-1+1, 狀 狀 狀 从而 15狀-1=14狀+14狀-1C1+14狀-2C2+…+14C狀-1. 狀 狀 狀 显然,等号右边的每一项都是7的倍数,所以15狀-1是7的倍 数.于是,1530-1也一定是7的倍数. 练习6.5(1) 1.(1)求(狓-槡2狔) 8 的二项展开式; ( ) (2)求狓-狓-1 12的二项展开式中的常数项; 3 ( ) 2 (3)求狓- 9的二项展开式中狓3 的系数; 狓 (4)在(1-狓2 ) 20 的二项展开式中,如果第4狉项和第狉+2项的系数的绝对值相等,求 此展开式的第4狉项. 2.利用二项式定理证明:7100-1是8的倍数. 7 16 计数原理 二项式定理的应用 2 ———组合数的性质 在二项式定理中,特别令犪=1,犫=1,就得到 在二项展开式中 代入适当的特殊值, 会得到一些与组合数 C0+C1+C2+…+C狀=2狀. 狀 狀 狀 狀 有关的特殊的恒等式. 令犪=1,犫=-1,就得到 C0-C1+C2-C3+…+(-1) 狀C狀=0. 狀 狀 狀 狀 狀 由上述二式就得到 C0+C2+C4+…=C1+C3+C5+…=2狀-1. 狀 狀 狀 狀 狀 狀 例4 已知对任意给定的实数狓,都有 (1+2狓) 100=犪+犪(狓-1)+犪 (狓-1) 2+…+犪 (狓-1) 100. 0 1 2 100 求值: (1)犪+犪+犪+…+犪 ; 0 1 2 100 (2)犪+犪+犪+…+犪 . 1 3 5 99 解 令狓-1=狔,则狓=狔+1,从而 1+2狓=1+2(狔+1)=3+2狔, 犪+犪(狓-1)+犪(狓-1) 2+…+犪 (狓-1) 100 0 1 2 100 =犪+犪狔+犪狔2+…+犪 狔100. 0 1 2 100 因此,已知的等式可改写为 (3+2狔) 100=犪+犪狔+犪狔2+…+犪 狔100. 0 1 2 100 (1)令狔=1,得 犪+犪+犪+…+犪 =5100. 0 1 2 100 (2)令狔=-1,得 犪-犪+犪-犪+…-犪 +犪 =1. 0 1 2 3 99 100 二式联立就得到 5100-1 犪+犪+…+犪 = . 1 3 99 2 例5 证明:在狀+1个组合数C0 ,C1 ,C2 ,…,C狀 中, 狀 狀 狀 狀 当狀为偶数时,最大值是中间的一项C狀;而当狀为奇数时,最 狀2 大值是中间的两项C狀-1 和C狀+1. 狀2 狀2 证明 对于任给的狉∈{0,1,2,…,狀-1},有 7 26.5 二项式定理 狀! C狉+1 (狉+1)!(狀-狉-1)! 狀-狉 狀 = = . C狉 狀! 狉+1 狀 狉!(狀-狉)! 狀-狉 狀-1 由于C狉+1>0且C狉>0,因此当 >1即狉< 时,C狉+1> 狀 狀 狉+1 2 狀 狀-狉 C狉 ;而当 <1时,C狉+1<C狉. 狀 狉+1 狀 狀 烄 狀-2烌 若狀为偶数,则当狉∈烅0,1,2,…, 烍 时, 烆 2 烎 C0<C1<C2<…<C狀-2<C狀; 狀 狀 狀 狀2 狀2 烄狀狀 烌 而当狉∈烅 , +1,…,狀-1烍 时, 烆2 2 烎 C狀>C狀+1>…>C狀. 狀2 狀2 狀 所以,当狀为偶数时,最大值是中间的一项C狀. 狀2 烄 狀-3烌 若狀为奇数,则当狉∈烅0,1,2,…, 烍 时, 烆 2 烎 C0<C1<C2<…<C狀-3<C狀-1; 狀 狀 狀 狀2 狀2 狀-1 当狉= 时, C狉+1 = C狉 , 即 C狀-1 = C狀+1;而 当 狉∈ 2 狀 狀 狀2 狀2 烄狀+1狀+3 烌 烅 , ,…,狀-1烍 时, 烆 2 2 烎 C狀+1>C狀+3>…>C狀. 狀2 狀2 狀 所以,当狀为奇数时,最大值是中间的两项C狀-1 及C狀+1. 狀2 狀2 例6 求(1+3狓) 15 的二项展开式中系数最大的项. 解 对狉=0,1,2,…,15,二次展开式中的第狉+1项是 犜 =C狉 (3狓) 狉.设这一项的系数为犮 ,就有犮 =3狉C狉.显 狉+1 15 狉+1 狉+1 15 然,犮 >0. 狉+1 因此,对于狉∈{0,1,2,…,14},就有 犮 3狉+1C狉+1 44-4狉 狉+2-1= 15 -1= . 犮 3狉C狉 狉+1 狉+1 15 所以,当狉∈{0,1,2,…,10}时,犮 >犮 成立,即犮>犮>…> 狉+2 狉+1 12 11 犮;当狉=11时,犮 =犮 ,即犮=犮;而当狉∈{12,13,14}时, 1 狉+2 狉+1 12 13 犮 <犮 成立,即犮<犮<犮<犮. 狉+2 狉+1 16 15 14 13 因此,系数最大的项是第12项C11311狓11=241805655狓11 和 15 第13项C12312狓12=241805655狓12 ,其中C11311=C12312. 15 15 15 7 36 计数原理 练习6.5(2) 1.(1)若(1-狓) 6=犪+犪狓+犪狓2+…+犪狓6 ,求犪+犪+犪+…+犪 的值; 0 1 2 6 0 1 2 6 (2)已知(狓+1) 狀=犪+犪(狓-1)+犪(狓-1) 2+犪(狓-1) 3+…+犪(狓-1) 狀 (狀≥2, 0 1 2 3 狀 狀为正整数),求犪+犪+犪+…+犪 的值. 0 1 2 狀 2.(1)求(1+2狓) 7 的二项展开式中系数最大的项; (2)求(1-2狓) 7 的二项展开式中系数最大的项. 习题6.5 犃组 ( ) 1 1.求 2狓2- 6的二项展开式中的中间项. 狓 ( ) 1 2.求狓+ 10的二项展开式中的常数项. 狓 ( ) 1 3.在 槡狓+ 24的二项展开式中,狓的幂指数是负数的项一共有多少个? 槡3狓 ( ) 1 4.求狓+ 8的二项展开式中系数最大的项. 2 ( ) 1 5.已知狓>0,且 狓+ 9 的二项展开式中,第二项不大于第三项.求实数狓的取值 狓3 范围. 犅组 1.已知(1+狓) 10=犪+犪(1-狓)+犪(1-狓) 2+…+犪 (1-狓) 10 ,求犪 的值. 0 1 2 10 8 2.求(3-2狓) 9 的二项展开式中系数最大的项. 3.设犳(狓)=(1+狓) 犿+(1+狓) 狀 (犿、狀为正整数).若二项展开式中关于狓的一次项 系数之和为11,则当犿、狀为何值时,含狓2 项的系数取得最小值? 4.在(1+狓) 狀 的二项展开式中,设奇数项之和为犃,偶数项之和为犅.求证:犃2-犅2= (1-狓2 ) 狀. 7 46.5 二项式定理 课后阅读 利用组合的定义和多项式的乘法规则证明二项式定理 先来考察(犪+犫) 3=(犪+犫)(犪+犫)(犪+犫)的二项展开式. 根据多项式的乘法运算规则,(犪+犫) 3 的二项展开式中的每一 项是从(犪+犫)(犪+犫)(犪+犫)的每一个括号中任意取出一个字母的 从特殊到一般, 这是数学中常用的研 乘积,因而展开式的每一项都是三次式,即(犪+犫) 3 的二项展开式 究方法. 恰由以下4个形式的项组成: 犪3 ,犪2犫,犪犫2 ,犫3. 对于每一项的系数,可以利用组合的定义得到: 犪3 相当于3个括号中,每一个都不取字母犫,这样的取法有C0 种,所以犪3 的系数为 3 C0=1; 3 犪2犫相当于3个括号中,恰有一个取出字母犫,这样的取法有C1 种,所以犪2犫的系数 3 为C1=3; 3 犪犫2 相当于3个括号中,恰有两个取出字母犫,这样的取法有C2 种,所以犪犫2 的系数 3 为C2=3; 3 犫3 相当于3个括号中,每一个都取出字母犫,这样的取法有C3 种,所以犫3 的系数为 3 C3=1. 3 因此,(犪+犫) 3 的二项展开式可以写为 C0犪3+C1犪2犫+C2犪犫2+C3犫3. 3 3 3 3 一般地,对于(犪+犫) 狀=(犪+犫)(犪+犫)…(犪+犫),根据多项式的乘法运算规则,(犪+犫) 狀 烏 烐 烑 狀个括号 的二项展开式中的每一项是从(犪+犫)(犪+犫)…(犪+犫)的每一个括号中任意取出一个字母 烏 烐 烑 狀个括号 的乘积,因而展开式的每一项都是一个狀次式,即(犪+犫) 狀 的二项展开式由以下狀+1个 形式的项组成: 犪狀 ,犪狀-1犫,…,犪狀-狉犫狉 ,…,犪犫狀-1 ,犫狀 ,其中狉=0,1,…,狀. 类似于上面的分析,对于狉=0,1,…,狀,犪狀-狉犫狉 相当于狀个括号中,恰有狉个取出 字母犫,这样的取法有C狉 种,所以犪狀-狉犫狉 的系数为C狉.因此,(犪+犫) 狀 的二项展开式可以 狀 狀 写为 C0犪狀+C1犪狀-1犫+C2犪狀-2犫2+…+C狉犪狀-狉犫狉+…+C狀犫狀. 狀 狀 狀 狀 狀 7 56 计数原理 内容提要 1.乘法原理(分步计数原理):做一件事,需要依次完成狀个步骤,其中完成第一步 有犪 种不同的方法,完成第二步有犪 种不同的方法,……,完成第狀步有犪 种不同的 1 2 狀 方法,那么完成这件事共有犪犪…犪 种不同的方法. 1 2 狀 2.加法原理(分类计数原理):做一件事,完成它有狀类办法,其中第一类办法有犪 1 种不同的方法,第二类办法有犪 种不同的方法,……,第狀类办法有犪 种不同的方法, 2 狀 那么完成这件事共有犪+犪+…+犪 种不同的方法. 1 2 狀 3.乘法原理和加法原理是关于计数的两个基本原理,它们是推导排列数、组合数公 式的基础,在解题中应正确区分和灵活使用. 4.从狀个互不相同的元素中,取出犿(犿≤狀)个不同元素按照一定的顺序排成一列, 叫做从狀个元素中取出犿个元素的一个排列.所有这样的排列的个数(排列数)用符号P犿 狀 狀! 表示,其值为P犿=狀(狀-1)(狀-2)…(狀-犿+1)= ,而狀!=狀(狀-1)(狀-2)… 狀 (狀-犿)! 3·2·1. 5.从狀个互不相同的元素中,取出犿(犿≤狀)个不同元素作为一组,叫做从狀个元素 中取出犿个元素的一个组合.所有这样的组合的个数(组合数)用符号C犿 表示,其值为C犿 狀 狀 P犿 狀! = 狀= . P犿 犿!(狀-犿)! 犿 6.已知犿是自然数,狀是正整数,且犿≤狀,则C犿=C狀-犿 ,C犿 =C犿+C犿-1. 狀 狀 狀+1 狀 狀 7.排列和组合是两个基本的计数问题,在解决实际问题时,要善于分析问题的条件, 把问题转化为相应的排列或组合问题. 8.等式(犪+犫) 狀=C0犪狀+C1犪狀-1犫+C2犪狀-2犫2+…+C狉犪狀-狉犫狉+…+C狀犫狀 称为二项式 狀 狀 狀 狀 狀 定理.等式右边的第狉+1项为犜 =C狉犪狀-狉犫狉 (狉=0,1,2,…,狀-1,狀). 狉+1 狀 9.对任意正整数狀,C0+C1+C2+…+C狀=2狀. 狀 狀 狀 狀 复习题 犃组 1.如图,用6种不同的颜色将犃、犅、犆三个区域涂色,每个区域涂上一种颜色,且 有公共边的区域不能涂同一种颜色.问:不同的涂色方法共有多少种? 7 6复习题 犃 犅 犆 (第1题) 2.5个工程队分别承建某项工程的5个不同的子项目,每个工程队各承建其中的1 项,且甲工程队不能承建1号子项目.问:不同的承建方案有多少种? 3.从0、1、2、3、4、5六个数字中任取四个数字,可以组成多少个没有重复数字、 且为奇数的四位数? 4.解关于正整数狓的方程:11C3=24C2 . ( ) 狓 狓+1 1 5.已知狓2+ 狀的二项展开式的各项系数之和为32,求该二项展开式中狓的系数. 狓 6.若(1-2狓) 4=犪+犪狓+犪狓2+犪狓3+犪狓4 ,求|犪|+|犪|+|犪|的值. ( )0 1 2 3 4 0 1 3 1 7.若狓6+ 狀的二项展开式中含有常数项,求狀的最小值. 狓槡狓 犅组 1.7名学生站成一排拍毕业纪念照,其中甲必须站在正中间,并且乙、丙2名学生要 站在一起.问:有多少种不同的排法? 2.将5个不同的小球分别放到3个不同的盒子中,要求每个盒子都不空.问:有多少 种不同的放法? 3.从7名男乒乓球队员、5名女乒乓球队员中任选4名进行男女混合双打,不同的分 组方法有多少种? 4.3名男生、4名女生排成一行.在下列要求下,分别求不同排列方法的种数: (1)甲不在最左边,乙不在最右边; (2)男生必须排在一起; (3)男生和女生相间排列; (4)在甲、乙两人中间必须有3人. 5.一个口袋内有4个不同的红球、6个不同的白球. (1)从中任取4个球,红球的个数不比白球少的取法有多少种? (2)若取一个红球记2分,取一个白球记1分.从中任取5个球,使总分不少于7分 的取法有多少种? 6.设(2-槡3狓) 100=犪+犪狓+犪狓2+…+犪 狓100 ,求下列各式的值: 0 1 2 100 (1)犪; 0 (2)犪+犪+犪+…+犪 ; 1 3 5 99 (3)(犪+犪+犪+…+犪 ) 2-(犪+犪+…+犪 ) 2. 0 2 4 100 1 3 99 7.利用二项式定理,求5555 被8除所得的余数. 7 76 计数原理 拓展与思考 1.设集合犃是由所有满足下面条件的有序数组(狓,狓,狓,狓,狓)构成的:每一个元 1 2 3 4 5 素狓 等于0、1、-1中之一,其中犻=1,2,3,4,5.那么集合犃中满足条件“1≤|狓| 犻 1 +|狓|+|狓|+|狓|+|狓|≤3”的元素有多少个? 2 3 4 5 1 2.利用二项式定理证明:对于任意正整数狀, [(2+槡5) 狀-(2-槡5) 狀 ]都是正整数. 槡5 7 8第7章 概率初步(续) 本章作为概率初步(必修课程第12章)的续篇,将重点 介绍条件概率、概率的乘法公式以及全概率公式.条件概率 表示所考察的事件在其他事件发生的条件下的概率,是概 率论中的一个重要概念.由条件概率可以得到全概率公式和 贝叶斯公式等重要公式,它们是计算概率的重要方法,并 进一步展示了概率的直观含义.本章还将介绍随机变量的概 念及其分布,以及它们的期望与方差,最后简单地介绍几 个重要而基本的概率模型与正态分布. 书书书7 概率初步(续) 条件概率与 7.1 相关公式 1 条件概率 假设一个袋子里装有大小与质地相同的2个黑球、3个白 球,两人依次随机不放回地摸1个球,可知第一个人摸到白球的 3 概率为 ,那么第二个人摸到白球的概率是多少呢?第二个人摸 5 到白球的概率是否与第一个人相同?有的人会认为:如果第一个 人摸到的是白球,那么剩下的白球还有2个,第二个人摸到白球 1 的概率应是 ;而如果第一个人摸到的是黑球,那么剩下的白球 2 3 还有3个,第二个人摸到白球的概率应是 .人们必然会产生疑 4 惑:第二个人摸到白球的概率究竟是多少? 其实,我们刚才所说的是两个不同意义的概率:一个是以前 讨论过的概率,一个则是本章要介绍的条件概率.我们知道,一 个事件发生的概率是该事件的一个属性,它不会因为其他事件是 否发生而改变.但是我们可以谈论在其他事件发生的条件下,该事 件发生的概率.这时候谈论的就是条件概率,而不是原本的概率. 从上面这个例子看,设事件犃是第一个人摸到白球,事件 犅是第二个人摸到白球.当犃发生之后,袋子里剩下4个球,其 中2个白球、2个黑球.这样,对第二个摸球的人来说,相应的 随机现象就与第一个人摸球之前不同,样本空间也不同了.这时 1 犅发生的概率是 ,这是条件概率. 2 什么是条件概率(conditionalprobability)?在古典概率模型 注意“求事件犃 发生且事件犅发生的 中,事件犃发生之后,随机现象的结果就剩下事件犃中的基本 概率”与“已知事件犃 发生,求事件犅发生 事件,所以事件犃变成了由这些基本事件所构成的新的样本空 的概率”两者的不同. 间.这个样本空间仍然是等可能的,这时事件犅发生的概率称为 8 07.1 条件概率与相关公式 事件犅基于条件犃的概率,或在事件犃发生的条件下,事件犅 发生的概率,或已知事件犃发生,事件犅发生的概率,记为 犘(犅|犃).事实上,这等于是在一个样本空间为犃的随机试验 中,求事件犃∩犅发生的概率,即 |犃∩犅| 犘(犅|犃)= . |犃| 将上式的分子、分母同时除以|Ω|,就得到条件概率公式: 在事件犃发生的条件下,事件犅发生的概率是 犘(犃∩犅) 前一个公式适用 犘(犅|犃)= . 犘(犃) 于古典概率模型,后 一个公式适用于所有 的情况. 例1 掷一颗骰子并观察出现的点数.已知出现的点数不 超过3,求出现的点数是奇数的概率. 解 设事件犃表示“出现的点数不超过3”,事件犅表示“出 现的点数是奇数”.题目所求概率是事件犃发生的条件下,事件 犅发生的概率,也就是求犘(犅|犃).因为犃={1,2,3},犅= 2 {1,3,5},所以犃∩犅={1,3},从而犘(犃∩犅)= .因此 6 2 犘(犃∩犅) 6 2 犘(犅|犃)= = = . 犘(犃) 3 3 6 如果已知相应的条件概率,那么就可以计算两事件同时发生 的概率:事件犃、犅同时发生的概率等于犃发生的概率与在犃 发生的条件下犅发生的概率的乘积,即 犘(犃∩犅)=犘(犃)犘(犅|犃). 这个公式称为概率的乘法公式. 例2 一个罐子中有大小与质地相同的黑、白、红三个 球,不放回地摸球.求: (1)在第一次没有摸到黑球的条件下,第二次也没有摸到黑 球的概率; 8 17 概率初步(续) (2)两次都没有摸到黑球的概率. 解 用犃、犅分别表示第一次、第二次没有摸到黑球的事件. (1)第一个问题是计算条件概率.犃发生之后,罐子中还有 两个球,且其中一个是黑球,所以 1 犘(犅|犃)= . 2 (2)第二个问题是计算犃、犅同时发生的概率.已知 2 1 犘(犃)= ,犘(犅|犃)= ,由概率的乘法公式,有 3 2 2 1 1 犘(犃∩犅)=犘(犃)犘(犅|犃)= × = . 3 2 3 如果事件犃与犅独立,那么就有犘(犃∩犅)=犘(犃)犘(犅), 从而条件概率 犘(犃∩犅) 犘(犃)犘(犅) 犘(犅|犃)= = =犘(犅). 犘(犃) 犘(犃) 这说明在两个事件独立的情况下,条件概率等于概率.反 之,若条件概率等于概率,则两个事件是独立的. 练习7.1(1) 1.一个家庭有两个孩子. (1)已知年龄大的是女孩,求年龄小的也是女孩的概率; (2)已知其中一个是女孩,求另一个也是女孩的概率. 2.掷一颗骰子,令事件犃={2,3,5},犅={1,2,4,5,6}.求犘(犃)、犘(犅)、 犘(犃∩犅)及犘(犃|犅). 3.在一个盒子中有大小与质地相同的20个球,其中10个红球,10个白球.两人依次 不放回地各摸1个球,求: (1)在第一个人摸出1个红球的条件下,第二个人摸出1个白球的概率; (2)第一个人摸出1个红球,且第二个人摸出1个白球的概率. 2 全概率公式 全概率公式是指一个事件发生的概率是其在不同条件下发生 概率的加权平均,这是一个简单直观的重要公式. 8 27.1 条件概率与相关公式 例3 假设某产品的一个部件来自三个供应商,供货占比 1 1 1 分别是 、 、 ,而它们的良品率分别是0.96、0.90、0.93. 2 6 3 问:该部件的总体良品率是多少? 解 总体良品率显然不是三个良品率的简单平均,而是与部 件供应商的供货占比有关.因此,总体良品率为 1 1 1 0.96× +0.90× +0.93× =0.48+0.15+0.31=0.94, 2 6 3 即为这三个供应商良品率的加权平均,而其中的权重就是供货 占比. 这正应用了全概率公式的思想.设某个随机试验的结果可以 分成狀种情况,即设样本空间Ω可分成狀个两两不同时发生(两 两互斥)的事件Ω,Ω,…,Ω,即 1 2 狀 Ω=Ω∪Ω∪…∪Ω, 1 2 狀 且当犻≠犼时有Ω∩Ω=.因此有 犻 犼 ∑狀 犘(Ω)=1. 犽 犽=1 一个事件犃的发生可以看作是在不同情况下分别发生,即 成立 犃=(犃∩Ω)∪(犃∩Ω)∪…∪(犃∩Ω). 1 2 狀 因此,由概率的可加性和乘法公式,得 犘(犃)=犘(犃∩Ω)+犘(犃∩Ω)+…+犘(犃∩Ω) 1 2 狀 =犘(犃|Ω)犘(Ω)+犘(犃|Ω)犘(Ω)+…+犘(犃|Ω)犘(Ω). 1 1 2 2 狀 狀 于是我们得到全概率公式 ∑狀 全概率公式是概 犘(犃)= 犘(犃狘Ω)犘(Ω). 率的可加性与乘法公 犽 犽 式的组合. 犽=1 所以犘(犃)实际上是条件概率犘(犃|Ω)的加权平均,而条件概 犽 率犘(犃|Ω)的权重为犘(Ω),犽=1,2,…,狀. 犽 犽 全概率公式是计算概率的一种重要方法.现在我们用它来回 答抽签时抽到好签的概率是否与抽签顺序有关的问题. 8 37 概率初步(续) 例4 证明:在抽签的时候,抽到好签的概率与抽签顺序 没有关系. 我们经常简单地 说“抽 签 与 顺 序 无 解 抽签的方式有两种:放回与不放回.放回的情况很简 关”,实际上是指抽 到什么签的可能性与 单,因为每次的结果是相互独立的,所以当然与顺序无关.对于 顺序无关. 不放回的情况,我们用前面不放回摸球的例子来说明. 假设一个袋子中装有大小与质地相同的3个白球、2个黑 球,5个人依次不放回地摸球,下面证明每个人摸到白球的概率 3 都是 . 5 用事件犃表示第一个人摸到白球,事件犅表示第二个人摸 3 到白球.显然,犘(犃)= .第二个人摸球的时候有两种可能的情 5 况:一种是犃发生,即第一个人摸到白球,这时袋子中剩有2 白2黑;另一种是犃没有发生,即第一个人摸到黑球,这时袋 子中剩有3白1黑.在第一种情况下,条件概率为犘(犅|犃)= 2 3 ;而在第二种情况下,条件概率为犘(犅|犃)= .由于上述两 4 4 3 2 种情况发生的概率分别是 和 ,因此可以直观地看出犅发生的 5 5 概率应该是两个条件概率的加权平均,即 2 3 3 2 12 3 犘(犅)= × + × = = , 4 5 4 5 20 5 其值与犘(犃)相等. 第三个人摸球,记他摸到白球的事件为犆,其概率是多少 呢?前面两个人摸球会产生四种可能的情况: Ω=犃∩犅,Ω=犃∩犅,Ω=犃∩犅,Ω=犃∩犅. 1 2 3 4 用乘法公式,这四种情况发生的概率分别是 3 2 6 3 2 6 2 3 6 2 1 2 × = , × = , × = , × = . 5 4 20 5 4 20 5 4 20 5 4 20 例如, 3 2 6 犘(Ω)=犘(犃∩犅)=犘(犃)犘(犅|犃)= × = , 2 5 4 20 其余同理.在这四种情况下,袋子中剩下的黑、白球的个数分别 是:1白2黑、2白1黑、2白1黑、3白0黑,因此事件犆的条 1 2 2 件概率分别是 、 、 、1.再应用全概率公式,就推出 3 3 3 8 47.1 条件概率与相关公式 ∑4 犘(犆)= 犘(犆狘Ω)犘(Ω) 犽 犽 犽=1 1 6 2 6 2 6 2 = × + × + × +1× 3 20 3 20 3 20 20 36 3 = = , 60 5 其值仍与犘(犃)相等. 请详细证明第四、 3 类似地,第四、第五个人摸到白球的概率仍然是 ,也就是 第五个人摸到白球的 5 3 概率仍然是 . 5 说,摸到白球的概率与摸球的顺序无关. 例5 设有两个罐子,犃罐中放有2个白球、1个黑球, 犅罐中放有3个白球,这些球的大小与质地相同.现在从两个罐 子中各摸1个球并交换,求这样交换2次后,黑球还在犃罐中 的概率. 解 用犃、犃 分别表示事件交换1次、2次后黑球还在犃 1 2 罐中.易见犃 相当于第一次摸球的时候没有摸到黑球,其概率 1 2 2 为 ,即犘(犃)= .第一次交换之后,有两种可能的情况:一 3 1 3 2 种是黑球在犃罐中,其概率是 ;另一种是黑球在犅罐中,其 3 1 概率是 .由全概率公式 3 犘(犃)=犘(犃|犃)犘(犃)+犘(犃|犃)犘(犃), 2 2 1 1 2 1 1 其中犘(犃|犃)是已知黑球在犃罐中、再次交换后还在犃罐中 2 1 2 的条件概率,它等于第二次没有摸到黑球的概率,是 ;类似 3 地,犘(犃|犃)是已知黑球在犅罐中、再次交换后又回到犃罐 2 1 1 中的条件概率,它等于第二次摸到黑球的概率,是 .因此 3 2 2 1 1 5 犘(犃)= × + × = . 2 3 3 3 3 9 练习7.1(2) 1.公司库房中的某个零件的70%来自A公司,30%来自B公司,两个公司的正品率 分别是95%和90%.从库房中任取一个零件,求它是正品的概率. 8 57 概率初步(续) 2.盒子中有大小与质地相同的5个红球和4个白球,从中随机取1个球,观察其颜色 后放回,并同时放入与其相同颜色的球3个,再从盒子中取1个球.求第二次取出的球是 白色的概率. 3.从一个放有大小与质地相同的3个黑球、2个白球的袋子里摸出2个球并放入另外 一个空袋子里,再从后一个袋子里摸出1个球.求该球是黑色的概率. 3 贝叶斯公式  全概率公式是利用条件概率犘(犃|Ω)与权重犘(Ω) 犽 犽 (犽=1,2,…,狀)来计算事件发生的概率犘(犃).在某些场合下, 我们也需要计算在犃发生的条件下Ω 发生的概率犘(Ω|犃) 犽 犽 (犽=1,2,…,狀). 例6 已知人群中有5%的人患有一种严重的疾病,而已 有的检测方法很繁琐,也很昂贵.某公司自称发明了一种方便且 成本低廉的医学检测方法,已知这种方法对患有这种疾病的人检 测时,90%呈阳性反应,而对不患有这种疾病的人检测时,有 5%的人呈阳性反应.从这两个数据看,这种方法似乎是不错的, 管理部门该怎么评价它的准确率? 解 首先要清楚什么是一个检测方法的准确率.检测方法的 准确率是指当一个人被检测呈阳性反应时,他的确患有这种疾病 的概率.用事件犅表示一个人患有此疾病,犘(犅)就是患病率,并 用事件犃来表示其检测呈阳性.我们要计算条件概率犘(犅|犃). 由已知条件,患病率犘(犅)=0.05,患病者检测呈阳性的概率 犘(犃|犅)=0.9,非患病者检测呈阳性的概率犘(犃|犅)=0.05.由 全概率公式,有 犘(犃)=犘(犃|犅)犘(犅)+犘(犃|犅)犘(犅) =0.9×0.05+0.05×0.95=0.0925. 再由条件概率公式及概率的乘法公式,就得到 犘(犃∩犅) 犘(犃|犅)犘(犅) 0.9×0.05 18 犘(犅|犃)= = = = . 犘(犃) 犘(犃) 0.0925 37 1 这说明其准确率不到 ,管理部门可由此断定这不是一个有 2 效的检测方法. 8 67.1 条件概率与相关公式 上面计算概率犘(犅|犃)的公式的一般形式称为贝叶斯公式, 即对犻=1,2,…,狀,成立 犘(犃狘Ω)犘(Ω) 犘(Ω狘犃)= 犻 犻 . 犻 ∑狀 犘(犃狘Ω)犘(Ω) 犽 犽 犽=1 实际上,由乘法公式得 犘(犃|Ω)犘(Ω)=犘(犃∩Ω)=犘(犃)犘(Ω|犃), 犻 犻 犻 犻 因此 犘(犃狘Ω)犘(Ω) 犘(Ω狘犃)= 犻 犻 , 犻 犘(犃) 再对分母应用全概率公式即推出贝叶斯公式. 对于任意给定的犻来说,犘(Ω)称为事件Ω 的先验概率 犻 犻 (priorprobability).一个已经发生了的事件犃可以看作一个新的 贝叶斯公式诱导 出一种统计学观点, 信息.在犃发生的条件下,Ω 的概率犘(Ω|犃)可以看作对原概 也是哲学观点:事件 犻 犻 的概率可以根据出现 率犘(Ω)的一个矫正,称为后验概率(posteriorprobability). 的新信息进行修正. 犻 贝叶斯公式提供了一种通过不断学习经验来认识随机现象的 思想,是机器学习的理论基础之一. 练习7.1(3) 1.设某公路上经过的货车与客车的数量之比为2∶1,货车中途停车修理的概率为 0.02,客车中途停车修理的概率为0.01.今有一辆汽车中途停车修理,求该汽车是货车 的概率. 2.已知在所有男子中有5%患有色盲症,在所有女子中有0.25%患有色盲症.现随机抽 取一人发现患有色盲症,问:其为男子的概率是多少?(设男子和女子的人数相等) 习题7.1 犃组 1.掷一颗骰子所得的样本空间为Ω={1,2,3,4,5,6}.令事件犃={2,3,5},犅={1,2,4, 5,6}.求犘(犅|犃). 8 77 概率初步(续) 2.将一枚质地均匀的硬币抛掷2次,设事件犃为“第一次出现正面”,事件犅为“第二 次出现正面”.求犘(犃|犅)与犘(犅|犃). 3.某工厂有四条流水线生产同一产品,已知这四条流水线的产量分别占总产量的 15%、20%、30%和35%,又知这四条流水线的产品不合格率依次为0.05、0.04、0.03和 0.02.从该厂的这一产品中任取一件,抽到不合格品的概率是多少? 4.假设有两箱同种零件,第一箱内装有50件,其中10件为一等品;第二箱内装有 30件,其中18件为一等品(两箱外观相同).现从两箱中随意挑出一箱,然后从该箱中先 后随机地取出两个零件(取出的零件不放回).求先取出的零件是一等品的概率. 犅组 1.设某种动物活到20岁的概率为0.8,活到25岁的概率为0.4.现有一只20岁的该 种动物,它活到25岁的概率是多少? 2.袋中装有编号为1到犖的犖个球.先从袋中任取一个球,若该球不是1号球,则 放回袋中;若是1号球,则不放回,然后再摸一次.求第二次摸到2号球的概率. 8 87.2 随机变量的分布与特征 随机变量的 7.2 分布与特征 1 随机变量与分布 在许多情况下,我们可以使用数来表示随机现象的结果.生 活中就有很多例子: (1)掷一颗骰子,用犡表示点数,例如,犡=6表示掷出6 点,犡=1表示掷出1点; (2)抛掷一枚硬币10次,用犡表示得到正面的次数,例 如,犡=5表示5次是正面; (3)从一个放有大小与质地相同的10个白球、10个黑球的 罐子中摸出5个球,用犡表示其中白球的个数; (4)用犡表示明天的降雨量(单位:mm); (5)用犡表示保险公司某客户一年中的车辆损失(单位:元). 在这些例子中,我们都是用数来表示随机现象的结果,这引 出随机变量这个重要的概念. 在本章中,除7.3节外,我们总是假设样本空间是有限的. 这时,以样本空间作为定义域的一个函数犡称为一个随机变量 (randomvariable),即对样本空间Ω中任意给定的元素ω,都有 唯一的实数犡(ω)与之对应. 尽管随机变量的名字中用了“变量”这两个字,但实际上它是 一个函数.随机变量的取值在随机现象发生前是随机的,且其取 某一具体值这一事件的概率是该随机变量在该值上的分布.分布 是日常生活中经常使用的一个词,如收入分布、人口分布、年龄 分布、成绩分布等.在数学中,分布的定义如下: 随机变量所有可能的取值以及相应的概率,称为随机变量的 分布. 注意,在上述定义中,随机变量犡的所有可能取值(以犡 作为观察角度的所有结果)的概率的和等于1. 8 97 概率初步(续) 分布的表示方法很多,常用图表来表示,这比较直观易懂. 例如,下面例1中的分布,第一行表示随机变量的取值,第二行 表示相应取值的概率. 例1 分别抛掷1、2、3枚硬币,计算其中正面朝上枚数 犡的分布. 解 (1)先考虑抛掷1枚硬币的情形.此时犡的可能取值是 1 0、1,且犘(犡=0)=犘(犡=(1)= ),所以犡的分布是 2 0 1 1 1 . 2 2 (2)再考虑抛掷2枚硬币的情形.此时犡的可能取值是0、 1、2,分别表示两个反面、一正一反、两个正面这三个事件,因 1 1 为犘(犡=0)=犘(犡=2)=(,犘(犡=1))= ,所以犡的分布是 4 2 0 1 2 1 1 1 . 4 2 4 让我们用这个例子来详细解释一下随机变量.用犎及犜分 别表示正反面,那么样本空间 Ω={犎犎,犎犜,犜犎,犜犜} 是等可能的.随机变量犡是正面朝上的个数,故 犡(犎犎)=2,犡(犎犜)=1,犡(犜犎)=1,犡(犜犜)=0, 且 {犡=0}={犜犜}, {犡=1}={犎犜,犜犎}, {犡=2}={犎犎} 1 2 1 分别包含1、2及1个元素,因此概率分别是 、 、 . 4 4 4 (3)若抛掷3枚硬币,则犡的可能取值是0、1、2、3,分 别表示三个反面、一正两反、两正一反、三个正面这四个事 件,而 1 犘(犡=0)=犘(犡=3)= , 8 3 犘(犡=1)=犘(犡=2)= , 8 9 07.2 随机变量的分布与特征 所以犡的分布是 ( ) 0 1 2 3 1 3 3 1 . 8 8 8 8 例2 掷一颗骰子,观察掷得的点数. (1)求点数犡的分布; (2)只关心点数6是否出现.若出现,则记犢=1,否则记 犢=0.求犢的分布. 解 (1)因为掷得每个点数为等可能事件,所以点数犡的 分布为 ( ) 1 2 3 4 5 6 1 1 1 1 1 1 . 6 6 6 6 6 6 1 5 (2)因为犘(犢=1)= ,而犘(犢=0)= ,所以犢的分 6 6 布为 ( ) 0 1 5 1 . 6 6 当随机变量取所有值的概率均相等时,称它是等可能分布或 均匀分布的,如例1(1)与例2(1).另外,只取两个值的随机变 量称为伯努利型,其分布称为伯努利分布,如例1(1)与例2(2). 一般要求概率值 一个如下形式的图表被称为一个分布: 是正数,因为0概率 值在分布中所处的这 ( ) 狓 狓 … 狓 一列总可以删去. 1 2 狀 , 狆 狆 … 狆 1 2 狀 其中狓,狓,…,狓 是互异的实数,狆,狆,…,狆 是非负 1 2 狀 1 2 狀 分布直观上表示 数,作为概率值,其总和为1,即成立 总值为1的量是怎么 分布在一些数上的. 狆+狆+…+狆=1. 1 2 狀 例3 统计某地历史上近两百年的年降水量,得到以下 数据: 年降水量/mm 0~100 100~200 200~300 300~400 400以上 年数 10 55 85 35 15 9 17 概率初步(续) 请据此构造一个随机变量并求其分布. 解 用犡表示年降水量级别,犡=1、2、3、4、5分别表示 年降水量为0~100、100~200、200~300、300~400和400以 上.犡是一个随机变(量,其分布为 ) 1 2 3 4 5 2 11 17 7 3 . 40 40 40 40 40 分布通常可用更直观的图像来表示,如下面的条形图 (图721)所示. 图721 练习7.2(1) 1.掷两颗骰子,用犡表示两点数差的绝对值.求犡的分布. ( ) 2.以下是分布的为 ( ) ( ) -1 0 1 0 1 A. ; B. 1 1 1 ; 1 1 ( ) 2 3 6 1 2 3 ( ) 1 1.2 2 2.4 C. 1 1 1 ; D. . -0.5 0.5 0.3 0.7 2 4 8 2 期望 期望是概率论中的 一个重要概念,它的全 称是数学期望,简称期 望,也称均值.因为期 随机变量的分布体现的是随机变量取值的概率分布.把概率 望实际上是由某个分布 作为权重,对随机变量的相应取值进行加权平均后所得到的值, 所确定的,所以也称为 该分布的期望. 称为随机变量的期望(expectation): 9 27.2 随机变量的分布与特征 定义 如果随机变量犡的分布是 ( ) 狓 狓 … 狓 1 2 狀 , 狆 狆 … 狆 1 2 狀 那么它的期望定义为如下的加权平均: 数学期望是一个 犈[犡]=狓狆+狓狆+…+狓狆. 1 1 2 2 狀 狀 加权平均,其中的权 是随机变量取值对应 例4 (1)掷一颗骰子,求掷得点数的期望; 的概率. (2)掷两颗骰子,求掷得点数和的期望. 解 (1)掷一颗骰子,掷得点数犡的期望是 1 1 1 1 1 1 犈[犡]=1× +2× +3× +4× +5× +6× 6 6 6 6 6 6 1+2+3+4+5+6 = =3.5. 6 (2 ()掷两颗骰子,掷得点数和犡的分布为 ) 2 3 4 5 6 7 8 9 10 11 12 , 1 2 3 4 5 6 5 4 3 2 1 36 36 36 36 36 36 36 36 36 36 36 其期望为 1 2 3 4 5 6 犈[犡]=2× +3× +4× +5× +6× +7× + 36 36 36 36 36 36 5 4 3 2 1 8× +9× +10× +11× +12× 36 36 36 36 36 =7. 例5 抛掷狀枚硬币,用犡表示正面朝上的硬币数.求 它的分布及期望. 解 抛掷狀枚硬币是一个古典概率模型,其基本事件是 ( ) 狀枚 烇 烉 烋 ,,…, , 其中,括号里的每一个表示每一枚硬币抛掷的结果:正面朝上 (犎)或者反面朝上(犜).所以,抛掷狀枚硬币的随机试验的样本 空间中有2狀 个元素.事件犡=犽表示“出现犽个正面朝上”,即 其中有犽个犎、(狀-犽)个犜的基本事件全体.用选择性必修课 程第6章介绍的排列组合方法,犡=犽这个事件含有的基本事件 数为在狀个位置上取犽个位置放置犎的组合数C犽. 狀 犡的取值范围是犽=0,1,2,…,狀,有 9 37 概率初步(续) C犽 犘(犡=犽)= 狀. 2狀 有了犡的分布,就可以得到犡的期望,为 ∑狀 犽C犽 犈[犡]= 狀. 2狀 犽=0 当犽≥1时,有 犽狀! 狀! 犽C犽 狀 = 犽!(狀-犽)! = (犽-1)!(狀-犽)! (狀-1)! =狀 (犽-1)!(狀-犽)! =狀C犽 狀 - - 1 1 , 由选择性必修课程6.5节中所介绍的二项式定理,得所求的期 望为 ∑狀 犽C犽 ∑狀 狀C犽-1 犈[犡]= 狀= 狀-1 2狀 2狀 犽=0 犽=1 狀 ∑狀 狀狀∑-1 = C犽-1= C犽 2狀 狀-1 2狀 狀-1 犽=1 犽=0 狀 狀 = ×2狀-1= . 2狀 2 掷一颗骰子,掷得点数的期望是3.5,甚至不是一个整数, 那么,期望到底有什么意义呢?实际上,期望的意义在多次重复 试验中可以明显地体现出来.例如,重复掷一颗骰子狀次,所得 到的点数分别记为犡,犡,…,犡,那么,当狀很大时,平 1 2 狀 均点数必定逼近于期望,即成立 犡+犡+…+犡 1 2 狀≈3.5. 狀 这个结果类似于在必修课程12.3节中所述的伯努利大数 定律. 随机变量的期望是一个确定的数,它满足下面两个性质. 请同学们尝试完 期望的线性性质 成性质1的证明. 1.如果犡是一个随机变量,犪是一个实数,那么 犈[犪犡]=犪犈[犡]. 2.如果犡、犢是两个随机变量,那么 犈[犡+犢]=犈[犡]+犈[犢]. 性质1的证明是容易的,性质2的证明超出所学的知识范围. 9 47.2 随机变量的分布与特征 这两个性质的证明这里均略去,只列出它们的结论.为了方便,我 们把一个确定的常数也看作一个随机变量,称为常数随机变量.常 数随机变量是确定的,没有随机性,它的期望等于它本身. 例4(2)中求得点数之和的期望是7,这是通过分布来计算 的.更方便的方法是利用期望的性质来计算.用犡、犡 分别表 1 2 示掷第一颗及第二颗骰子得到的点数,那么犡+犡 就是两颗骰 1 2 子的点数之和.这样,根据期望的线性性质,并利用例4(1)的结 果,就得到 犈[犡+犡]=犈[犡]+犈[犡]=3.5+3.5=7. 1 2 1 2 练习7.2(2) 1.抛掷4枚硬币,用犡表示正面朝上的枚数.求犡的期望. 2.从一个放有大小与质地相同的5个白球、4个黑球的罐子中不放回地摸3个球,用 犡表示摸到的白球数.求犡的期望. 3 方差 通过前面的学习,我们不仅能够时刻感知无处不在的随机性, 还能够感知随机性的大小.一般来说,如果某件事发生的可能性很 大或者很小,它的随机性就相对较小.例如,抛掷一枚硬币,正面 1 和反面朝上的概率都是 ,而掷一颗骰子得到“6”与“非6”两个结 2 1 5 果的概率则是 与 .相比之下,抛掷硬币的结果更不确定,所以 6 6 随机性更大.与之比较,买彩票中奖的概率要小很多,因此随机性 更小.人们经常把随机性很小(概率接近0或1)的事件近似为确定 的事件,即近似确定不发生或近似确定发生,此时,就模糊了确 定性和随机性的界限,把“确定”当作是随机性非常小的代名词. 期望大体上表示一个随机变量的“中间”态.随机变量的取值 虽不确定,但总是分布在期望的两侧,可能远也可能近.通俗地 事件可以看成是 说,如果一个随机变量分布在期望两侧比较远的地方,就说这个 一个随机变量:发生 随机变量比较分散.反过来,如果一个随机变量分布在期望两侧 定义为1,不发生定 义为0.这样,随机性 比较近的地方,就说这个随机变量比较集中. 大小与分散度大小实 际上是统一的. 数学上用什么指标来衡量随机变量的分散度呢?按照上面的 9 57 概率初步(续) 分析,对随机变量犡而言,我们用犡与其期望的偏差的平方的 期望,即 犈[(犡-犈[犡]) 2 ] 来衡量随机变量犡的分散度,称为犡的方差(variance),记为 犇[犡]. 定义 随机变量犡的方差犇[犡]定义为 方差是犡-犈[犡] 犇[犡]=犈[(犡-犈[犡]) 2 ]. 平方之后的期望,它 与期望犈[犡]的尺度 考虑一个极端的情况.如果犡是一个常数随机变量,那么 不同.统计中经常使 用标准差槡犇[犡]来 就有犇[犡]=0.这说明一个确定的量的分散度为零.反之,如果 代替方差. 犇[犡]=0,那么犡就是一个常数随机变量.这说明分散度为零 的量必是一个确定的量. 下面推导一个更方便使用的方差公式.事实上,根据期望的 线性性质,并注意到犈[犡]是一个常数,就有 犇[犡]=犈[犡2-2犡犈[犡]+(犈[犡]) 2 ] =犈[犡2 ]-2犈[犡犈[犡]]+犈[(犈[犡]) 2 ] =犈[犡2 ]-2(犈[犡]) 2+(犈[犡]) 2 =犈[犡2 ]-(犈[犡]) 2. 这样,就得到方差的如下计算公式: 犇[犡]=犈[犡2 ]-(犈[犡]) 2. 例6 掷一颗骰子,用犡表示掷得的点数.求犡的方差. 解 由本节例4可知犡的期望犈[犡]=3.5,现在需要计算 犈[犡2 ],为此先计算犡2 的分布.显然,犡2 的取值是12 、22 、 32 、42 、52 、62 ,且 1 犘(犡2=犽2 )=犘(犡=犽)= ,犽=1,2,…,6. 6 于是 1 1 1 1 1 1 犈[犡2 ]=12× +22× +32× +42× +52× +62× 6 6 6 6 6 6 12+22+32+42+52+62 = 6 91 = . 6 因此 9 67.2 随机变量的分布与特征 91 35 犇[犡]=犈[犡2 ]-(犈[犡]) 2= -3.52= . 6 12 例6中犈[犡2 ]的计算实际上无需求助于犡2 的分布,只要知 道犡自身的分布就够了.事实上,若犡的取值为狓,狓,…, 1 2 狓,而相应的概率为狆,狆,…,狆,就有 狀 1 2 狀 犈[犡2 ]=狓2狆+狓2狆+…+狓2狆. 1 1 2 2 狀 狀 方差有以下两个性质: 性质 请同学们尝试完 成性质1的证明. 1.如果犡是一个随机变量,犪是一个实数,那么 犇[犪犡]=犪2犇[犡]. 2.如果犡、犢分别是两个独立的随机变量,那么 犇[犡+犢]=犇[犡]+犇[犢]. 性质1的证明是容易的,但性质2的证明超出所学的知识范 围.这两个性质的证明这里均略去,只列出它们的结论. 例7 掷两颗骰子,掷得的点数分别为犡、犢.求点数和 犡+犢与点数差犡-犢的期望与方差. 解 本节例4说明犈[犡]=犈[犢]=3.5,本节例6说明犇[犡] 35 =犇[犢]= . 12 由期望的线性性质,可得 犈[犡+犢]=犈[犡]+犈[犢]=7, 犈[犡-犢]=犈[犡]+犈[-犢]=犈[犡]-犈[犢]=0. 因为掷两颗骰子是两个独立的随机试验,而犡、犢分别是这 两个独立的随机试验所对应的随机变量,所以由方差的性质可得 35 35 35 犇[犡+犢]=犇[犡]+犇[犢]= + = , 12 12 6 犇[犡-犢]=犇[犡+(-犢)]=犇[犡]+犇[-犢] =犇[犡]+(-1) 2犇[犢]=犇[犡]+犇[犢] 35 = . 6 综上所述,一个随机变量是以其样本空间为定义域的函数, 期望描述它的中心位置,而方差描述此随机变量对其期望的偏离 9 77 概率初步(续) 度,即其随机程度.期望与方差是随机变量最重要的两个特征. 它们是通过数字来描述的,也称为数字特征. 练习7.2(3) 1.设犡是一个随机变量,犮是常数.求证:犡+犮的方差与犡的方差相等. 2.已知随机变量犡的分布为 ( ) 1 2 3 , 0.4 0.2 0.4 求犡的方差. 习题7.2 犃组 1.一袋中装有6个大小与质地相同的白球,编号为1、2、3、4、5、6.从该袋内随机 取出3个球,记被取出球的最大号码数为犡.写出随机变量犡的分布. 2.掷两颗骰子,用犡表示较大的点数(在点数相同时,犡表示共同的点数).求犡的 分布与期望. 3.设某射手打靶环数犡的分布为 ( ) 7 8 9 10 , 犪 0.1 0.3 犫 已知期望犈[犡]=8.9.求犪、犫的值. 4.一袋中装有大小与质地相同的2个白球和3个黑球. (1)从中有放回地依次摸出2个球,求2球颜色不同的概率; (2)从中不放回地依次摸出2个球,记2球中白球的个数为犡.求犡的期望和方差. 犅组 1.编号为1、2、3、4的四名学生随机入座编号为1、2、3、4的座位,每个座位坐一 人.座位编号和学生编号一样时称为一个配对.用犡表示配对数,求犈[犡]. 2.已知一个随机变量犡的分布为 ( ) -1 0 1 . 犪 犫犮 1 若犪+犮=2犫,且犈[犡]= ,求犇[犡]的值. 3 9 87.2 随机变量的分布与特征 3.一袋中装有编号为1、2、3、4、5的五个大小与质地相同的球.依次摸两个球,用 犡、犡 分别表示第一个及第二个球的编号.在以下两种情况下分别求犡、犡 以及两编 1 2 1 2 号之和犡+犡 的分布,再分别验证等式犈[犡+犡]=犈[犡]+犈[犡]与犇[犡+犡] 1 2 1 2 1 2 1 2 =犇[犡]+犇[犡]是否成立. 1 2 (1)放回; (2)不放回. 4.先掷一颗骰子,记朝上的点数为犡.再抛掷犡枚硬币,记犢为正面朝上的硬币数. 求犢的分布、期望与方差. 课后阅读 随机商品的定价与风险 商品是大家熟悉的东西,生活离不开商品.除了通常的商品外,还有随机商品.所谓 随机商品,就是其价值在购买的时候不确定,在未来的某个时刻才会确定的商品,如彩 票、股票、保险等.不确定性意味着风险(risk).因为人们对于风险的需求或者偏好不同, 所以随机商品可以用来实现风险的转移.有的人喜欢风险,喜欢碰运气,他就会买彩票, 也就是用不多的钱购买一个中大奖的微小机会;相反,有的人不喜欢风险,他就会买保 险,保险源于人们对于未知风险的恐惧,把自己未来不确定的损失换成确定的付出,或者 说付费让保险公司来分担风险.一个基本的常识是,潜在收益越大,风险就越大,风险和 收益是成正比的. 简单地说,随机商品的未来价值是一个随机变量犡,它在购买时的价格(不计其他成 本)应该就是它的期望.为什么?因为由大数定律,在有很多人购买时,它的平均价值趋 向于期望.这就是说,随机商品的定价通常是它的期望值.但是随机商品的另外一个特征 1 是风险,这通常由方差来衡量.例如,比较一个中奖率为 ,奖金100元的彩票犡,与 100 1 一个中奖率为 ,奖金10000元的彩票犢,两个彩票的期望是一样的,但是风险收益 10000 有很大的差别,比起彩票犡,彩票犢中奖的可能性小,但是奖金却高得多,其实就是风 险大,但潜在的收益高.风险是不确定性,而方差是不确定性的一个度量指标,因此方差 可以看成是风险的一个指标.例如,通过简单的计算可以知道,彩票犢的方差大约百倍于 彩票犡的方差.要注意,风险是个内涵丰富的词,没有公认的数学定义,方差只是风险的 一个指标,体现风险的某种特征,银行与企业经常使用另外一个指标:在某个警戒概率下 可能造成的最大损失,称为在险价值. 9 97 概率初步(续) 心理期望与数学期望 从中文字义看,期望是内心的期待,是涉及人的心理的,可以说是心理期望,概率中 所说的期望是数学期望,这个概念在费马和帕斯卡讨论分奖金问题时就产生了.心理期望 和数学期望两者有什么关系呢?拿一个随机商品来说,它的期望值是不是与人们的心理期 望重合呢?在多数情况下的确如此,因为期望是随机商品在大样本条件下的平均价值.但 是在一些极端情况下,两者明显是背离的. 考虑如下的游戏:请你抛掷20枚硬币,如果20枚都是正面朝上,那么你将得到10 亿元,否则得0元.这是一个随机产品,它的价值记为犡,犡以大约一百万分之一的概率 取值为10亿,剩余的概率取值为0,因此数学期望犈[犡]约等于1000.问题是你愿意花 多少钱玩这个游戏,也就是问它的心理期望是多少.在大多数人的 圣彼得堡悖论是 心目中,它的价值是远远小于1000元的.如果这还不能说服你, 尼古拉·伯努利 (N. Bernoulli,他是证明 那我们来看经典的圣彼得堡悖论.考虑这样一个游戏:不断地抛掷 大数定律的雅各布· 一枚硬币直到出现正面朝上为止,如果正面朝上出现在第狀次,那 伯努 利 的 侄 子)于 1738年提出的. 么你将得到2狀 元.记这个游戏的价值是犡.因为第狀次首次出现正 1 面朝上这个事件发生的概率是 ,得到的钱数是2狀 ,所以由期望公式可以看出犡的数学 2狀 期望是无穷大.按照数学期望来看,无论你花多少钱玩这个游戏都是值得的.但根据调 查,很少有人愿意花25元去参加一次这样的游戏.现在你可以抛掷一枚硬币试一下,然 后考虑一下,你愿意花多少钱玩这个游戏呢?或者说它在你的心里价值几何? 10 07.3 常用分布 7.3 常用分布 1 二项分布 考虑如下问题:一次测验共有10道选择题,每题备有4个 选项,其中只有1个正确.如果某学生随意猜测答题,问其答对 一半以上的概率有多大.这样的概率计算具有普遍性,现在就来 讨论这种题型的概率计算. 设有一个伯努利试验,其成功概率为狆(0<狆<1),失败概 率为狇,且狆+狇=1.独立地重复该伯努利试验狀次,用犡表示 成功的次数.把狀次试验看作具有狀个标号的位置,其中每个位 置都有两种可能:成功或者失败,分别标记为1和0.“成功次数 为犽”的事件犡=犽可以看作从狀个位置里选择犽个位置标记为 1,而其他标记为0,这样的选择共有C犽 种.因为每次试验都是 狀 独立地进行,所以由独立性,每种标记发生的概率是狆犽狇狀-犽.再 由概率的可加性,可得成功次数为犽的概率为 犘(犡=犽)=C犽狆犽狇狀-犽 , 狀 其中犽=0,1,2,…,狀.因为C0=C狀=1,所以犡的分布可表示为 狀 狀 ( ) 0 1 2 … 犽 … 狀 . 狇狀 C1狆狇狀-1 C2狆2狇狀-2 … C犽狆犽狇狀-犽 … 狆狀 狀 狀 狀 从这个角度可以证明二项式定理 ∑狀 ∑狀 C犽狆犽狇狀-犽= 犘(犡=犽)=1. 狀 犽=0 犽=0 这是这个分布被称为二项分布的理由. 定义 独立地重复一个成功概率为狆的伯努利试验狀次,其 成功次数的分布称为二项分布(binomialdistribution),亦称成功 1 017 概率初步(续) 次数犡服从二项分布犅(狀,狆). 独立重复伯努利试验是一个非常重要的概率模型,在实际中 经常出现. 例1 独立地重复狀次成功概率为狆的伯努利试验,求 至少有一次成功的概率. 解 用犡表示成功次数.至少有一次成功相当于犡>0,它 的对立事件是犡=0.由概率的性质,至少有一次成功的概率为 犘(犡>0)=1-犘(犡=0)=1-(1-狆) 狀. 当成功概率狆很小时,通常说成功是小概率事件.虽然在一 次试验中,小概率事件几乎不可能发生,但因为0<狆<1,有 0<1-狆<1,当试验次数狀充分大时,(1-狆) 狀 接近于零,即 1-(1-狆) 狀 接近于1,所以至少有一次成功的概率就会很大. 直观地说,做一件事情,不管成功概率多小,只要执着 如果不断地重复, 地努力,重复的次数足够多,就有很大可能会成功.如同俗 那么一个小概率事件 终究会发生. 语所说:失败是成功之母.反过来说,如果不断地重复,小 概率的坏事也终有可能发生.例如,开车一次发生事故的概 率狆很小,但是如果每天开车,长期下去还是很有可能发生 事故的.所以,不仅每次开车都要格外小心,减小事故发生 的概率狆,而且要尽可能地减少开车次数狀,这样就能使发生 事故的概率尽量减小. 例2 设犡服从二项分布犅(狀,狆),求犡的期望与方差. 解 用犡 表示第犽次随机试验的结果:若成功,则犡=1; 犽 犽 若失败,则犡=0.总的成功次数犡可以表示为 犽 犡=犡+犡+…+犡. 1 2 狀 按照定义,犡 的期望是 犽 犈[犡]=1×狆+0×(1-狆)=狆. 犽 所以,由期望的线性性质,得 犈[犡]=犈[犡]+犈[犡]+…+犈[犡]=狀狆. 1 2 狀 用同样的方法可以计算犡的方差.先计算犇[犡].因为 1 犈[犡2 ]=狆,所以 1 犇[犡]=犈[犡2 ]-(犈[犡]) 2=狆-狆2=狆(1-狆). 1 1 1 因为每次试验是独立地重复,所以犡,犡,…,犡 是相 1 2 狀 互独立的,且犇[犡]=狆(1-狆),犽=1,2,…,狀.由方差的 犽 10 27.3 常用分布 性质,有 犇[犡]=犇[犡]+犇[犡]+…+犇[犡]=狀狆(1-狆). 1 2 狀 由上式可见,方差关于概率狆是一个其图像开口向下的二 1 1 次函数,且它在狆= 时达到最大值.这说明,在成功概率是 2 2 1 时,犡的分散度最大;而当狆与 相差较大时,犡的分散度较 2 小.这就从数学上诠释了前面所说的随机性大小与概率大小的 直观关系. 练习7.3(1) 1.已知随机变量犡服从二项分布犅(狀,狆),若犈[犡]=30,犇[犡]=20,求狆的值. 2.一批产品的二等品率为0.3.从这批产品中每次随机抽取一件,并有放回地抽取20 次.用犡表示抽到二等品的件数,求犇[犡]. 2 超几何分布 再看另外一个常见的概率模型. 例3 设袋中装有大小与质地相同的6个白球、4个黑球. 现在依次不放回地摸5个球,用犡表示摸出的白球个数.求犡 的分布. 解 首先,因为所考虑的是白球的个数,与摸球的顺序无 关,而且是不放回地摸球,所以从随机性的角度讲,依次摸出5 个球和一次摸出5个球是一样的.其次,由于是不放回地摸球, 前面摸球的结果会影响后面摸球的结果,因此考虑问题的方法应 该不同于放回摸球的情况. 因为黑球只有4个,所以变量犡的取值范围是1、2、3、4、 5.从10个球中取5个球的所有可能的取法,不计顺序,共有 C5 种.举例来说,事件犡=3可以分为从6个白球中取3个,并 10 从4个黑球中取2个这样两个步骤,即 C3C2 犘(犡=3)= 6 4. C5 10 所以,一般地说, 1 037 概率初步(续) C犽C5-犽 犘(犡=犽)= 6 4 ,犽=1,2,3,4,5. C5 10 因此,如果一袋中装有大小与质地相同的犪个白球、犫个黑 球,依次随机且不放回地取狀个球,用犡表示其中的白球数, 那么犡的分布可由下式给出: C犽C狀-犽 犘(犡=犽)= 犪 犫 . C狀 犪+犫 其中,犽的取值范围由以下几个条件决定:取得的白球个数不能 超过狀,也不能超过犪;同时,取得的黑球个数不能超过犫,即 成立 犽≤狀,犽≤犪,狀-犽≤犫. 如果简单地约定:当犽<0或者犽>狀时,组合符号C犽=0, 狀 这样,犘(犡=犽)式中的犽原则上就可以取任意的整数值. 定义 从一个装有大小与质地相同的犪个白球、犫个黑球的 袋中随机且不放回地取狀个球,其中的白球数的分布称为超几何 分布(hypergeometricdistribution). 例4 计算例3中犡的期望. 解 我们将利用期望的性质来进行计算. 根据定义,犡的 从装有大小与质地相同的犪个白球、犫个黑球的袋子中不放 期望为 ∑ C犽C狀-犽 回地随机取狀个球,狀不能超过总个数犪+犫.用犡表示其中的 犈[犡]= 犽· 犪犫 , C狀 犽取遍它的 犽 取值范 犪+ 围 犫 . 白球个数.这可以想象成依次取球,用犡 表示第犽次取球的结 犽 此式的直接计算比较 困难. 果:如果是白球,犡=1;如果是黑球,犡=0.那么 犽 犽 犡=犡+犡+…+犡. 1 2 狀 本章7.1节中例4已经证明,抽签概率与顺序无关,所以 犪 犫 犘(犡=1)= ,犘(犡=0)= . 犽 犪+犫 犽 犪+犫 因此 犪 犈[犡]= , 犽 犪+犫 从而 狀犪 犈[犡]=犈[犡]+…+犈[犡]= , 1 狀 犪+犫 即犡的期望为取球的个数乘白球的比例.这与放回摸球情况下 10 47.3 常用分布 取得白球个数的期望是一样的. 从二项分布的期望计算到超几何分布的期望计算,可以看 出,虽然期望和方差是用分布来定义的,但是其计算过程实际上 注意,虽然期望 是一样的,但它们的 不一定要用到分布,而只要使用期望和方差的性质即可. 分布是不同的,一个 是二项分布,另一个 二项分布和超几何分布的区别,实质上就是摸球模型中放回 是超几何分布. 摸球和不放回摸球的区别.当犪+犫远大于狀时,放回与不放回 两种情况下的分布之间差别不大,即二项分布与超几何分布之间 差别不大. 练习7.3(2) 1.盒子中有大小与质地相同的3个白球、1个黑球,若从中随机地摸出2个球,求它 们颜色不同的概率. 2.从放有6黑2白共8颗珠子的袋子中抓3颗珠子,分别求黑珠颗数犡与白珠颗数犢 的分布、期望与方差. 3.从一副去掉大小王牌的52张扑克牌中任取5张牌,求: (1)至少有一张黑桃的概率; (2)至少有一个对子(两张牌的数字一样)的概率. 3 正态分布 现今的信息时代,各媒体都充斥着数据,因此正确地理解数 据成为非常重要的事.正态分布已经是生活中一个常用的词了. 例如,我们常提起学生的考试成绩是不是正态分布,某个城市的 家庭收入是不是正态分布,等等.那么,究竟什么是正态分布 呢?平日所说的正态分布,大体上是指数据对称地分布在某个中 心值两边,且离中心值越远,分布得越少. 一包米的外包装上标示的质量是5000g,但实际上是有误差 的.假设包装米的公司没有偷工减料,计量员精确地检测所有在 售的该种米,把米包质量的频率分布直方图画出来,会是一个什 么形状呢?图731中是一条峰值在5000g左右的曲线,它具 有一个单峰,粗略展示了一个正态分布的形状.实际上,很多测 量数据的分布都呈现出这样的形状. 1 057 概率初步(续) 图731 数学中的正态分布是指由下面的函数所表达的分布: 1 (狓-μ)2 φ (狓)= e- μ,σ2 槡2πσ2 2σ2 , 其中有两个参数: (1) μ 是该分布的期望或均值; (2)σ2 是该分布的方差,且总是假设σ>0. 这个函数的图像如同钟形,如图732所示.该函数在数学 上称为正态密度函数,也称为钟形曲线. 图732 为了理解“一个函数所表达的分布”,要说明两点:第一,分 布是指总数为1的量以某种方式分布在直线上;第二,该函数图 像与狓轴所夹部分的面积等于1,但这个事实需要用到高等数学 的知识才能证明. 定义 设犡是一个取实数值的随机变量.如果对任何给定 的实数犪与犫(犪<犫),犡落在区间(犪,犫)上的概率犘(犪<犡<犫)等 10 67.3 常用分布 于三条直线:狔=0、狓=犪、狓=犫与正态密度函数狔=φ (狓)的 μ,σ2 图像所围的区域面积(或者简称作此函数在该区间上的面积,如 图733所示),那么犡服从正态分布(normaldistribution),或 更准确地说,犡服从参数为 μ 、σ2 的正态分布,记为 犡~犖( μ ,σ2 ). 图733 当 μ=0、σ2=1时,相应的正态分布称为标准正态分布,记 作犡~犖(0,1),其密度函数 1 狓2 狔= e- 2 槡2π 称为标准正态分布的密度函数,简记作狔=φ (狓).实际上,一般 的正态分布的密度函数总是标准正态分布的密度函数的某种平移 和伸缩变换,其形状保持钟形不变. 用Φ(狓)表示标准正态分布的密度函数狔=φ (狓)从-∞到狓 的累计面积,如图734所示,称为标准正态分布函数. 图734 这个函数没有简单的表达式,其函数值可通过近似计算得 到.我们也可以通过某些型号的计算器来查它或者它的反函数的 值,如 Φ(1)≈0.8413,Φ(2)≈0.9772,Φ(3)≈0.9987,… . 1 077 概率初步(续) 容易验证狔=φ (狓)是一个偶函数,所以该函数在区间 (-∞,-狓)上的面积等于其在区间(狓,+∞)上的面积,如 图735所示.此外,由于狔=φ (狓)与狓轴所围面积为1,因此 狔=Φ(狓)满足 Φ(-狓)=1-Φ(狓). 图735 如果犡~犖( μ ,σ2 ),那么将犡平移再伸缩后将服从标准正 态分布,即成立 犡-μ ~犖(0,1). σ 这样,正态分布犡~犖( μ ,σ2 )的密度函数的图像是一条钟形 曲线,它关于直线狓=μ 对称,其最大值在狓=μ 处达到.在 狓=μ 的左侧,函数严格增,而在狓=μ 的右侧,函数严格减,从 而它是一条单峰曲线.当区间(犪,犫)在狓轴上平移时,显然当 μ 处于该区间的中心时,概率犘(犪<犡<犫)即函数在区间(犪,犫)上 的面积达到最大.因此,我们通常说正态分布集中在其期望 μ 的 附近,即参数 μ 表示分布集中的位置. 另外一个参数σ描述的是分布的集中程度.从图732中可 以看出,密度函数的最大值在狓=μ 处达到,其最大值为 1 φ ( μ )= , μ,σ2 槡2πσ 它与σ成反比.由于图像与狓轴之间的区域的总面积是一个固定 值1,因此当σ变小时,最大值变大,钟形变“高瘦”,分布向中 心狓=μ 处集中;反之,当σ变大时,最大值变小,钟形变“矮 胖”,分布向狓=μ 的两侧分散. 10 87.3 常用分布 出于种种原因,在测量的过程中总有误差存在.通常我们总 假设误差是一个服从正态分布的随机变量. 例5 某公司生产的糖果每包标识质量是500g,但公司 承认实际质量存在误差.已知每包糖果的实际质量服从 μ=500、 σ2=2.52 的正态分布.问:随意买一包该公司生产的糖果,其质 量误差超过5g(即1%)的可能性有多大?(结果精确到0.1%) 解 用犡表示糖果质量,由题意,可知犡~犖(500,2.52 ). 要求|犡-500|>5的概率,即求犘(|犡-500|>5)的值.令 犡-500 犢= ,则犢~犖(0,1).因此,有 2.5 犘(|犡-500|>5)=犘(|犢|>2)=犘(犢>2)+犘(犢<-2) =2Φ(-2)=2(1-Φ(2)) ≈2×(1-0.9772)=2×0.0228 =0.0456≈4.6%, 即误差超过5g的可能性约是4.6%. 例6 设犡为任取的某袋有包装误差的产品的质量, 犡~犖( μ ,σ2 ).分别求|犡-μ|<σ,|犡-μ|<2σ及|犡-μ|<3σ 的概率.(结果精确到0.1%) 解 令 犡-μ 犢= . σ 那么犘(|犡-μ|<σ)=犘(|犢|<1).而犘(|犢|<1)是标准正态分 布的密度函数在区间(-1,1)上的面积,它等于函数在区间 (-∞,1)上的面积减去在区间(-∞,-1)上的面积.这样,就有 犘(|犢|<1)=Φ(1)-Φ(-1)=Φ(1)-(1-Φ(1)) =2Φ(1)-1≈2×0.8413-1 =0.6826≈68.3%. 同样, 犘(|犢|<2)=2Φ(2)-1≈2×0.9772-1=0.9544≈95.4%; 犘(|犢|<3)=2Φ(3)-1≈2×0.9987-1=0.9974≈99.7%. 因此,随意购买一袋该产品,约有68.3%的可能性其质量在 μ 左右σ的范围内;约有95.4%的可能性其质量在 μ 左右2σ的 范围内;约有99.7%的可能性其质量在 μ 左右3σ的范围内,如 1 097 概率初步(续) 图736所示.这称为正态分布的3σ(sigma)原则. 图736 练习7.3(3) 1.已知随机变量犡服从正态分布犖(-2,σ2 ),且犘(犡≤-1)=犽.求犘(犡≤-3) 的值. 2.某校高中三年级1600名学生参加了区第一次高考模拟统一考试,已知数学考试成绩犡 服从正态分布犖(100,σ2 )(试卷满分为150分).统计结果显示,数学考试成绩在80分到120分 3 之间的人数约为总人数的 ,则此次统考中成绩不低于120分的学生人数约为 ( ) 4 A.80; B.100; C.120; D.200. 习题7.3 犃组 1.一名学生每天骑车上学,从家到学校的途中经过6个路口.假设他在各个路口遇到 1 红灯的事件是相互独立的,并且概率都是 . 3 (1)用犡表示这名学生在途中遇到红灯的次数,求犡的分布; (2)求这名学生在途中至少遇到一次红灯的概率. 2.从有7名男生的15名学生中任意选择10名,用犡表示其中的男生人数. 求犘(犡=4)的值. 3.某学生参加一次考试,已知在备选的10道试题中,能答对其中的6道题.规定每 次考试都从备选题中随机抽出3道题进行测试,求该生答对试题数犡的分布. 11 07.3 常用分布 犅组 1.从一副去掉大小王牌的52张扑克牌中任取5张牌,用犡表示其中黑桃的张数.求 犡的分布、期望与方差. 2.对于本节例4中所定义的犡(犽=1,2,…,狀),设狀=2.求: 犽 (1)犈[犡犡]; 1 2 (2)犈[犡2 ]与犇[犡]. 3.已知随机变量犡服从正态分布犖(3,σ2 ),且犘(1≤犡≤5)=0.6.求犘(犡>5)的值. 1 117 概率初步(续) 内容提要 1.条件概率公式 犘(犅∩犃) 犘(犅|犃)= . 犘(犃) 2.全概率公式 ∑狀 犘(犃)= 犘(犃狘Ω)犘(Ω). 犽 犽 犽=1  3.贝叶斯公式 犘(犃狘Ω)犘(Ω) 犘(Ω狘犃)= 犻 犻 . 犻 ∑狀 犘(犃狘Ω)犘(Ω) 犽 犽 犽=1 4.设随机变量犡的分布如上,那么其期望定义为 犈[犡]=狓狆+狓狆+…+狓狆; 1 1 2 2 狀 狀 其方差定义为 犇[犡]=犈[(犡-犈[犡]) 2 ]=犈[犡2 ]-(犈[犡]) 2. 5.期望的线性性质 (1)如果犡是一个随机变量,犪是一个实数,那么 犈[犪犡]=犪犈[犡]. (2)如果犡、犢是两个随机变量,那么 犈[犡+犢]=犈[犡]+犈[犢]. 6.方差的性质 (1)如果犡是一个随机变量,犪是一个实数,那么 犇[犪犡]=犪2犇[犡]. (2)如果犡、犢分别是两个独立的随机变量,那么 犇[犡+犢]=犇[犡]+犇[犢]. 7.二项分布:独立地重复—个成功概率为狆的伯努利试验狀次,其成功次数的分布 称为二项分布(binomialdistribution),亦称成功次数犡服从二项分布犅(狀,狆). 8.超几何分布:从—个装有大小与质地相同的犪个白球、犫个黑球的袋子中随机且不 放回地取狀个球,其中的白球的分布称为超几何分布(hypergeometricdistribution). 9.正态分布:由钟形曲线 1 (狓-μ)2 狔= e- 2σ2 槡2πσ2 所刻画的分布称为正态分布. 11 2复习题 复习题 犃组 1.掷黄、白两颗骰子,当黄色骰子的点数为4或6时,求两颗骰子的点数之积大于 20的概率. 2.连续掷一颗骰子两次,已知第一次掷出的是偶数点.求第二次也掷出偶数点的 概率. 3.在5道题中有3道数学题和2道语文题.如果不放回地依次抽取2道题,求: (1)第1次抽到数学题的概率; (2)第1次和第2次都抽到数学题的概率; (3)在第1次抽到数学题的条件下,第2次也抽到数学题的概率. 4.已知随机变量犡的分布为 ( ) -1 0 1 . 犪 犫犮 1 5 若犈[犡]= ,犇[犡]= ,求犪、犫、犮的值. 3 9 5.同时抛掷两枚相同的均匀硬币,设随机变量犡=1表示结果中有正面朝上,犡=0 表示结果中没有正面朝上.求犈[犡]及犇[犡]. 6.从4名男生和2名女生中任选3人参加演讲比赛,设随机变量犡表示所选3人中 女生的人数.求: (1)犡的分布; (2)犡的期望与方差; (3)“所选3人中女生人数犡≤1”的概率. 7.一批产品的二等品率为0.02.从这批产品中每次随机取一件,有放回地抽取100 次.用犡表示抽到的二等品件数,求犇[犡]. 8.袋中有10个大小与质地相同的球,其中7个是红球.从中任取5个球,求取出的 球中红球个数犡的分布. 犅组 1.某人提出一个问题,甲先答,答对的概率为0.4.若甲答错,则由乙答,乙答对的 概率为0.5.求该问题由乙答对的概率. 1 137 概率初步(续) 2.100件产品中有5件次品,不放回地抽取两次,每次抽1件.已知第一次抽出的是 次品,求第二次抽出正品的概率. 3.盒中有大小与质地相同的25个球,其中10个白球、5个黄球、10个黑球.从盒中 任意取出1个球,已知它不是黑球,求它是黄球的概率. 4.在1、2、3、…、9这9个自然数中,任取3个数. (1)求这3个数中恰有1个是偶数的概率; (2)设犡为这3个数中两数相邻的组数(例如,若取出的数为1、2、3,则有两组相 邻的数1、2和2、3,此时犡的值为2),求随机变量犡的分布及期望. 5.口袋里装有大小与质地相同的4个红球和8个白球,甲、乙两人依下面的规则从袋 中有放回地摸球,每次摸1个球.规则如下:若一方摸出1个红球,则此人继续下一次摸 球;若一方摸出1个白球,则由对方接替下一次摸球.假设每次摸球相互独立,且由甲进 行第一次摸球.求在前三次摸球中,甲摸得红球的次数犡的分布及期望. 拓展与思考 1 1.在一个游戏中,每次输赢的概率都是 .甲的策略是:第一次押1元,如果赢,就 2 结束;如果输,押2元再来一次,无论输赢都结束.乙的策略是:押1元,无论输赢都 结束. (1)求甲赢的概率与乙赢的概率; (2)用犡、犢分别表示甲、乙最终赢得的金额(即所押金额),求它们的分布与期望; (3)比较甲与乙的策略. 2.设有两个罐子,犃罐中放有2个白球、1个黑球,犅罐中放有3个白球,这些球的 大小与质地相同.现在从两个罐子中各摸1个球进行交换,求这样交换3次后,黑球还在 犃罐中的概率.交换狀次后呢? 3.有一种骰子游戏,某人掷两颗骰子,若掷出的点数之和是7或11,则赢;若掷出 的点数之和是2、3或12,则输;若掷出其他的点数和,则记下这个数,继续掷这两颗骰 子,直到掷出的点数和是这个记下的数或者7为止,若是这个记下的数,则赢,若是7, 则输.求此人赢的概率是多少. 11 4第8章 成对数据的 在必修课程第13章“统计”中,我们主要研究了来自单 一变量数据的一些统计特征,如集中趋势、离散程度、分 统计分析 布等.但现实世界中许多事物和现象之间都是有联系的.在 本章中,我们将主要学习来自两个变量的成对数据的相关 分析和回归分析,掌握它们之间的统计规律. 本章将要学习的相关分析、回归分析及χ2 检验都属于 推断性统计方法,它们在构建统计模型、预测结果和因果 分析等方面有许多应用. 在必修课程中学过的散点图是进行成对数据统计分析 的基础,通过观察散点图可以大致了解数据的整体形态和 偏离情况,发现两组数据之间的变化规律,构建适当的统 计模型.统计图表不仅可以直观地表示数据及其规律,也是 建立统计直觉的重要途径. 书书书8 成对数据的统计分析 成对数据的 8.1 相关分析 1 成对数据间的关系 在统计活动中,我们常常需要研究来自同一对象的两个相关 变量的两组数据间的关系.例如,为考察某班学生的身高与体重的 关系,首先需要对每个学生的身高和体重进行测量,得到两组数 据:一组是反映“身高”这个变量的数据,另一组是反映“体重”这 个变量的数据.我们把这样来自同一对象的两组数据称为成对数 据.研究成对数据相关性的方法称为相关分析(correlationanalysis). 在必修课程第13章中,我们曾经用散点图观察两个变量之 间的相关性.例如,我们分别讨论了钻石价格与质量、颜色之间 的关系. 下面再来看一个例子. 例1 通过随机抽样,我们获得某种商品每千克价格(单 位:百元)与该商品消费者年需求量(单位:千克)的一组调查数 据,如表81所示. 表81 消费者年需求量与商品每千克价格 每千克价格/百元 4.0 4.0 4.6 5.0 5.2 5.6 6.0 6.6 7.0 10.0 年需求量/千克 3.5 3.0 2.7 2.4 2.5 2.0 1.5 1.2 1.2 1.0 请绘制上述数据的散点图,并依据散点图观察两组数据的相 关性. 解 由于这两组数据分别来自同一商品的两个变量:“每千 克价格”与“年需求量”,因此来自这两个变量的两组数据可以看 作成对数据.把“每千克价格”作为横坐标(自变量),“年需求量” 作为纵坐标(因变量),在平面直角坐标系中绘制相应的点,就得 到年需求量和每千克价格的散点图(图811). 11 68.1 成对数据的相关分析 散点图中的点和 必修课程第13章中一 样,用小方块“ ”或 ◆  “ ”表示. 图811 消费者年需求量与商品每千克价格的散点图 从图811可以看出,消费者对该商品的年需求量大体上随 着价格的上升而减少,但也有一些例外的情况.例如,价格都是 4百元,但不同年份的需求量分别是3.5千克和3千克,说明在 价格不变的情况下,需求量仍可能发生变化.类似地,价格改 变,需求也可能基本不变. 对例1所示的散点图,从整体上看,所有点都在一条直线的 附近波动,在这种情况下,我们说两个变量之间具有一种线性相 关关系.此时可以用一条直线来拟合这两组数据(图811). 练习8.1(1) 1.若已知下列各组数据,它们是否可以看作成对数据?是否可以进行相关分析?判断 并简要说明理由. (1)A校学生的身高与B校学生的体重; (2)人体内的脂肪含量与体重; (3)某班学生的物理成绩与数学成绩. 2.《国家学生体质健康标准(2014年修订)》中,体能监测包含身高、体重、肺活量、 50米跑、坐位体前屈、引体向上(女:仰卧起坐)、立定跳远、1000米跑(女:800米跑), 据此得到的每项指标都可以按照相应的单项指标评分表进行测量和计分,分别得到相应的 数据. (1)这些数据中的任意两组是否都可以作为成对数据进行相关分析? (2)依据你的经验,哪两组数据的相关程度可能最高?哪两组数据的相关程度可能最 低?如何通过统计方法检验你的判断? 1 178 成对数据的统计分析 3.某市104路公交车上午7:05—8:55时段在起点站每9分钟发一班次.公交公司为 了了解早高峰时段各班次上客情况,某日上午7:14—8:35记录了在起点站各班次车辆上 客的人数: 发车时刻 7:14 7:23 7:32 7:41 7:50 7:59 8:08 8:17 8:26 8:35 上车乘客数/人 10 13 13 18 17 15 12 9 3 3 请绘制这组成对数据的散点图,并通过观察散点图大致判断客车发车时刻与上车乘客 人数之间的相关性. 2 相关系数 从本节例1可以看出,一些成对数据具有明显的相关性,且 在绘制出散点图后可以用一条直线进行拟合,也就是说具有线性 相关性.在这种情况下,我们如何进一步描述成对数据的线性相 关程度呢? 设由变量狓和狔获得的两组数据分别为狓和狔犻(=1,2,…, 犻 犻 狀),其对应关系如表82所示. 表82 变量狓 狓 狓 狓 狓 狓 狓 … 狓 1 2 3 4 5 6 狀 变量狔 狔 狔 狔 狔 狔 狔 … 狔 1 2 3 4 5 6 狀 两组数据狓 和狔的线性相关系数(linearcorrelationcoefficient)是 犻 犻 度量两个变量狓与狔之间线性相关程度的统计量,其计算公式为 ∑狀 (狓-狓)(狔-狔) 犻 犻 狉= 犻=1 . ① 槡∑狀 (狓-狓) 2 ∑狀 (狔-狔) 2 犻 犻 犻=1 犻=1 其中,狓= 1 ∑狀 狓,狔= 1 ∑狀 狔,它们分别是这两组数据的算术 狀 犻 狀 犻 犻=1 犻=1 平均数. 11 88.1 成对数据的相关分析 线性相关系数常常简称为相关系数(correlationcoefficient), 也称为皮尔逊相关系数(Pearsonscorrelationcoefficient).相关 系数计算公式的推导过程比较复杂,这里不予涉及.一般情况 下,只需要把两组数据输入计算机或计算器,有很多软件可以帮 助我们进行这一计算. 可以证明,相关系数狉的值满足|狉|≤1.|狉|越接近1, 两个变量的线性相关程度越高;|狉|越接近0,两个变量的线 性相关程度越低.狉>0时,当狓的值由小变大,狔的值具有 不等式|狉|≤1 由小变大的变化趋势,称这种相关为正相关;狉<0时,当狓 的证明不作要求,本 节的课后阅读“相关 的值由小变大,狔的值具有由大变小的变化趋势,称这种相 系数的几何意义”将 给出直观的解释. 关为负相关. 相关系数狉描述的是两个变量之间线性关系的方向与程度, 是一种定量分析的方法.相关系数具有以下特点: (1)相关系数的计算公式关于狓和狔这两个变量是对称的. 画散点图时,不论以哪个变量作为横轴(纵轴),所得的相关系数 都一样. (2)两个变量的相关系数与这两个变量的单位无关.例如, 在计算身高与体重的相关系数时,身高单位不管取“米”还是“厘 用相关系数来描 述两个随机变量的相 米”,相关系数的结果都一样. 关性,一般要求这两 个变量均满足正态分 (3)与平均数和标准差一样,相关系数不仅会受到数据量多 布. 少的影响,也会受到少数异常值较大的影响. 例2 为了解某市高中男生身高与体重的关系,随机抽取 5所高中学校,并获得这些学校全部男生的身高(单位:cm) 与体重(单位:kg)的数据.为了减少篇幅,从中随机选取10 名高中男生的身高与体重的数据,如表83所示.试根据表 中数据绘制散点图,计算相关系数并判断学生身高与体重的 相关程度. 表83 10名高中男生的身高与体重 编号 1 2 3 4 5 6 7 8 9 10 身高/cm 174 176 176 181 182 179 169 168 171 180 体重/kg 55 58 62 74 88 68 54 52 56 86 1 198 成对数据的统计分析 解 将表83中的数据输入计算机电子表格办公软件的工作簿, 先选中身高与体重两行(或两列)数据,再选择插入统计图中的散点 图,选择图形样式,就完成了散点图的绘制,如图812所示. 在本例中,若删 去一组数据(182,88), 则相关系数变为0.844; 若样本数据中身高为 182cm的学生体重为 58kg,则相关系数变 为0.684. 图812 10名高中男生身高与体重的散点图 从图812中可以看出,总体上来说,样本学生的身高和体 用计算机或计算 重之间具有明显的相关性,个子高的学生往往更重一些. 器算得数值的小数 位数较多,在统计应 为了计算相关系数,我们把表中的两组数据代入本节公式 用中可根据需要进行 取舍. ①,通过计算机或计算器算得狉≈0.873.这说明样本学生的身高 与体重之间具有很高的相关性. 练习8.1(2) 1.用经过匿名处理的本班同学最近一次期中或期末测验的各科成绩表,考察不同科目 测验成绩之间的相关性. 2.为了研究豆类脂肪含量与其产生的热量的关系,选取了5种豆类进行实验测定.下 面是0.1kg豆类中脂肪含量(单位:kg)与相应热量(单位:kJ)的对照表. 豆类 黄豆 豇豆 青毛豆 豌豆(鲜) 四季豆 脂肪含量/kg 0.0184 0.0002 0.0057 0.0003 0.0004 热量/kJ 1726 108 527 336 130 (1)根据表中的数据绘制散点图; (2)观察散点图的趋势,如果能看成线性关系,请在图中画出一条直线来近似地表示 这种关系,并计算豆类脂肪含量与热量的相关系数. 12 08.1 成对数据的相关分析 习题8.1 犃组 1.计算例1中商品每千克价格与年需求量之间的相关系数. 2.必修课程第13章中曾给出A校66名高一年级学生身高(单位:cm)与体重(单位: kg)的数据,见下表.试计算它们的相关系数. 性别 身高/cm 体重/kg 性别 身高/cm 体重/kg 性别 身高/cm 体重/kg 女 152 46 女 164 52 男 172 92 女 153 47 男 165 54 男 172 64 女 154 63 男 165 60 女 172 69 女 155 50 男 165 48 男 173 75 女 156 48 女 165 51 男 173 72 女 156 50 女 165 55 男 174 55 女 156 51 女 165 58 男 174 56 女 157 51 女 165 63 男 174 63 女 157 50 男 166 64 男 174 74 女 159 49 男 167 54 男 175 53 女 159 51 男 167 52 男 176 64 女 160 47 男 167 53 男 176 60 女 160 62 女 167 69 男 177 63 女 160 50 女 167 61 男 177 75 女 160 63 男 168 97 男 178 62 女 161 53 女 168 60 男 178 60 女 162 84 女 168 44 男 178 73 女 163 66 男 170 53 男 178 68 女 163 53 男 170 54 男 179 78 女 164 63 男 170 57 男 181 80 女 164 68 男 170 47 男 182 92 女 164 52 男 170 69 男 184 78 1 218 成对数据的统计分析 3.某公司为研究工人操作熟练程度对产品合格率的影响,随机抽取15名工人进行调 查,得到如下数据: 工人编号 1 2 3 4 5 6 7 8 操作熟练程度/% 7.6 15.2 37.9 45.5 7.6 0.0 15.2 75.8 产品合格率/% 50 55 68 75 52 30 55 90 工人编号 9 10 11 12 13 14 15 / 操作熟练程度/% 90.9 60.6 7.6 15.2 37.9 45.5 98.5 / 产品合格率/% 92 80 58 60 70 80 95 / 试计算工人操作熟练程度与产品合格率的相关系数. 4.为判断能不能用气温推测海水表层温度,收集了某沿海地区的气温和海水表层温度 (单位:℃)的统计数据,如下表所示. 气温/℃ 海水表层温度/℃ 气温/℃ 海水表层温度/℃ 13.9 9.4 31.1 28.3 15.0 10.6 31.1 26.7 18.3 13.3 28.9 25.0 23.9 18.9 23.9 22.2 27.2 21.7 20.0 15.6 30.0 25.6 15.0 10.0 试计算气温与海水表层温度的相关系数. 犅组 1.如果两种证券在一段时间内收益数据的相关系数为正数,那么表明 ( ) A.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌; B.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的; C.两种证券的收益有同向变动的倾向; D.两种证券的收益有反向变动的倾向. 2.据说职工迟到的频率与其居住地离上班地点的远近有关.为验证这个说法,一位社 会学家随机抽取10名职工进行了调查,其调查数据如下表所示. 12 28.1 成对数据的相关分析 职工编号 年迟到次数/次 住地远近/km 职工编号 年迟到次数/次 住地远近/km 1 8 1.1 6 3 10.1 2 5 2.9 7 5 12.0 3 8 4.0 8 2 14.3 4 7 5.9 9 4 14.1 5 6 8.2 10 2 7.8 试计算职工年迟到次数与住地远近之间的相关系数. 3.下表是某国家由18支足球队参加的职业联赛(比赛采用双循环制,得分计算方法 为:每场赛事胜方得3分,负方得0分,平局双方各得1分)的各队积分和射门次数,求 这18支球队的积分与射门次数的相关系数. 足球队 A B C D E F G H I 积分 51 64 62 53 47 43 44 42 46 射门次数 418 509 485 425 452 425 393 350 375 足球队 J K L M N O P Q R 积分 43 50 35 40 40 32 41 26 32 射门次数 428 415 363 372 377 271 395 306 357 课后阅读 相关系数的几何意义 观察相关系数狉的计算公式 ∑狀 (狓-狓)(狔-狔) 犻 犻 狉= 犻=1 , ① 槡∑狀 (狓-狓) 2 ∑狀 (狔-狔) 2 犻 犻 犻=1 犻=1 你是否觉得似曾相识? 在学习向量时,我们曾经给出过两个向量的夹角公式.下面以空间向量为例,来看看 两个空间向量的夹角公式与公式①的联系.设狓珝=(狓,狓,狓),狔珗=(狔,狔,狔),那么它 1 2 3 1 2 3 们夹角的余弦为 1 238 成对数据的统计分析 ∑3 狓狔 狓狔+狓狔+狓狔 犻犻 cos〈狓珝,狔珗〉= 1 1 2 2 3 3 = 犻=1 . 槡(狓2 1 +狓2 2 +狓2 3 )(狔2 1 +狔2 2 +狔2 3 ) 槡∑3 狓2 ∑3 狔2 犻 犻 犻=1 犻=1 从结构上看,这两个公式是一样的.如果把两组数据狓、狔(犻=1,2,…,狀)看作两 犻 犻 个狀维向量狓珝=(狓,狓,…,狓)、狔珗=(狔,狔,…,狔),并记由这两组数据的平均数构成的 1 2 狀 1 2 狀 两个狀维向量分别是 =(狓,狓,…,狓)及 =(狔,狔,…,狔),那么比较公式①和向量的夹角 公式可以发现:狉=cos〈狓珝- ,狔珗- 〉,这说明相关系数狉其实就是两个向量狓珝- 与 狔珗- 的夹角的余弦值.余弦值越接近1或-1,意味着这两个向量越接近平行,散点图中 的点更多地落在同一条直线的附近,说明这两组数据的变化方向接近相同或相反,正相关 或负相关的程度越高;余弦值越接近0,意味着这两个向量越接近垂直,表示这两组数据 的相关程度越低.此外,两组数据狓、狔(犻=1,2,…,狀)之所以分别减去各自的平均 犻 犻 数,相应地得到差向量狓珝- 与狔珗- ,从几何上看是在作一个平移变换,而用统计学的说 法,则相应于做了一个数据中心化的处理. 12 48.2 一元线性回归分析 一元线性回归 8.2 分析 1 一元线性回归分析的基本思想 对于一组有某种线性关系的成对数据,上一节介绍的相关系 数分析了数据之间线性关系的方向与程度.但有时我们还需要进 一步了解其中一个变量随另一个变量变化的大致情况.更准确地 说,我们要找到关联两个变量的一个线性方程,使得在平面直角 坐标系上数据所确定的点尽可能地“贴近”方程所定义的直线. 先回到本章8.1节的例1.为了找一条直线去“贴近”数据散 点图(图811)中的各点,甲、乙两名同学分别给出了线性方程: 甲:狔=-0.5狓+5.0, 乙:狔=-0.4狓+4.5. 我们在散点图上把这两个线性方程所定义的直线绘制出来,如图 821所示,其中红色直线是甲的方程所定义的,蓝色直线是乙 的方程所定义的. 图821 凭直觉我们很难断定哪条直线与数据点贴近得更好. 至此,我们会提出问题:(1)有没有明确的标准来衡量直线 与数据点的贴近程度?(2)如果有这样的标准,如何找出在此标 1 258 成对数据的统计分析 准下最佳的直线? 要解决这两个问题,可以用下面介绍的回归分析的方法. 一般地,设给定一组有线性相关关系的成对数据(狓,狔)、 1 1 (狓,狔)、…、(狓,狔)和一个线性方程(或称线性模型) 2 2 狀 狀 狔=犪狓+犫. ① 如何描述数据与此线性方程的贴近度呢? 当变量狓取值狓(犻=1,2,…,狀)时,令^狔=犪狓+犫,它 犻 犻 犻 是变量狔与狓 对应的理想值.但数据中的狔 与狔^ 不一定相同, 犻 犻 犻 它们的差狔-^狔 称为在狓 处的离差(dispersion),当狔-狔^≥0 犻 犻 犻 犻 犻 时称为正离差,而当狔-^狔<0时称为负离差.显然,离差直观 犻 犻 地描述了单对数据与线性方程①的贴近度. 由于离差可正可负,考虑数据整体与线性方程①的贴近度 时,不能简单地用离差的代数和作为指标.我们可以像计算方差 那样,用离差的平方和 ∑狀 犙= (狔-^狔) 2 犻 犻 犻=1 来刻画直线与点之间的拟合程度.犙称为拟合误差(fitting error),它是一个很好的描述数据与线性方程①贴近度的指标. 我们把拟合误差取得最小值时得到的线性方程(线性模型)记为 狔=^犪狓+ ^ 犫, ② 并称之为变量狔随狓波动的回归方程(regressionequation)或回归 模型(regressionmodel),其中自变量狓称为解释变量(explanatory variable),因变量狔称为反应变量(responsevariable).回归方程所 定义的直线称为回归直线(regressionline),回归方程的系数(或称 回归模型的参数)^犪与^ 犫称为回归系数(regressioncoefficients).由 一组有某种线性关系的成对数据求其回归方程的方法称为一元线 性回归分析(regressionanalysis). 回归系数^犪与^ 犫的计算公式如下: ∑狀 ∑狀 烄 (狓-狓)(狔-狔) 狓狔-狀狓狔 犻 犻 犻犻 ^犪=犻=1 =犻=1 , ∑狀 ∑狀 (狓-狓) 2 狓2-狀狓2 犻 犻 烅 犻=1 犻=1 ③ ∑狀 ∑狀 狔-^犪 狓 犻 犻 ^ 犫=狔-^犪狓=犻=1 犻=1 , 烆 狀 12 68.2 一元线性回归分析 其中狓与狔分别是数据狓 与狔(犻=1,2,…,狀)的算术平均值, 犻 犻 数对(狓,狔)称为样本点的中心. 从回归系数公式 公式③的一个初等的推导过程在本节的课后阅读中介绍.回 ③可以看出,回归直线 归系数^犪与^ 犫的值只与给定的数据有关,而与回归分析过程中初 经过样本点的中心 (狓,狔),也就是散点 始选择的线性模型无关. 图中数据点的中心. 有了回归系数^犪与^ 犫,代入方程②就得到了这一组成对数据的 回归方程.这样,我们对本节开头提的两个问题都有了明确的答案. 我们的回归分析是基于犙取最小值的假设,即基于所有离 差的平方和取最小值的假设进行的.这种回归分析的方法称为最 小二乘法(leastsquares),由最小二乘法导出的估计量称为最小 二乘估计量,所得到的回归系数^犪与^ 犫又称为模型参数犪与犫的 最小二乘估计(leastsquaresestimate). 在解决具体问题时,如果数据量不大,可以用上面的公式直 接计算出回归系数^犪与^ 犫,进而得出回归方程.如果数据量大, 就要借助统计软件,通过计算机或计算器来实现这一过程了. 下面我们针对本章8.1节中的例1来求回归方程,并理解回 归直线与观察值之间的关系. 依据表81给出的某种商品“年需求量”(狔)与“每千克价格” (狓)之间的一组观察数据以及所得到的散点图811,我们已经知道 这两个变量形成的数据点大致分布在一条直线的附近,即“年需 求量”(狔)与“每千克价格”(狓)大致呈线性关系,因而可以用线性 回归方程来刻画它们之间的数量关系.用回归系数的计算公式可 烄^犪=-0.413, 求得 于是所求的回归方程为 烅 烆 ^ 犫=4.495, 狔=-0.413狓+4.495, 这个方程所定义的直线即这组数据的回归直线,它是给定数据点 的最佳拟合直线. 由回归方程,我们可以算出每个狓 对应的计算值狔^(结果精 犻 犻 确到0.1),列表84如下: 表84 狓 4.0 4.0 4.6 5.0 5.2 5.6 6.0 6.6 7.0 10 狔 3.5 3.0 2.7 2.4 2.5 2.0 1.5 1.2 1.2 1.0 ^狔 2.8 2.8 2.6 2.4 2.3 2.2 2.0 1.8 1.6 0.4 离差狔-^狔 0.7 0.2 0.1 0.0 0.2 -0.2-0.5-0.6-0.4 0.6 犻 犻 1 278 成对数据的统计分析 据此可进一步算出拟合误差犙= ∑10 (狔-狔^)2=0.72+ 如果两组数据之 犻 犻 间的相关系数很小, 犻=1 根据公式求回归系数 0.22+0.12+0.02+0.22+(-0.2) 2+(-0.5) 2+(-0.6) 2+ 还有意义吗? (-0.4) 2+0.62=1.75.它当然是这组数据的线性拟合中拟合 误差所能达到的最小值. 有了上述准备,现在我们就能判断本节开始时学生甲和乙给 出的线性方程哪个更贴近所给的数据点了.学生乙所给的方程实际 上是系数精确度不同的回归方程,如果用这个方程来制作表84, 只会出现一些由数据精确度不同引起的小误差;学生甲所给的方 程与回归方程有本质的差别. 练习8.2(1) 1.将学生甲所给的线性方程狔=-0.5狓+5.0作为本章8.1节例1数据的线性拟合, 计算各数据点的离差,再计算拟合误差.把结果与表84的数据相比较,说说你对“最佳 拟合”有什么新的理解和体会. 2.两个变量狓与狔之间的回归方程 ( ) A.表示狓与狔之间的函数关系; B.表示狓与狔之间的不确定关系; C.反映狓与狔之间的真实关系; D.是反映狓与狔之间的真实关系的一种最佳拟合. 3.用最小二乘法求回归方程是为了使 ( ) ∑狀 ∑狀 A. (狔-狔)=0; B. (狔-狔^)=0; 犻 犻 犻 犻=1 犻=1 ∑狀 ∑狀 C. (狔-狔^)最小; D. (狔-^狔) 2 最小. 犻 犻 犻 犻 犻=1 犻=1 2 一元线性回归分析的应用举例 例1 依据本章8.1节例2中某市高中男生身高与体重 的抽样数据,运用电子表格办公软件求“体重”(狔)关于“身 高”(狓)的回归方程. 解 将表83中的数据输入工作簿,然后选择“插入图表”, 再选择“散点图”,则自动生成如下的散点图(图822). 12 88.2 一元线性回归分析 图822 在数据点上单击右键,选择“添加趋势线”-“线型”,并在“趋 势线选项”标签中要求给出公式,可以得到回归直线(图823). 图823 图823中标明了所求的回归方程为:狔=2.311狓-340.504. 根据所得的回归方程,对于身高178cm的男生,可以预测 其体重为2.311×178-340.504=70.854(kg). 从上述例子可以看出,建立一元线性回归模型的一般步骤 如下: (1)确定研究对象,从一组数据出发,根据实际问题,明确 哪个变量是自变量,哪个变量是因变量; (2)对确定的自变量和因变量,绘制相应的散点图,观察它 们之间的关系(如是否存在线性关系等); (3)若观察到数据呈线性关系,则选用线性方程狔=犪狓+犫; (4)利用最小二乘法估计线性方程中的参数犪、犫,得到回 1 298 成对数据的统计分析 归方程狔=^犪狓+ ^ 犫; (5)得出结果后计算离差,采用统计方法检验模型是否合适 (这一步本书不作要求); (6)利用所求的回归方程进行预测. 相关分析和回归分析作为处理成对数据的两种基本统计方 法,它们之间有如下联系与区别: (1)相关分析主要测定变量之间相关性的强弱和变化方向, 而回归分析则是在相关分析的基础上建立回归模型,定量地描述 变量间具体的变动关系.只有在两组变量具有线性相关性时,才 作线性回归分析,得到回归直线. (2)在相关分析中,两个变量的地位是对等的;而在回归分 析中,要考察的是一个变量随另一个变量的变化趋势,其中自变 量是解释变量,因变量是反应变量. (3)回归分析具有因果分析和预测的功能,可以分析反应变 量受解释变量的影响程度,也可以通过回归方程求得反应变量的 计算值来估计其他同类的观察值. (4)在相关分析中,一般要求两个变量的总体都满足正态分 布;而在回归分析时,一般只要求反应变量的总体满足正态分布. 除了具有线性关系的散点图以外,线性回归分析还可以处理 呈指数分布性状的数据分布.表85是1999年至2018年我国国内 游客数量(单位:万人次)的统计表,图824是根据这些数据所 作的散点图.从图上可以看出年份与游客人数之间不是线性关系, 而是有明显的指数增长的性状. 表85 年份 1999 2000 2001 2002 2003 2004 2005 国内游客数量/ 71900 74400 78400 87800 87000110200121200 万人次 年份 2006 2007 2008 2009 2010 2011 2012 国内游客数量/ 139400161000171200190200210300264100295700 万人次 年份 2013 2014 2015 2016 2017 2018 / 国内游客数量/ 326200361100400000444000500000553900 / 万人次 13 08.2 一元线性回归分析 图824 为了建立这组数据的拟合模型,我们将国内游客数量(方便 起见记为犖,单位:万人次)取自然对数ln犖,可得到表86. 表86 年份(犢) 1999 2000 2001 2002 2003 2004 2005 犖 71900 74400 78400 87800 87000 110200121200 ln犖 11.18 11.22 11.27 11.38 11.37 11.61 11.71 年份(犢) 2006 2007 2008 2009 2010 2011 2012 犖 139400 161000 171200 190200 210300 264100295700 ln犖 11.85 11.99 12.05 12.16 12.26 12.48 12.60 年份(犢) 2013 2014 2015 2016 2017 2018 / 犖 326200 361100 400000 444000 500000 553900 / ln犖 12.70 12.80 12.90 13.00 13.12 13.22 / 对表86中的变量犢(年份)和ln犖绘制散点图(图825). 图825 从图825中可以看出各数据点之间呈线性关系,于是我们 作线性回归分析,求得犢与ln犖之间的线性拟合ln犖=犪犢+犫. 最终我们得到 犖=e犪犢+犫=e犫e犪犢=犮e犪犢 , 其中犮=e犫 是一个常数. 1 318 成对数据的统计分析 相关分析和回归分析都是处理变量与变量之间关系的重要统 计方法,在大数据时代更具有广泛的应用. 练习8.2(2) 1.某公司为了解用电量狔(单位:kW·h)与气温狓(单位:℃)之间的关系,随机统计 了4天的用电量与当天气温,并制作了如下对照表: 气温狓/℃ 18 13 10 -1 用电量狔/(kW·h) 24 34 38 64 由表中数据可得回归方程狔=犪狓+犫中犪=-2,试预测当气温为-4℃时,用电量约 为 kW·h. 2.用计算器或计算机软件建立下列观测数据的回归方程: 狓 70 115 130 190 195 400 450 犻 狔 1.10 1.00 0.85 0.75 0.85 0.67 0.50 犻 3.为了研究长江口滨海湿地乡土植物芦苇高度(单位:cm)与干重(单位:g)之间的关 系,观察芦苇高度与干重的数据(见下表),其中干重为植物收获并烘干到一定标准后的质 量.试建立芦苇干重关于芦苇高度的回归方程. 编号 高度/cm 干重/g 编号 高度/cm 干重/g 1 136 15.01 13 147 16.87 2 136 14.88 14 150 17.13 3 135 15.12 15 148 17.26 4 138 14.99 16 150 18.13 5 139 15.54 17 149 17.66 6 138 15.24 18 152 17.84 7 141 15.68 19 151 18.17 8 143 15.88 20 154 18.36 9 142 18.16 21 155 17.95 10 144 16.33 22 155 18.65 11 148 15.99 23 157 18.89 12 146 16.57 24 156 19.26 13 28.2 一元线性回归分析 习题8.2 犃组 1.下表中是某家庭2009年至2018年电费开支的情况,设年电费开支为狔(单位: 元),试建立年份狓与狔的回归方程. 年份狓 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 电费狔/元 1323 1552 1679 1852 1975 2129 2327 2494 2667 2791 2.随机抽取8对成年母女的身高数据(单位:cm),试据此建立母亲身高与女儿身高 的回归方程. 母亲身高狓/cm 154 157 158 159 160 161 162 163 女儿身高狔/cm 155 156 159 162 161 164 165 166 3.某生物学家对白鲸游泳速度与其摆尾频率之间的 关系进行了研究.研究的样本为19头白鲸,测量其游泳 速度和摆尾频率.白鲸游泳速度的测量单位为每秒向前 移动的身长数(1.0代表每秒向前移动一个身长),而摆 尾频率的测量单位是赫兹(1.0代表每秒摆尾1个来回). 测量数据如下表所示. (第3题) 白鲸编号 游泳速度/(L/s) 摆尾频率/Hz 白鲸编号 游泳速度/(L/s) 摆尾频率/Hz 1 0.37 0.62 11 0.68 1.20 2 0.50 0.68 12 0.86 1.38 3 0.35 0.68 13 0.68 1.41 4 0.34 0.71 14 0.73 1.44 5 0.46 0.80 15 0.95 1.49 6 0.44 0.88 16 0.79 1.50 7 0.51 0.88 17 0.84 1.50 8 0.68 0.92 18 1.06 1.56 9 0.51 1.08 19 1.04 1.67 10 0.67 1.14 / / / 1 338 成对数据的统计分析 生物学家聚焦的研究问题是“白鲸的摆尾频率依赖于其游泳速度吗”,这里的因变量狔 是摆尾频率,自变量狓是游泳速度. (1)绘制数据散点图; (2)建立狓与狔的回归方程. 4.某公司购进一新型设备,为了分配合适的工人操作该设备,进行了操作该设备的工 人工龄(单位:年)与劳动生产率(单位:件/时)之间的相关分析,下表是12名5~10年工 龄的工人操作新设备的劳动生产率的试验记录. 工人编号 1 2 3 4 5 6 7 8 9 10 11 12 工龄狓/年 5 5 6 6 6 7 7 8 8 9 10 10 劳动生产率狔/(件/时) 7.1 7.2 7.5 7.5 7.7 8.3 8.6 9.2 9.2 10.0 9.7 10.0 试建立工人操作新设备的劳动生产率狔与工龄狓的回归方程. 5.某工厂生产某种产品的月产量(单位:千件)与单位成本(单位:元/件)的数据 如下: 月份 产量狓/千件 单位成本狔/(元/件) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68 (1)计算产量与单位成本的相关系数; (2)建立产量与单位成本的回归方程; (3)若该工厂计划7月份生产7千件该产品,则单位成本预计是多少? 犅组 1.为了解大学校园附近餐馆的月营业收入 (单位:千元)和该店周围的大学生人数(单 位:千人)之间的关系,抽取了10所大学附近餐馆的有关数据,如下表所示. 13 48.2 一元线性回归分析 学生人数狓/千人 2 6 8 8 12 16 20 20 22 26 月营业收入狔/千元 58 105 88 118 117 137 157 169 149 202 (1)根据以上数据,建立月营业收入狔与该店周围的大学生人数狓的回归方程; (2)已知某餐馆周围的大学生人数为10000人,试对该店月营业收入作出预测. 2.某运动生理学家在一项健身活动中选择了19位参与者,以他们的皮下脂肪厚度来 估计身体的脂肪含量,其中脂肪含量以占体重(单位:kg)的百分比表示.得到脂肪含量和 体重的数据如下表所示.其中,参与者1~10为男性,11~19为女性. 参与者编号 体重狓/kg 脂肪含量狔/% 参与者编号 体重狓/kg 脂肪含量狔/% 1 89 28 11 57 29 2 88 27 12 68 32 3 66 24 13 69 35 4 59 23 14 59 31 5 93 29 15 62 29 6 73 25 16 59 26 7 82 29 17 56 28 8 77 25 18 66 33 9 100 30 19 72 33 10 67 23 / / / (1)分别建立男性和女性体重与脂肪含量的回归方程; (2)男性和女性合在一起所构成的样本的回归方程为狔=0.021狓+26.886,其斜率与 (1)中所计算的斜率有差异吗?能否对这种差异进行解释? (3)计算下列情况下体重与脂肪含量的相关系数:① 男性;② 女性;③ 男女合计. 这些值与(2)中所反映的信息是否一致? 3.(1)完成本节中提供的我国1999年至2018年国内游客数量与年份关系的回归模 型,并据此模型预测2021年我国国内的游客数量(回归系数保留4位小数,游客数量精确 到百万人次); (2)查阅2021年我国国内实际游客数量,与上述模型预测数据进行比较,并讨论数 据出现偏差的原因. 1 358 成对数据的统计分析 课后阅读 一元线性回归系数公式的推导 在这个阅读材料中,我们将用初等的方法推导本节中所介绍的回归系数公式③. 先回顾我们的问题.设有一组成对的数据(狓,狔)、(狓,狔)、…、(狓,狔)和一个狔 1 1 2 2 狀 狀 与狓的线性关系狔=犪狓+犫.对给定犻(犻=1,2,…,狀),令狔^=犪狓+犫.我们要“优化”线 犻 犻 性关系,使离差狔-狔^ 的平方和(即拟合误差) 犻 犻 ∑狀 犙= (狔-狔^) 2 犻 犻 犻=1 达到最小值.满足这个条件的线性关系是拟合数据的最佳选择. 为了找到最佳的线性关系,我们从略微不同的角度考察拟合误差.把拟合误差改写成 ∑狀 犙= (狔-犪狓-犫) 2. 犻 犻 犻=1 由于数据(狓,狔)(犻=1,2,…,狀)是给定的,故犙是犪、犫的二元函数.于是问题化为: 犻 犻 求变量犪、犫的最小二乘估计^犪、^ 犫,使函数值达到最小. 令狓= 1 ∑狀 狓 与狔= 1 ∑狀 狔分别是数据狓 与狔(犻=1,2,…,狀)的算术平均值,则 狀 犻 狀 犻 犻 犻 犻=1 犻=1 (狔-犪狓-犫) 2 犻 犻 ={(狔-狔)+[狔-(犪狓+犫)]-犪(狓-狓)}2 犻 犻 =(狔-狔) 2+[狔-(犪狓+犫)]2+犪2 (狓-狓) 2-2犪(狓-狓)(狔-狔) 犻 犻 犻 犻 +2[狔-(犪狓+犫)](狔-狔)-2犪[狔-(犪狓+犫)](狓-狓). 犻 犻 因为∑狀 狓=狀狓,所以∑狀 (狓-狓)= ∑狀 狓-狀狓=0;同理∑狀 (狔-狔)=0.这样,把上式 犻 犻 犻 犻 犻=1 犻=1 犻=1 犻=1 对犻从1到狀求和,其最后两项所对应的和式都是0.于是, ∑狀 ∑狀 ∑狀 犙= (狔-狔) 2+狀[狔-(犪狓+犫)]2+犪2 (狓-狓) 2-2犪 (狓-狓)(狔-狔) 犻 犻 犻 犻 犻=1 犻=1 犻=1 ∑狀 熿 (狓-狓)(狔-狔)燄2 ∑狀 ∑狀 犻 犻 = (狔-狔) 2+狀[狔-(犪狓+犫)]2+ (狓-狓) 2 犪-犻=1 犻 犻 ∑狀 犻=1 犻=1 (狓-狓) 2 燀 犻 燅 犻=1 [∑狀 ] (狓-狓)(狔-狔)2 犻 犻 - 犻=1 ∑狀 (狓-狓) 2 犻 犻=1 13 68.2 一元线性回归分析 [∑狀 ] (狓-狓)(狔-狔)2 ∑狀 犻 犻 ≥ (狔-狔) 2- 犻=1 . 犻 ∑狀 犻=1 (狓-狓) 2 犻 犻=1 所以,当 ∑狀 (狓-狓)(狔-狔) 犻 犻 犪=犻=1 ,狔=犪狓+犫 ∑狀 (狓-狓) 2 犻 犻=1 时,犙取得最小值 [∑狀 ] (狓-狓)(狔-狔)2 ∑狀 犻 犻 (狔-狔) 2- 犻=1 . 犻 ∑狀 犻=1 (狓-狓) 2 犻 犻=1 亦即,我们求得了模型参数的最小二乘估计 ∑狀 ∑狀 烄 (狓-狓)(狔-狔) 狓狔-狀狓狔 犻 犻 犻犻 ^犪=犻=1 =犻=1 , ∑狀 ∑狀 (狓-狓) 2 狓2-狀狓2 犻 犻 烅 犻=1 犻=1 ∑狀 ∑狀 狔-^犪 狓 犻 犻 ^ 犫=狔-^犪狓=犻=1 犻=1 . 烆 狀 这就是本节正文的公式③. 上面推导过程的最后一步配方技巧性较强,不过同学们可以通过展开平方式以验证等 式的成立. 在选择性必修课程第5章中,我们曾用求导的方法求函数的最值.求导方法对解决这 个问题也是有效的,不过问题要远比第5章的情况复杂,因为我们面对的是二元函数,所 要求的是称为“偏导数”的一种更为复杂的导数.粗略地说,针对我们的问题,可以先把犫 看作常数,求函数犙对犪的导数,再把犪看作常数,求函数犙对犫的导数,然后分别令 导数为零,解关于犪、犫的方程组,求得估计值^犪、^ 犫.有兴趣的同学可以一试. 1 378 成对数据的统计分析 8.3 2×2列联表 1 2×2列联表独立性检验 在实际问题中经常遇到要证实两类变量是相关的,或者反过 来,证实它们是相互独立的.如何利用取自这两类变量的样本来 判断它们是否相互独立呢? 下面通过案例来加以说明. 某疾病预防中心随机调查了339名50岁以上的公民,研究 吸烟习惯与慢性气管炎患病的关系,调查数据如表87所示. 问:患慢性气管炎与吸烟是否相互独立? 表87 不吸烟者 吸烟者 总计 不患慢性气管炎者 121 162 283 患慢性气管炎者 13 43 56 总计 134 205 339 表87对50岁以上的公民进行了两种分类:按是否吸烟进 行分类及按是否患慢性气管炎进行分类.从是否吸烟的角度来 看,吸烟的公民是一类,不吸烟的公民是另一类,这种变量的不 同“值”表示公民所属的不同类别,这类变量称为分类变量 (categoricalvariable). 在表87中,两个分类变量分别占两行和两列,形成4 个格子,每个格子中的数据是同时满足所在行列对应类别的 个体的频数.例如,第1行第1列中的数据121表示“不吸烟 同时不患慢性气管炎”的样本人数.这些数据都是通过实际调 查得到的,称为观察值.这些观察值形成的2行、2列的频数 13 88.3 2×2列联表 表格,称为2行×2列列联表,简称2×2列联表,也称为四 格表. 由表8 7中的数据可以计算其中一个分类变量的不同类别 在另一个分类变量中的百分比.例如,在不吸烟者中,约有 9.70%患慢性气管炎,而在吸烟者中,约有20.98%患慢性气管 炎,两者相差较大.因此,我们可以初步推断:患慢性气管炎可 能与吸烟有关,吸烟者患慢性气管炎的可能性更大.但这种推断 是否具有统计意义呢?我们有多大把握认为患慢性气管炎与吸烟 有关呢?这就需要用到2×2列联表独立性检验方法. 要检验两个随机变量是否有关,统计上一般先假设它们没有 关系,即相互独立,再进行统计检验.这种假设称为原假设(null hypothesis),也称为零假设,习惯上用犎 表示.以上述问题为 0 例,我们提出的原假设是: 在实际应用中, 犎:患慢性气管炎与吸烟没有关系,即它们相互独立. 跟原假设相对立的假 0 设,称为备择假设, 要检验上述假设,我们需要对2×2列联表(表87)中的观察 记作犎.在本例中, 1 备择假设犎 是:患慢 值与预期值进行比较.预期值是当原假设犎 成立时的预期结果. 性气管炎与 1 吸烟有关. 0 通常备择假设可略而 例如,由表87可知,总计339位样本公民中有56位患有慢性 不写. 56 气管炎,其百分比为 ×100%≈16.52%.假设患慢性气管炎 339 与吸烟没有关系,那么205位吸烟者中应该有205×16.52%≈ 33.87位患有慢性气管炎,这里的33.87就是原假设犎 成立时 0 计算得到的预期值.我们把这样计算得到的所有预期值与观察值 建立表格,就得到表88. 表88 不吸烟者 吸烟者 观察值 预期值 观察值 预期值 不患慢性气管炎者 121 111.86 162 171.13 患慢性气管炎者 13 22.14 43 33.87 为了描述观察值与预期值之间的总体偏差,我们引入统计 量χ2: ∑ (观察值-预期值) 2 χ2= 预期值 1 398 成对数据的统计分析 (121-111.86) 2 (162-171.13) 2 (13-22.14) 2 = + + 111.86 171.13 22.14 (43-33.87) 2 + 33.87 ≈7.468. χ2的值越大,说明表88中观察值与预期值的总体偏差越 大,原假设成立的可能性就越小.那么究竟χ2 多大时,我们才 可以拒绝原假设呢?这涉及χ2 分布.通过查阅χ2 分布概率表, 可以得到χ2值超过某些界限的概率.例如, 犘(χ2≥6.635)≈0.01, 0.05、0.01等小 概率值在统计上称为 犘(χ2≥5.024)≈0.025, 显著性水平,记作α. 方便起见,本书的显 犘(χ2≥3.841)≈0.05, 著性水平规定为0.05. 犘(χ2≥2.706)≈0.1. 以犘(χ2≥3.841)≈0.05为例,其含义是:如果原假设成立, 那么χ2≥3.841成立的概率约为0.05.这是一个小概率事件,不 太可能发生.由于在本例中,χ2≈7.468>3.841,因此我们可以 虽然小概率事件 推断原假设“患慢性气管炎与吸烟没有关系”成立的可能性小于 发生的概率很小,但 在统计上由于小概率 5%.或者说,我们有95%的把握认为患慢性气管炎与吸烟有关. 事件发生而作出拒绝 原假设的推断还是有 为了计算方便,我们给出2×2列联表χ2检验的计算公式: 风险的.显著性水平 为0.05,可以理解为 设有两组分类数据A、B,每组数据的两种状态分别用0和 错误拒绝的概率不超 过0.05. 1表示(如A组是“不吸烟者”,B组是“吸烟者”;用“0”表示“不 患慢性气管炎者”,用“1”表示“患慢性气管炎者”),则可得到下 面的2×2列联表(表89): 表89 两组分类变量的2×2列联表 A组 B组 总计 0 犪 犫 犪+犫 1 犮 犱 犮+犱 总计 犪+犮 犫+犱 犪+犫+犮+犱 其中,犪、犫、犮、犱为实际观察值. 由χ2= ∑ (观察值-预期值) 2 ,经过变形可得χ2的一般计 预期值 算公式 14 08.3 2×2列联表 狀(犪犱-犫犮) 2 χ2= . ① (犪+犫)(犮+犱)(犪+犮)(犫+犱) 其中,狀=犪+犫+犮+犱. 该公式的证明留作习题. 本例所用的χ2检验方法在统计学中称为2×2列联表独立性 检验(independencetestincontingencytable). 从上面的例子可以看出,2×2列联表独立性检验通常有如 下步骤: (1)提出两个随机变量没有关系的原假设犎. 0 (2)确定显著性水平α,本书中规定α=0.05,也即犘(χ2≥ 3.841)≈0.05. (3)计算统计量χ2的值. (4)统计决断:比较上述χ2值与3.841的大小,若χ2值≥ 3.841,则拒绝(或否定)犎;若χ2值<3.841,则不能拒绝(或否 0 定)犎,即接受犎.根据上述推断作出结论. 0 0 练习8.3(1) 某初中调查了该校1000名初三学生最近一次数学测试成绩与课堂注意力表现情况, 得到下表: 数学成绩≥80分 数学成绩<80分 总计 上课注意力集中 418 279 697 上课注意力不集中 43 260 303 总计 461 539 1000 请根据表中提供的数据判断:上课注意力集中与否对学习成绩有影响吗? 2 独立性检验的具体应用 为了研究两个因素是否相互影响,常常要用到独立性 检验. 例1 为了研究色盲与性别是否有关,随机抽取480位男 性和520位女性,测得他们是否为色盲的数据如表810所示. 1 418 成对数据的统计分析 表810 男女色盲分布列联表 男性 女性 总计 正常 442 514 956 色盲 38 6 44 总计 480 520 1000 问:色盲与性别是否有关? 解 把性别作为一个分类变量,把是否为色盲作为另一个分 类变量,问题为判断色盲与性别是否有关,因此可采用2×2列 联表独立性检验. (1)提出原假设犎:色盲与性别无关. 0 (2)确定显著性水平α=0.05. (3)计算χ2 的值,直接把表810中的数据代入χ2 的计算 公式①,其中犪=442,犫=514,犮=38,犱=6,狀=犪+犫+犮+犱= 1000,犪+犫=956,犮+犱=44,犪+犮=480,犫+犱=520,可得 1000×(442×6-514×38) 2 χ2= ≈27.139. 956×44×480×520 (4)统计决断:由犘(χ2≥3.841)≈0.05,而27.139>3.841, χ2的值超过了α所确定的界限,从而否定原假设,即判定色盲 与性别有关. 例2 一次语文测验,王老师所任教的甲、乙两个班级的 成绩情况如表811所示. 表811 甲班 乙班 总计 优秀 15 13 28 不优秀 20 18 38 总计 35 31 66 根据表811的数据,判断甲、乙两个班级语文测验的成绩 是否有显著差异. 解 把班级作为一个分类变量,把语文测验的成绩是否优秀 作为另一个分类变量,问题为判断语文测验的成绩与所在的班级 是否有关. 14 28.3 2×2列联表 (1)提出原假设犎:甲、乙两个班级语文测验的成绩没有 0 显著差异. (2)确定显著性水平α=0.05. 66×(15×18-13×20) 2 (3)计算χ2= ≈0.006. 28×38×35×31 (4)统计决断:由犘(χ2≥3.841)≈0.05,而0.006<3.841, 小概率事件没有发生,故不能否定原假设. 因此,甲、乙两个班级语文测验的成绩没有显著差异. 例3 为了研究55岁以上的人群与50岁以下的人群服用 一种胶囊药物后的反应是否有显著差异,某医学院进行了志愿者 口服该胶囊的观察试验,试验结果如表812所示.根据表中数 据,能否作出这两类人群对此药物的反应有显著差异的结论? 表812 ≥55岁人群 <50岁人群 总计 有明显反应 6 7 13 无明显反应 29 75 104 总计 35 82 117 解 把两年龄范围的人群作为一个分类变量,把对此药物有 无明显反应作为另一个分类变量,问题是判断两类人群对此药物 的反应是否有显著差异. (1)提出原假设犎:两类人群对此药物的反应没有显著 0 差异. (2)确定显著性水平α=0.05. 117×(6×75-7×29) 2 (3)计算χ2= ≈1.840. 13×104×35×82 本案例研究的样 本较小,仅能作为该 (4)统计决断:由于犘(χ2≥3.841)≈0.05,而1.840< 群体的参考数据.如 果要得到更为可靠的 3.841,因此根据本试验数据,不能认为55岁以上人群对此胶囊 结论,那么需要增加 样本量. 药物的反应与50岁以下人群有显著差异. 练习8.3(2) 1.为了调查髋关节保护器在减少老年人髋部骨折中的作用,随机选择一些老年人,其 中一部分佩戴髋关节保护器,而另一部分不佩戴,作为对照组.得到如下列联表: 1 438 成对数据的统计分析 佩戴髋关节保护器 对照组 总计 髋部骨折 13 67 80 无髋部骨折 640 1081 1721 总计 653 1148 1801 根据表中的数据回答:髋关节保护器是否可以降低老年人髋部骨折的可能性? 2.下表是A、B两所中学的学生对报考某类大学的意愿的列联表: 愿意报考某类大学 不愿意报考某类大学 总计 A中学 18 37 55 B中学 38 57 95 总计 56 94 150 根据表中的数据回答:A、B两所中学的学生对报考某类大学的态度是否有显著差异? 习题8.3 犃组 1.某校为考察高中生数学成绩与语文成绩的关系,抽取55名学生进行了一次测试, 并按照测试成绩优秀(进入年级前30%)和不优秀(没有进入年级前30%)统计人数,得到 如下列联表: 优秀 不优秀 总计 数学成绩 21 34 55 语文成绩 13 42 55 总计 34 76 110 根据表中的数据回答:该校高中生的数学成绩与语文成绩之间是否有关系? 2.慢性气管炎是一种常见的呼吸道疾病.医药研究人员对甲、乙两种中草药治疗慢性 气管炎的效果进行了对比,所得数据如下表所示. 有效 无效 总计 甲药 184 61 245 乙药 91 9 100 总计 275 70 345 14 48.3 2×2列联表 根据表中的数据回答:甲、乙两种中草药的疗效有无显著差异? 犅组 1.某工人在操作方法改进前后生产某种零件的情况如下表所示. 合格 不合格 总计 改进前 2422 439 2861 改进后 2892 447 3339 总计 5314 886 6200 根据表中的数据回答:改进操作方法能否显著降低不合格率? 狀(犪犱-犫犮) 2 2.证明本节中的公式①:χ2= . (犪+犫)(犮+犱)(犪+犮)(犫+犱) 课后阅读 不同类型的随机变量 成对数据的统计分析方法是由两个变量的属性决定的.统计中有三种常用类型的变 量:分类变量、顺序变量和数值变量. (1)分类变量:它的值属于非数量范畴.例如,性别变量的值为男和女;语文成绩 分成合格和不合格;学科变量的值为体育、艺术、音乐、劳技、语文、数学、外语、物 理、化学、生物、历史、地理、政治、信息技术等.本章8.3节中把人群分为吸烟者和 不吸烟者,以及患慢性气管炎者和不患慢性气管炎者,就是分类变量. (2)顺序变量:它的值是有序的.例如,月份1月、2月、3月、4月;国际足联世界 杯将四强分为冠军、亚军、第三名、第四名;将顾客对服务的满意度分为非常满意、满 意、一般、不满意、非常不满意;在某次选举中投票分为赞成、反对、弃权;等等. (3)数值变量:它的值是可以作数学计算(如加、乘)的数值,如考分、收入、质量等. 成对的两个变量不一定是同一类变量,它们共有9种(3×3)可能的排列方式.本章8.3 节所讨论的是两个分类变量的独立性检验(仅讨论分两类的简单情形),而在本章8.2节进 行线性回归分析的两个变量中,解释变量狓既可以是数值变量也可以是顺序变量(如年 份),但反应变量狔必须为数值变量. 1 458 成对数据的统计分析 内容提要 相关分析和一元线性回归分析是研究两个变量关系的两个互为补充的方法.相关分析 描述了两个变量的相关程度,而回归分析则描述了因变量是怎样受自变量影响的. 1.为了得到两个变量之间是否具有一定关系的直观印象,可以用散点图来描述这些 数据. 2.相关系数可以度量两个随机变量之间的线性关系.相关系数狉的值满足|狉|≤1, 且|狉|越接近1,两个随机变量的线性关系越密切. 3.回归方程代表了两个变量间的关系,回归直线经过散点图中数据点的中心.回归直 线的斜率越大,解释变量狓的一个单位变化所引起的反应变量狔的波动就越大. 4.回归方程可以通过最小二乘法得到.回归直线能较好地反映一个变量对另一个变量 的依赖情况,具有解释因果关系和预测的功能.利用回归方程可以由解释变量的值来预测 反应变量的值,从而给出反应变量真实值的一个估计. 5.2×2列联表描述两个分类变量所有值的组合数据是如何分布的.判断2×2列联 表中出现的两个分类变量是否独立可采用χ2检验.χ2检验的一般步骤是:(1)提出原假 设犎 ;(2)确定显著性水平α=0.05;(3)计算统计量χ2 的值;(4)统计决断:当χ2≥ 0 3.841时,拒绝原假设,推断两个变量相关,否则,接受原假设,推断两个变量不相关 (即两个变量是独立的).在实际情况下,是否完全拒绝原假设,还需要考虑样本量的 大小. 复习题 犃组 1.在研究硝酸钠的可溶性程度时,观测它在不同温度(单位:℃)100g的水中的溶解 度(单位:g),得到如下观测结果: 温度狓/℃ 10 25 40 50 55 60 65 75 溶解度狔/g 81 92 104 114 117 124 130 150 由此得到回归直线的斜率是 . 14 6复习题 2.若对具有线性相关关系的两个变量建立的回归方程为狔=-0.960狓+3.134,则当 狓=50时,狔的估计值为 . 3.某产品的广告费投入与销售额的统计数据如下表所示. 广告费狓/万元 4 2 3 5 销售额狔/万元 49 26 39 54 根据上表建立的回归方程狔=^犪狓+ ^ 犫中,^犪=9.4.9.4的实际意义是什么? 4.经过分层抽样得到16名学生高一和高二结束时的数学考试成绩(满分:100分), 如下表所示. 学生编号 1 2 3 4 5 6 7 8 高一 84 85 71 74 60 58 51 82 高二 84 88 72 73 68 62 60 85 学生编号 9 10 11 12 13 14 15 16 高一 87 69 79 80 83 84 63 54 高二 88 73 84 82 83 83 66 67 (1)绘制这些成对数据的散点图; (2)计算学生高一和高二数学成绩的相关系数.根据此相关系数,你能得出什么 结论? 5.通过随机询问72名大学生在购买食品时是否读营养说明,得到如下列联表: 男 女 总计 读营养说明 28 16 44 不读营养说明 8 20 28 总计 36 36 72 根据表中的数据回答:是否有95%的把握判定性别与读营养说明之间有关系? 犅组 1.某人对一地区近几年的年人均可支配收入狓(单位:千元)与年人均消费支出狔(单 位:千元)进行统计调查,发现狔与狓具有线性相关关系,且得到回归方程狔=0.71狓- 1.814.若该地区去年的年人均消费支出为4万3千元,试估计该地区去年的年人均消费支 出占人均可支配收入的百分比. 1 478 成对数据的统计分析 2.某连锁日用品销售公司下属5个社区便利店某月的销售额与利润额如下表所示. 便利店编号 1 2 3 4 5 销售额狓/万元 30 60 45 80 89 利润额狔/万元 2.3 3.5 3.2 4.0 5.3 (1)绘制销售额和利润额的散点图; (2)若销售额和利润额具有线性相关关系,试建立利润额狔与销售额狓的回归方程. 3.某一商品在某地区的年销售额与该地区的居民人数和平均每个家庭每年的总收入都 有关系.现有16个地区的统计数据,如下表所示. 销售额/ 居民人数/ 平均家庭总收入/ 销售额/ 居民人数/ 平均家庭总收入/ 地区编号 地区编号 (万元/年) 万人 (万元/年) (万元/年) 万人 (万元/年) 1 145 20.7 6.9 9 233 33.0 8.3 2 83 19.3 5.4 10 112 11.5 8.3 3 179 27.1 5.9 11 147 16.1 8.4 4 248 38.1 7.2 12 70 4.4 8.9 5 237 38.2 7.5 13 60 2.6 8.9 6 286 40.5 7.8 14 98 12.8 9.0 7 90 7.8 7.8 15 125 15.1 9.6 8 165 21.5 8.0 16 198 20.0 10.7 (1)试分别计算该商品年销售额与地区居民人数和平均每个家庭每年总收入的相关 系数; (2)选取(1)中相关系数较大的一对数据作回归分析. 4.为了验证蔬菜植株感染红叶螨能否引起植株对枯萎病的抗性,随机抽取57棵植株, 获得如下观察数据:26棵植株感染红叶螨,其中15株无枯萎病,11株有枯萎病;31棵 植株未感染红叶螨,其中17株无枯萎病,14株有枯萎病. (1)根据上述数据制作一张2×2列联表; (2)这些数据能否说明感染红叶螨可引起植株对枯萎病的抗性这一结论? 14 8复习题 拓展与思考 1.某公司随机调查了45户家庭,研究其一种产品的家庭人均消费量狔与家庭人均月 收入狓之间的关系,得到的数据如下表所示. 家庭编号 家庭人均月收入狓/元 家庭人均消费量狔/元 1 5432 6.32 2 2336 3.52 3 3944 6.32 4 4656 21.60 5 9246 29.12 6 17512 76.00 7 8776 42.72 8 16624 54.80 9 14544 46.72 10 13600 41.68 11 5976 26.00 12 13144 25.28 13 3312 4.00 14 2832 1.36 15 10208 15.04 16 5960 6.16 17 3480 11.12 18 4320 4.48 19 6992 12.48 20 12344 42.24 21 8232 5.12 22 5680 32.00 1 498 成对数据的统计分析 (续表) 家庭编号 家庭人均月收入狓/元 家庭人均消费量狔/元 23 6696 33.60 24 13984 39.04 25 11048 27.84 26 10040 21.04 27 14216 39.92 28 2960 4.72 29 9040 38.32 30 3704 4.08 31 6160 13.92 32 5792 32.80 33 6464 31.52 34 6320 6.68 35 6264 26.32 36 3248 3.52 37 9936 25.92 38 5264 17.12 39 13968 45.68 40 3744 5.12 41 8912 15.20 42 3304 4.08 43 14296 66.64 44 11960 40.88 45 12208 31.44 (1)绘制变量狔与狓的散点图; (2)计算狔与狓的相关系数; (3)试分析研究狔与狓之间的线性回归关系. 15 0复习题 2.下图是某地区2000年至2016年环境基础设施投资额狔(单位:亿元)的折线图. (第2题) 为预测该地区2018年的环境基础设施投资额,建立了狔与时间变量狋的两个线性回 归模型.其中,根据2000年至2016年的数据(时间变量狋的值依次为1,2,…,17)建立 了模型①:狔=-30.4+13.5狋;而根据2010年至2016年的数据(时间变量狋的值依次为 1,2,…,7)建立了模型②:狔=99+17.5狋. (1)分别利用这两个模型,求该地区2018年环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?请说明理由. 3.某地区市场上有80种品牌的饼干,它们近一段时间内的平均售价(以下简称“价 格”)和销售量的数据如下表所示. 品牌编号 价格/(元/千克) 销售量/千克 品牌编号 价格/(元/千克) 销售量/千克 1 14 1231.85 12 19.09 3566.58 2 34.62 1465.89 13 26.67 4264.28 3 30.86 1774.29 14 17.51 4672.33 4 14 1892.91 15 13 4752.20 5 36 2324.44 16 25.24 4865.42 6 28.41 2480.04 17 31.1 5042.91 7 9.09 2545.33 18 26.24 5108.73 8 44.84 2568.11 19 25.88 5367.70 9 31.68 2638.48 20 17.81 5465.26 10 20 3233.99 21 29.56 5500.35 11 14.67 3518.17 22 25 5655.53 1 518 成对数据的统计分析 (续表) 品牌编号 价格/(元/千克) 销售量/千克 品牌编号 价格/(元/千克) 销售量/千克 23 31.41 5865.45 52 16.95 10101.74 24 23.48 6103.94 53 15.38 10461.08 25 23.6 6243.10 54 13.88 10561.53 26 22.13 6509.67 55 13.04 10960.55 27 21.48 6758.18 56 29.33 11627.43 28 25.03 7100.93 57 4.9 11838.62 29 19.55 7356.44 58 11.91 12303.55 30 24.81 7439.63 59 13.9 12713.01 31 20.92 7627.28 60 17.78 12830.94 32 17.7 7740.45 61 17.31 13686.17 33 20.79 7744.67 62 12.27 14181.94 34 24.63 7989.30 63 11.89 15175.16 35 13.59 7996.84 64 10.08 17658.74 36 19.29 8151.09 65 6.13 18058.67 37 20 8231.85 66 10.4 19937.88 38 22.03 8289.18 67 12.7 23055.87 39 20.08 8524.06 68 9.19 26508.14 40 19.03 8689.36 69 8 29504.40 41 16.67 8874.66 70 5.22 31693.07 42 16.04 8888.74 71 9.23 32123.53 43 14.12 9005.62 72 7.6 34732.28 44 13.75 9046.93 73 8.33 36321.39 45 19.87 9384.98 74 9.25 36898.25 46 15.72 9414.11 75 9.36 38343.50 47 25.04 9454.50 76 8.42 39033.51 48 14 9731.32 77 6.25 43832.88 49 11.26 9762.08 78 23.01 112827.40 50 11.25 9809.51 79 8.7 139493.10 51 20.92 9924.99 80 12.32 21134.65 试对这80种品牌饼干近一段时间内的价格和销售量进行回归分析. 15 2后 记 本套高中数学教材根据教育部颁布的《普通高中数学课程标准(2017年版 2020年修订)》编写并经国家教材委员会专家委员会审核通过. 本教材是由设在复旦大学和华东师范大学的两个上海市数学教育教学研 究基地(上海高校“立德树人”人文社会科学重点研究基地)联合主持编写的. 编写工作依据高中数学课程标准的具体要求,努力符合教育规律和高中学生 的认知规律,结合上海城市发展定位和课程改革基础,并力求充分体现特 色.希望我们的这一努力能经得起实践和时间的检验,对扎实推进数学的基 础教育发挥积极的作用. 本册教材是选择性必修第二册,共为四章,各章编写人员分别为 程靖(第5章) 肖恩利、姚一隽(第6章) 应坚刚、田万国(第7章) 任升录、陈月兰、汪家录(第8章) 上海市中小学(幼儿园)课程改革委员会专家工作委员会、上海市教育委 员会教学研究室全程组织、指导和协调了教材编写工作.在编写过程中,两 个基地所在单位给予了大力支持,基地的全体同志积极参与相关的调研、讨 论及评阅工作,发挥了重要的作用.上海市不少中学也热情地参与了有关的 调研及讨论工作.上海教育出版社有限公司不但是编辑出版单位,而且自始 至终全面介入了编写工作.我们对所有这些单位和相关人员的参与、支持和鼓 励表示衷心感谢. 限于编写者的水平,也由于新编教材尚缺乏教学实践的检验,不妥及疏 漏之处在所难免,恳请广大师生及读者不吝赐教.宝贵意见请通过邮箱 gaozhongshuxue@seph.com.cn反馈,不胜感激. 2020年7月 书书书普通高中教科书 普 通 高 选择性必修 中 教 科 书 第 二 册 上 海 教 育 出 版 社 上 海 教 育 出 版 社 数 学 选 择 性 必 修 S H U X U E SHUXUE 普通高中教科书 选择性必修 第 二 册 第 二 册 定 价: 12.45元