当前位置:首页>文档>高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本

高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本

  • 2026-03-18 19:01:38 2026-03-18 19:01:38

文档预览

高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本
高中选修三数学_教资初高中_教资面试2025教资面试备考资料合集_教资面试资料合集_3、教资面试资料包大全_45大圣中小幼面试资料包_高中_数学_高中数学电子课本

文档信息

文档格式
pdf
文档大小
8.928 MB
文档页数
154 页
上传时间
2026-03-18 19:01:38

文档内容

普 ® 通 普 通 高 中 教 科 书 高 中 教 科 书 数学 数 学 选择性必修 PUTONG GAOZHONG JIAOKESHU 选 择 SHUXUE 第三册 性 必 修 第 三 册 绿绿色色印印刷刷产产品品 A 版 定价:00.00元 高高中中数数学学教教材材AA版版选选择择性性必必修修//第第三三册册封封面面修修订订..iinndddd 11 22002222//33//2299 1100::1199数学 普 通 高 中 教 科 书 选择性必修 第三册 人民教育出版社 课程教材研究所 编著 中学数学课程教材研究开发中心 A 版 ·北京·主 编:章建跃 李增沪 副 主 编:李 勇 李海东 李龙才 本册主编:程海奎 陈雪梅 编写人员:王 嵘 白 涛 李 勇 张唯一 张淑梅 金克勤 章建跃 程海奎 责任编辑:张唯一 美术编辑:王俊宏 封面设计: 版面设计: 插图绘制: 普通高中教科书 数学 选择性必修 第三册 人民教育出版社 课程教材研究所 编著 中学数学课程教材研究开发中心 出 版 (北京市海淀区中关村南大街17号院1号楼 邮编:100081) 网 址 http://www.pep.com.cn 版权所有·未经许可不得采用任何方式擅自复制或使用本产品任何部分·违者必究 如发现内容质量问题,请登录中小学教材意见反馈平台:jcyjfk.pep.com.cn 如发现印、装质量问题,影响阅读,请与×××联系调换。电话:×××-×××××××× 02 高中物理必修第一册 本书根据 《普通高中数学课程标准 (2017年版)》编写,包括 “计数原理”“随机变 量及其分布”“成对数据的统计分析”三章内容. 计数问题在日常生活、生产实践中大量存在,也是数学研究的重要问题之一.在 “计 数原理”一章中,同学们将学习分类加法计数原理和分步乘法计数原理,体会这两个原理 在解决计数问题中的基础性作用;运用两个基本计数原理探索排列、组合、二项式定理等 问题,推导相关的公式;在运用它们解决一些简单的计数问题和实际问题的过程中,理解 排列、组合、二项式定理与两个计数原理的关系,体会数学抽象、化繁为简等基本思想. 概率论是研究随机现象数量规律的科学.在 “随机变量及其分布”一章中,同学们将 结合具体实例,在学习条件概率的过程中,理解随机事件独立性与条件概率之间的关系, 掌握用乘法公式、全概率公式计算复杂事件概率的方法;通过具体实例体会用随机变量刻 画随机现象的好处,从中感悟随机变量与随机事件的关系;通过二项分布、超几何分布、 正态分布的学习,理解随机变量及其分布.在本章的学习过程中,同学们可以体会到用随 机变量的概率分布描述随机现象规律的思想,进一步加深对随机现象的认识,提高用概率 的方法解决问题的能力. 在必修课程中,同学们已经学习了获取样本数据,从样本数据中提取信息,用样本估 计总体的分布及数字特征的一些统计方法.在 “成对数据的统计分析”一章中,同学们将 结合典型案例,研究如何利用成对样本数据分析两个随机变量之间关系的问题.从中可以 了解到,两个随机变量的相关性可以通过成对样本数据进行分析;通过构建一元线性回归 模型,可以研究变量之间的随机关系并进行预测;利用2×2列联表可以检验两个分类变 量的独立性等.在本章的学习过程中,同学们可以进一步体会统计思想在解决实际问题中 的作用. 祝愿同学们通过本册书的学习,不但学到更多的数学知识,而且在数学能力、数学核 心素养等方面都有较大的提高,并培养起更高的数学学习兴趣,形成对数学的更加全面的 认识. 书书书第六章 计数原理 …………………………………………… 1 6.1 分类加法计数原理与分步乘法计数原理…………… 2 探究与发现 子集的个数有多少 ………………… 12 6.2 排列与组合 ………………………………………… 14 探究与发现 组合数的两个性质 ………………… 28 6.3 二项式定理 ………………………………………… 29 小结………………………………………………………… 36 复习参考题6……………………………………………… 37 数学探究 杨辉三角的性质与应用 ………………… 39 第七章 随机变量及其分布 …………………………… 43 7.1 条件概率与全概率公式 …………………………… 44 阅读与思考 贝叶斯公式与人工智能 …………… 53 7.2 离散型随机变量及其分布列 ……………………… 56 7.3 离散型随机变量的数字特征 ……………………… 62 7.4 二项分布与超几何分布 …………………………… 72 探究与发现 二项分布的性质 …………………… 81 7.5 正态分布 …………………………………………… 83 信息技术应用 概率分布图及概率计算 ………… 87 小结………………………………………………………… 89 复习参考题7……………………………………………… 90 第八章 成对数据的统计分析 ………………………… 92 8.1 成对数据的统计相关性 …………………………… 93 8.2 一元线性回归模型及其应用……………………… 105 阅读与思考 回归与相关………………………… 122 8.3 列联表与独立性检验……………………………… 124 小结 ……………………………………………………… 137 复习参考题8 …………………………………………… 138 数学建模 建立统计模型进行预测 ………………… 141 部分中英文词汇索引…………………………………………… 147第六章 计数原理 汽车号牌的序号一般是从26个英文字母、10个阿拉伯数字中 选出若干个,并按适当顺序排列而成.随着人们生活水平的提高, 家庭汽车拥有量迅速增长,汽车号牌序号需要扩容.那么,交通管 理部门应如何确定序号的组成方法,才能满足民众的需求呢?这 就需要 “数 (狊犺ǔ)出”某种汽车号牌序号的组成方案下所有可能 的序号数,这就是计数. 日常生活、生产中类似的问题大量存在.例如,幼儿会通过一 个一个地数的方法,统计自己拥有玩具的数量;学校要举行班际 篮球比赛,在确定赛制后,体育组的老师需要知道共需要举行多 少场比赛;用红、黄、绿三面旗帜组成航海信号,颜色的不同排 列表示不同的信号,需要知道共可以组成多少种不同的信号…… 如果问题中数量很少,一个一个地数也不失为一种计数的好方法. 但如果问题中数量很多,我们还一个一个地去数吗? 在小学我们学了加法和乘法,这是将若干个 “小”的数结合 成 “较大”的数最基本的方法.这两种方法经过推广就成了本章将 要学习的分类加法计数原理和分步乘法计数原理.这两个原理是解 决计数问题的最基本、最重要的方法,利用两个计数原理还可以 得到两类特殊计数问题的计数公式———排列数公式和组合数公式, 应用公式就可以方便地解决一些计数问题.作为计数原理与计数公 式的一个应用,我们还将学习在数学上有广泛应用的二项式定理. 书书书61 分类加法计数原理与分步乘法计数原理 计数问题是我们从小就经常遇到的,通过列举一个一个 地数是计数的基本方法.但当问题中的数量很大时,列举的 方法效率不高.能否设计巧妙的 “数法”,以提高效率呢? 下面先分析一个简单的问题,并尝试从中得出巧妙的计数 方法.  用一个大写的英文字母或一个阿拉伯数字给教室里的一个座位编号,总共能编出 多少种不同的号码? 因为英文字母共有26个,阿拉伯数字共有10个,所以总共可以编出 26+10=36 种不同的号码.  你能说一说这个问题的特征吗? 首先,这里要完成的事情是 “给一个座位编号”;其次是 “或”字的出现:一个座位 编号用一个英文字母或一个阿拉伯数字表示.因为英文字母与阿拉伯数字互不相同,所以 用英文字母编出的号码与用阿拉伯数字编出的号码也互不相同.这两类号码数相加就得到 号码的总数. 上述计数过程的基本环节是: (1)确定分类标准,根据问题条件分为字母号码和数字 号码两类; 你能举一些生活中类 (2)分别计算各类号码的个数; 似的例子吗? (3)各类号码的个数相加,得出所有号码的个数. 一般地,有如下分类加法计数原理: 完成一件事有两类不同方案 ,在第1类方案中有犿种 ? ?两类不同方案中的 不同的方法,在第2类方案中有狀种不同的方法,那么完成 方法互不相同. 这件事共有 2 第六章 计数原理犖=犿+狀 种不同的方法. 例1 在填写高考志愿表时,一名高中毕业生了解到,A,B两所大学各有一些自己 感兴趣的强项专业,如表6.11. 表611 A大学 B大学 生物学 数学 化学 会计学 医学 经济学 物理学 法学 工程学 如果这名同学只能选一个专业,那么他共有多少种选择? 分析:要完成的事情是 “选一个专业”.因为这名同学在A,B两所大学中只能选择一 所,而且只能选择一个专业,又因为这两所大学没有共同的强项专业,所以符合分类加法 计数原理的条件. 解:这名同学可以选择A,B两所大学中的一所.在A大学中有5种专业选择方法, 在B大学中有4种专业选择方法.因为没有一个强项专业是两所大学共有的,所以根据分 类加法计数原理,这名同学可能的专业选择种数为 犖=5+4=9.  如果完成一件事有三类不同方案,在第1类方案中有犿 种不同的方法,在第2 1 类方案中有犿 种不同的方法,在第3类方案中有犿 种不同的方法,那么完成这件 2 3 事共有多少种不同的方法? 如果完成一件事有狀类不同方案,在每一类方案中都有若干种不同的方法,那 么应当如何计数呢?  用前6个大写英文字母和1~9这9个阿拉伯数字,以A ,A ,…,A ,B, 1 2 9 1 B,…的方式给教室里的一个座位编号,总共能编出多少种不同的号码? 2 这里要完成的事情仍然是 “给一个座位编号”,但与前一问题的要求不同.在前一问 题中,用26个英文字母中的任意一个或10个阿拉伯数字中的任意一个,都可以给出一个 第六章 计数原理 3座位号码.但在这个问题中,号码必须由一个英文字母和一个作为下标的阿拉伯数字组 成,即得到一个号码要经过先确定一个英文字母,后确定一个阿拉伯数字这样两个步骤. 用图6.11所示的方法可以列出所有可能的号码.    1 A 1 2 A 2 3 A 3 4 A 4 图6.11是解决计数 A 5 A 5 问题常用的 “树状图”.你 6 A 6 7 A 7 能用树状图列出所有可能 8 A 8 的号码吗? 9 A 9 图6.11 也可以这样思考: 由于前6个英文字母中的任意一个都能与9个数字中的任意一个组成一个号码,而且 它们互不相同,因此共有 6×9=54 种不同的号码.  你能说一说这个问题的特征吗? 上述问题要完成的一件事情仍然是 “给一个座位编号”,其中最重要的特征是 “和” 字的出现:一个座位编号由一个英文字母和一个阿拉伯数字构成.因此得到一个座位号要 经过先确定一个英文字母,后确定一个阿拉伯数字这两个步骤,每一个英文字母与不同的 数字组成的号码是互不相同的. 一般地,有如下分步乘法计数原理: 完成一件事需要两个步骤 ,做第1步有犿种不同的方 ? ?无论第1步采用哪 法,做第2步有狀种不同的方法,那么完成这件事共有 种方法,与之对应的第2 犖=犿×狀 步都有相同的方法数. 种不同的方法. 例2 某班有男生30名、女生24名,从中任选男生和女生各1名代表班级参加比 赛,共有多少种不同的选法? 分析:要完成的一件事是 “选男生和女生各1名”,可以分两个步骤:第1步,选男 生;第2步,选女生. 4 第六章 计数原理解:任选男生和女生各1名,可以分两个步骤完成:第1步,从30名男生中选出1 名,有30种不同选法;第2步,从24名女生中选出1名,有24种不同选法.根据分步 乘法计数原理,共有不同选法的种数为 犖=30×24=720.  如果完成一件事需要三个步骤,做第1步有犿 种不同的方法,做第2步有犿 种 1 2 不同的方法,做第3步有犿 种不同的方法,那么完成这件事共有多少种不同的方法? 3 如果完成一件事需要狀个步骤,做每一步都有若干种不同的方法,那么应当如 何计数呢? 例3 书架的第1层放有4本不同的计算机书,第2层放有3本不同的文艺书,第3 层放有2本不同的体育书. (1)从书架上任取1本书,有多少种不同取法? (2)从书架的第1层、第2层、第3层各取1本书,有多少种不同取法? 分析:(1)要完成的一件事是 “从书架上取1本书”,可以分从第1层、第2层和第 3层中取三类方案;(2)要完成的一件事是 “从书架的第1层、第2层、第3层各取1本 书”,可以分三个步骤完成. 解:(1)从书架上任取1本书,有三类方案:第1类方案是从第1层取1本计算机 书,有4种方法;第2类方案是从第2层取1本文艺书,有3种方法;第3类方案是从第 3层取1本体育书,有2种方法.根据分类加法计数原理,不同取法的种数为 犖=4+3+2=9. (2)从书架的第1层、第2层、第3层各取1本书,可以分三个步骤完成:第1步,从 第1层取1本计算机书,有4种方法;第2步,从第2层取1本文艺书,有3种方法;第3 步,从第3层取1本体育书,有2种方法.根据分步乘法计数原理,不同取法的种数为 犖=4×3×2=24.  1.填空题 (1)一项工作可以用2种方法完成,有5人只会用第1种方法完成,另有4人只会用第2种方法完 成,从中选出1人来完成这项工作,不同选法的种数是 ; (2)从A村去B村的道路有3条,从B村去C村的道路有2条,则从A村经B村去C村,不同路 线的条数是 . 2.在例1中,若数学也是A大学的强项专业,则A大学有6个专业可以选择,B大学有4个专业可以选 择,应用分类加法计数原理,得到这名同学可能的专业选择种数为6+4=10.这种算法有什么问题? 第六章 计数原理 53.书架上层放有6本不同的数学书,下层放有5本不同的语文书. (1)从书架上任取1本书,有多少种不同的取法? (2)从书架上任取数学书和语文书各1本,有多少种不同的取法? 4.现有高一年级的学生3名,高二年级的学生5名,高三年级的学生4名. (1)从三个年级的学生中任选1人参加接待外宾的活动,有多少种不同的选法? (2)从三个年级的学生中各选1人参加接待外宾的活动,有多少种不同的选法? 例4 要从甲、乙、丙3幅不同的画中选出2幅,分别挂在左、右两边墙上的指定位 置,共有多少种不同的挂法? 分析:要完成的一件事是 “从3幅画中选出2幅,并     分别挂在左、右两边墙上”,可以分步完成.   解:从3幅画中选出2幅分别挂在左、右两边墙上,    可以分两个步骤完成:第1步,从3幅画中选1幅挂在左   边墙上,有3种选法;第2步,从剩下的2幅画中选1幅    挂在右边墙上,有2种选法.根据分步乘法计数原理,不   同挂法的种数为    犖=3×2=6. 图6.12 这6种挂法如图6.12所示. 分类加法计数原理和分步乘法计数原理,回答的都是有关做一件事的不同方法种数的 问题.区别在于:分类加法计数原理针对的是 “分类”问题,其中各种方法相互独立,用 其中任何一种方法都可以做完这件事;分步乘法计数原理针对的是 “分步”问题,各个步 骤中的方法互相依存,只有每一个步骤都完成才算做完这件事. 例5 给程序模块命名,需要用3个字符,其中首字符要求用字母A~G或U~Z, 后两个字符要求用数字1~9,最多可以给多少个程序模块命名? 分析:要完成的一件事是 “给一个程序模块命名”,可以分三个步骤完成:第1步, 选首字符;第2步,选中间字符;第3步,选最后一个字符.而首字符又可以分为两类. 解:由分类加法计数原理,首字符不同选法的种数为 7+6=13. 后两个字符从1~9中选,因为数字可以重复,所以不 同选法的种数都为9. 你还能给出不同的解 由分步乘法计数原理,不同名称的个数是 法吗? 13×9×9=1053, 即最多可以给1053个程序模块命名. 6 第六章 计数原理例6 电子元件很容易实现电路的通与断、电位的高与低等两种状态,而这也是最容 易控制的两种状态.因此计算机内部就采用了每一位只有0或1两种数字的记数法,即二 进制.为了使计算机能够识别字符,需要对字符进行编码,每个字符可以用1个或多个字 节来表示,其中字节是计算机中数据存储的最小计量单位,每个字节由8个二进制位构成. (1)1个字节 (8位)最多可以表示多少个不同的字符? (2)计算机汉字国标码包含了6763个汉字,一个汉字为一个字符,要对这些汉字进 行编码,每个汉字至少要用多少个字节表示? 分析:(1)要完成的一件事是 “确定1个字节各二进制位上的数字”.由于每个字节 有8个二进制位,每一位上的数字都有0,1两种选择,而且不同的顺序代表不同的字符, 因此可以用分步乘法计数原理求解;(2)只要计算出多少个字节所能表示的不同字符不少 于6763个即可. 解:(1)用图6.13表示1个字节,每一格代表一位.         图6.13 1个字节共有8位,每位上有2种选择.根据分步乘法计数原理,1个字节最多可以 表示不同字符的个数是 2×2×2×2×2×2×2×2=28=256. (2)由 (1)知,1个字节所能表示的不同字符不够6763个,我们考虑2个字节能够 表示多少个字符.前1个字节有256种不同的表示方法,后1个字节也有256种表示方法. 根据分步乘法计数原理,2个字节可以表示不同字符的个数是 256×256=65536. 这已经大于汉字国标码包含的汉字个数6763.因此要对这些汉字进行编码,每个汉字至 少要用2个字节表示.  1.某电话局管辖范围内的电话号码由8位数字组成,其中前4位的数字是不变的,后4位数字都是0~ 9中的一个数字,这个电话局不同的电话号码最多有多少个? 2.从5名同学中选出正、副组长各1名,有多少种不同的选法? 3.从1,2,…,19,20中任选一个数作被减数,再从1,2,…,10中任选一个数作减数,然后写成 一个减法算式,共可得到多少个不同的算式? 4.在1,2,…,500中,被5除余2的数共有多少个? 5.由数字1,2,3,4,5可以组成多少个三位数 (各位上的数字可以重复)? 第六章 计数原理 7例7 计算机编程人员在编写好程序以后需要对程序进行测试.程序员需要知道到底 有多少条执行路径 (程序从开始到结束的路线),以便知道需要提供多少个测试数据.一 般地,一个程序模块由许多子模块组成.图6.14是一个具有许多执行路径的程序模块, 它有多少条执行路径? 另外,为了减少测试时间,程序员需要设法减少测试次数.你能帮助程序员设计一个 测试方法,以减少测试次数吗?              A          图6.14 分析:整个模块的任意一条执行路径都分两步完成:第1步是从开始执行到A点; 第2步是从A点执行到结束.而第1步可由子模块1、子模块2、子模块3中任何一个来 完成;第2步可由子模块4、子模块5中任何一个来完成.因此,分析一条指令在整个模 块的执行路径需要用到两个计数原理. 解:由分类加法计数原理,子模块1、子模块2、子模块3中的子路径条数共为 18+45+28=91; 子模块4、子模块5中的子路径条数共为 38+43=81. 又由分步乘法计数原理,整个模块的执行路径条数共为 91×81=7371. 在实际测试中,程序员总是把每一个子模块看成一个黑箱,即通过只考察是否执行了 正确的子模块的方式来测试整个模块.这样,他可以先分别单独测试5个模块,以考察每 个子模块的工作是否正常.总共需要的测试次数为 18+45+28+38+43=172. 再测试各个模块之间的信息交流是否正常,只需要测试程序第1步中的各个子模块和 第2步中的各个子模块之间的信息交流是否正常,需要的测试次数为 3×2=6. 8 第六章 计数原理如果每个子模块都工作正常,并且各个子模块之间的信 息交流也正常,那么整个程序模块就工作正常.这样,测试 整个模块的次数就变为 你看出了程序员是如 何实现减少测试次数的吗? 172+6=178. 显然,178与7371的差距是非常大的. 例8 通常,我国民用汽车号牌的编号由两部分组成:第一部分为用汉字表示的省、 自治区、直辖市简称和用英文字母表示的发牌机关代号,第二部分为由阿拉伯数字和英文 字母组成的序号,如图6.15所示. 对于省和自治区,发 牌机关通常是指其地级市的 公共交通管理部门,并用英 文字母依次编码.例如,河    北省石家庄市、唐山市的发  牌机关代号分别为A,B.   直辖市的发牌机关代号可备 图6.15 案后依次自行使用. 其中,序号的编码规则为: (1)由10个阿拉伯数字和除O,I之外的24个英文字母组成; (2)最多只能有2个英文字母. 如果某地级市发牌机关采用5位序号编码,那么这个发牌机关最多能发放多少张汽车 号牌? 分析:由号牌编号的组成可知,序号的个数决定了这个发牌机关所能发放的最多号牌 数.按序号编码规则可知,每个序号中的数字、字母都是可重复的,并且可将序号分为三 类:没有字母,有1个字母,有2个字母.以字母所在位置为分类标准,可将有1个字母 的序号分为五个子类,将有2个字母的序号分为十个子类. 解:由号牌编号的组成可知,这个发牌机关所能发放的最多号牌数就是序号的个数. 根据序号编码规则,5位序号可以分为三类:没有字母,有1个字母,有2个字母. (1)当没有字母时,序号的每一位都是数字.确定一个序号可以分5个步骤,每一步 都可以从10个数字中选1个,各有10种选法.根据分步乘法计数原理,这类号牌张数为 10×10×10×10×10=100000. (2)当有1个字母时,这个字母可以分别在序号的第1位、第2位、第3位、第4位 或第5位,这类序号可以分为五个子类. 当第1位是字母时,分5个步骤确定一个序号中的字母和数字:第1步,从24个字 第六章 计数原理 9母中选1个放在第1位,有24种选法;第2~5步都是从10个数字中选1个放在相应的 位置,各有10种选法.根据分步乘法计数原理,号牌张数为 24×10×10×10×10=240000. 同样,其余四个子类号牌也各有240000张. 根据分类加法计数原理,这类号牌张数一共为 240000+240000+240000+240000+240000=1200000. (3)当有2个字母时,根据这2个字母在序号中的位置,可以将这类序号分为十个子 类:第1位和第2位,第1位和第3位,第1位和第4位,第1位和第5位,第2位和第 3位,第2位和第4位,第2位和第5位,第3位和第4位,第3位和第5位,第4位和 第5位. 当第1位和第2位是字母时,分5个步骤确定一个序号中的字母和数字:第1,2步 都是从24个字母中选1个分别放在第1位、第2位,各有24种选法;第3~5步都是从 10个数字中选1个放在相应的位置,各有10种选法.根据分步乘法计数原理,号牌张 数为 24×24×10×10×10=576000. 同样,其余九个子类号牌也各有576000张. 于是,这类号牌张数一共为 576000×10=5760000. 综合 (1)(2)(3),根据分类加法计数原理,这个发牌机关最多能发放的汽车号牌张 数为 100000+1200000+5760000=7060000.  用两个计数原理解决计数问题时,最重要的是在开始计算之前要仔细分析两点: (1)要完成的 “一件事”是什么;(2)需要分类还是需要分步. 分类要做到 “不重不漏”.分类后再分别对每一类进行计数,最后用分类加法计 数原理求和,得到总数. 分步要做到 “步骤完整”,即完成了所有步骤,才能完成任务.分步后再计算每一步 的方法数,最后根据分步乘法计数原理,把完成每一步的方法数相乘,得到总数.  乘法运算是特定条件下加法运算的简化,分步乘法计数原理和分类加法计数原理 也有这种类似的关系吗? 10 第六章 计数原理 1.乘积 (犪+犪+犪)(犫+犫+犫)(犮+犮+犮+犮+犮)展开后共有多少项? 1 2 3 1 2 3 1 2 3 4 5 2.在所有的两位数中,个位数字小于十位数字的有多少个? 3.某商场有6个门,如果某人从其中的任意一个门进入商场,并且要求从其他的门出去,那么共有多 少种不同的进出商场的方式? 4.任意画一条直线,在直线上任取狀个分点. (1)从这狀个分点中任取2个点形成一条线段,可得到多少条线段? (2)从这狀个分点中任取2个点形成两条有向线段,可得到多少条有向线段? 习题6.1  1.一个商店销售某种型号的电视机,其中本地的产品有4种,外地的产品有7种.要买1台这种 型号的电视机,有多少种不同的选法? 2.如图,从甲地到乙地有2条路,从乙地到丁地有3条路;从甲地到丙地有4条路,从丙地到丁 地有2条路.从甲地到丁地共有多少条不同的路线?   A B   (第2题) (第3题) 3.如图,要让电路从犃处到犅处只有一条支路接通,可有多少条不同的路径? 4.用1,5,9,13中的任意一个数作分子,4,8,12,16中任意一个数作分母,可构成多少个不 同的分数?可构成多少个不同的真分数? 5.一个口袋内装有5个小球,另一个口袋内装有6个小球,所有这些小球的颜色互不相同.从两 个袋子中分别取1个球,共有多少种不同的取法? 6. (1)在平面直角坐标系内,横坐标与纵坐标均在犃={0,1,2,3,4,5}内取值的不同点共有 多少个? (2)在平面直角坐标系内,斜率在集合犅={1,3,5,7}内取值,狔轴上的截距在集合犆= {2,4,6,8}内取值的不同直线共有多少条? 第六章 计数原理 11 7.一种密码锁有4个拨号盘,每个拨号盘上有0~9共10个数字.现最后一个拨号盘出现了故 障,只能在0~5这6个数字中拨号,这4个拨号盘可组成多少个四位数字号码? 8. (1)4名同学分别报名参加学校的足球队、篮球队、乒乓球队,每人限报其中的一个运动队, 不同报法的种数是34 还是43 ? (2)3个班分别从5个景点中选择一处游览,不同选法的种数是35 还是53 ? 9. (1)从5件不同的礼物中选出4件送给4位同学,每人一件,有多少种不同的送法? (2)有5个编了号的抽屉,要放进3本不同的书,不同的放法有多少种?(一个抽屉可放多本书.) 10.口袋中装有8个白球和10个红球,每个球编有不同的号码,现从中取出2个球. (1)恰好是白球、红球各一个的取法有多少种? (2)恰好是两个白球的取法有多少种? (3)至少有一个白球的取法有多少种? (4)两球的颜色相同的取法有多少种?   11.在国庆长假期间,要从7人中选若干人在7天假期值班 (每天只需1人值班),不出现同一人 连续值班2天,有多少种可能的安排方法? 12.2160有多少个不同的正因数?  子集的个数有多少 问题 狀元集合犃={犪,犪,…,犪}的子集有多少个? 1 2 狀 为了解决这个问题,一个可行的思路是先研究一下某些具体集合,如犛= {犪,犪,犪}的子集个数,从中获得启发,然后对一般的情况进行研究. 1 2 3 由于犛中的元素只有3个,因此可以用列举 法列出它的所有子集: ,{犪}, {犪}, {犪}, {犪,犪}, {犪, 1 2 3 1 2 1 虽然列举法较 “笨”,但 犪},{犪,犪},犛. 3 2 3 它是计数的基本方法.请你列 可见,一个含有3个元素的集合共有8个子集. 举一下4元集合 {犪,犪, 1 2 如果一个集合所含元素较少,可以用列举法 犪,犪}、5元集合 {犪,犪, 3 4 1 2 确定其子集的个数.但如果集合中的元素较多, 犪,犪,犪}的子集. 3 4 5 用这种方法确定子集个数就不太方便了.另外, 12 第六章 计数原理从上述描述中较难发现集合犛中所含元素的个数3与其子集个数8之间的关系. 为了发现规律,需要采取另外的方法.一个自然的想法是,应当设法用两个 计数原理. 显然,元素犪(犻=1,2,3)与各子集的关系只有两种:犪属于子集或犪不 犻 犻 犻 属于子集.这样,我们可以考虑用考察犛中的每一个元素属不属于某个子集的方 法来得到一个子集.因为犛中有3个元素,所以要得到集合犛的一个子集犛,可 1 以分三个步骤: 第1步,考察元素犪 是否在犛 中,有2种可能 (犪∈犛,犪犛); 1 1 1 1 1 1 第2步,考察元素犪 是否在犛 中,有2种可能 (犪∈犛,犪犛); 2 1 2 1 2 1 第3步,考察元素犪 是否在犛 中,有2种可能 (犪∈犛,犪犛). 3 1 3 1 3 1 只要完成上述三个步骤,那么集合犛 中元素 1 就完全确定了.根据分步乘法计数原理,对于由3 由此,你是否对把空 个元素组成的集合,子集的个数为 集及原集合自身作为子集 2×2×2=23=8. 的规定有进一步的理解? 从上述过程,可以看到集合犛中所含元素的 个数3与其子集个数8之间的关系:3是23 中的 指数,而8是23 的运算结果. 一般地,我们有: 狀元集合犃={犪,犪,…,犪}的不同子集有2狀 个. 1 2 狀 证明:要得到集合犃的一个子集犛,可以分狀个步骤: 1 第1步,考察元素犪 是否在犛 中,有2种可能 (犪∈犛,犪犛); 1 1 1 1 1 1 第2步,考察元素犪 是否在犛 中,有2种可能 (犪∈犛,犪犛); 2 1 2 1 2 1 …… 第犽步,考察元素犪是否在犛 中,有2种可能 (犪∈犛,犪犛); 犽 1 犽 1 犽 1 …… 第狀步,考察元素犪是否在犛 中,有2种可能 (犪∈犛,犪犛). 狀 1 狀 1 狀 1 只要完成上述狀个步骤,那么集合犛 中元素就完全确定了.根据分步乘法 1 计数原理,对于由狀个元素组成的集合,子集的个数为 2×2×…×2=2狀. 烏 烐 烑 狀个2 你还能用另外的方法证明上述结论吗? 第六章 计数原理 1362 排列与组合 在上节例8的解答中我们看到,用分步乘法计数原理解决 问题时,因做了一些重复性工作而显得烦琐.能否对这类计数 问题给出一种简捷的方法呢?为此,先来分析两个具体的问题. 621 ! "# 问题1 从甲、乙、丙3名同学中选出2名参加一项活动,其中1名同学参加上午的 活动,另1名同学参加下午的活动,有几种不同的选法? 此时,要完成的一件事是 “选出2名同学参加活动,1名同学参加上午的活动,另 1名同学参加下午的活动”,可以分两个步骤: 第1步,确定参加上午活动的同学,从3人中任选     1人,有3种选法;    第2步,确定参加下午活动的同学,当参加上午活   动的同学确定后,参加下午活动的同学只能从剩下的2    人中去选,有2种选法.   根据分步乘法计数原理,不同的选法种数为    3×2=6.   这6种不同的选法如图6.21所示. 图6.21 如果把上面问题中被取出的对象叫做元素,那么问题可叙述为: 从3个不同的元素犪,犫,犮中任意取出2个,并按 一定的顺序排成一列,共有多少种不同的排列方法? 所有不同的排列是 问题1中的 “顺序” 犪犫,犪犮,犫犪,犫犮,犮犪,犮犫, 是什么? 不同的排列方法种数为 3×2=6. 问题2 从1,2,3,4这4个数字中,每次取出3个排成一个三位数,共可得到多 少个不同的三位数? 显然,从4个数字中,每次取出3个,按 “百位、十位、个位”的顺序排成一列,就 得到一个三位数.因此有多少种不同的排列方法就有多少个不同的三位数.可以分三个步 14 第六章 计数原理骤来解决这个问题: 第1步,确定百位上的数字,从1,2,3,4这4个数字中任取1个,有4种方法; 第2步,确定十位上的数字,当百位上的数字确定后,十位上的数字只能从余下的3 个数字中去取,有3种方法; 第3步,确定个位上的数字,当百位、十位上的数字确定后,个位的数字只能从余下 的2个数字中去取,有2种方法. 根据分步乘法计数原理,从1,2,3,4这4个不同的数字中,每次取出3个数字, 按 “百位、十位、个位”的顺序排成一列,不同的排法种数为 4×3×2=24. 因而共可得到24个不同的三位数,如图6.22所示.  1 2 3 4  2 3 4 1 3 4 1 2 4 1 2 3  3 4 2 4 2 3 3 4 1 4 1 3 2 4 1 4 1 2 2 3 1 3 1 2 图6.22 由此可写出所有的三位数: 123,124,132,134,142,143, 213,214,231,234,241,243, 312,314,321,324,341,342, 412,413,421,423,431,432. 同样,问题2可以归结为: 从4个不同的元素犪,犫,犮,犱中任意取出3个,并按照一定的顺序排成一列,共有 多少种不同的排列方法? 所有不同的排列是 犪犫犮,犪犫犱,犪犮犫,犪犮犱,犪犱犫,犪犱犮, 犫犪犮,犫犪犱,犫犮犪,犫犮犱,犫犱犪,犫犱犮, 问题2中的 “顺序” 犮犪犫,犮犪犱,犮犫犪,犮犫犱,犮犱犪,犮犱犫, 是什么? 犱犪犫,犱犪犮,犱犫犪,犱犫犮,犱犮犪,犱犮犫. 不同的排列方法种数为 4×3×2=24.  上述问题1,2的共同特点是什么?你能将它们推广到一般情形吗? 问题1和问题2都是研究从一些不同元素中取出部分元素,并按照一定的顺序排成一 列的方法数. 第六章 计数原理 15一般地,从狀个不同元素中取出犿(犿≤狀)个元素,并按照一定的顺序排成一列,叫 做从狀个不同元素中取出犿个元素的一个排列 (arrangement). 根据排列的定义,两个排列相同的充要条件是:两个排列的元素完全相同,且元素的 排列顺序也相同.例如,在问题1中,“甲乙”与 “甲丙”的元素不完全相同,它们是不 同的排列;“甲乙”与 “乙甲”虽然元素完全相同,但元素的排列顺序不同,它们也是不 同的排列.又如,在问题2中,123与134的元素不完全相同,它们是不同的排列;123 与132虽然元素完全相同,但元素的排列顺序不同,它们也是不同的排列. 例1 某省中学生足球赛预选赛每组有6支队,每支队都要与同组的其他各队在主、 客场分别比赛1场,那么每组共进行多少场比赛? 分析:每组任意2支队之间进行的1场比赛,可以看作是从该组6支队中选取2支, 按 “主队、客队”的顺序排成的一个排列. 解:可以先从这6支队中选1支为主队,然后从剩下的5支队中选1支为客队.按分 步乘法计数原理,每组进行的比赛场数为 6×5=30. 例2 (1)一张餐桌上有5盘不同的菜,甲、乙、丙3名同学每人从中各取1盘菜, 共有多少种不同的取法? (2)学校食堂的一个窗口共卖5种菜,甲、乙、丙3名同学每人从中选一种,共有多 少种不同的选法? 分析:3名同学每人从5盘不同的菜中取1盘菜,可看作是从这5盘菜中任取3盘, 放在3个位置 (给3名同学)的一个排列;而3名同学每人从食堂窗口的5种菜中选1 种,每人都有5种选法,不能看成一个排列. 解:(1)可以先从这5盘菜中取1盘给同学甲,然后从剩下的4盘菜中取1盘给同学 乙,最后从剩下的3盘菜中取1盘给同学丙.按分步乘法计数原理,不同的取法种数为 5×4×3=60. (2)可以先让同学甲从5种菜中选1种,有5种选法;再让同学乙从5种菜中选1 种,也有5种选法;最后让同学丙从5种菜中选1种,同样有5种选法.按分步乘法计数 原理,不同的选法种数为 5×5×5=125.  1.写出: (1)用0~4这5个自然数组成的没有重复数字的全部两位数; (2)从犪,犫,犮,犱中取出2个字母的所有排列. 16 第六章 计数原理2.一位老师要给4个班轮流做讲座,每个班讲1场,有多少种轮流次序? 3.学校乒乓团体比赛采用5场3胜制 (5场单打),每支球队派3名运动员参赛,前3场比赛每名运动 员各出场1次,其中第1,2位出场的运动员在后2场比赛中还将各出场1次. (1)从5名运动员中选3名参加比赛,前3场比赛有几种出场情况? (2)甲、乙、丙3名运动员参加比赛,写出所有可能的出场情况. 622 ! "#$ 前面给出了排列的定义,下面探究计算排列个数的 公式. 符号A犿 中的A是英 我们把从狀个不同元素中取出犿(犿≤狀)个元素的所有 狀 文 arrangement (排 列) 不同排列的个数,叫做从狀个不同元素中取出犿个元素的 的第一个字母. 排列数,用符号A犿 表示. 狀 例如,前面问题1是求从3个不同元素中取出2个元素的排列数,表示为A2.已经算得 3 A2=3×2=6. 3 问题2是求从4个不同元素中取出3个元素的排列数,表示为A3.已经算得 4 A3=4×3×2=24. 4  从狀个不同元素中取出犿个元素的排列数A犿 (犿≤狀)是多少? 狀 可以先从特殊情况开始探究,例如求排列数 A2.根据前面的求解经验,可以这样 狀 考虑: 假定有排好顺序的两个空位,如图6.23所示,从狀个   不同元素中取出2个元素去填空,一个空位填上一个元素, 每一种填法就得到一个排列;反之,任何一种排列总可以由 这种填法得到.因此,所有不同填法的种数就是排列数A2. n (n-1) 狀 现在来计算有多少种填法.完成 “填空”这件事可以分 图6.23 为两个步骤完成: 第1步,填第1个位置的元素,可以从这狀个不同元素中任选1个,有狀种选法; 第2步,填第2个位置的元素,可以从剩下的 (狀-1)个元素中任选1个,有 (狀-1) 种选法. 根据分步乘法计数原理,2个空位的填法种数为 A2=狀(狀-1). 狀 第六章 计数原理 17同理,求排列数A3 可以按依次填3个空位来考虑,有 狀 A3=狀(狀-1)(狀-2). 狀 一般地,求排列数A犿 可以按依次填犿个空位来考虑: 狀 假定有排好顺序的犿个空位,如图6.24所示,从狀个不同元素中取出犿个元素去 填空,一个空位填上一个元素,每一种填法就对应一个排列.因此,所有不同填法的种数 就是排列数A犿. 狀    m n (n-1) (n-2) (n-m+1) 图6.24 填空可以分为犿个步骤完成: 第1步,从狀个不同元素中任选1个填在第1位,有狀种选法; 第2步,从剩下的 (狀-1)个元素中任选1个填在第2位,有 (狀-1)种选法; 第3步,从剩下的 (狀-2)个元素中任选1个填在第3位,有 (狀-2)种选法; …… 第犿步,从剩下的 [狀-(犿-1)]个元素中任选1个填在第犿位,有 (狀-犿+1)种选法. 根据分步乘法计数原理,犿个空位的填法种数为 狀(狀-1)(狀-2)…(狀-犿+1). 这样,我们就得到公式 你能说一下排列数公 A犿=狀(狀-1)(狀-2)…(狀-犿+1). 狀 式的特点吗? 这里,犿,狀∈犖  ,并且犿≤狀.这个公式叫做排列数公式. 根据排列数公式,我们就能方便地计算出从狀个不同元素中取出犿(犿≤狀)个元素的 所有排列的个数.例如, A2=5×4=20, 5 A3=8×7×6=336. 8 特别地,我们把狀个不同的元素全部取出的一个排列,叫做狀个元素的一个全排列. 这时,排列数公式中犿=狀,即有 A狀=狀×(狀-1)×(狀-2)×…×3×2×1. 狀 也就是说,将狀个不同的元素全部取出的排列数,等于正整数1到狀的连乘积.正整数1 到狀的连乘积,叫做狀的阶乘,用狀!表示.于是,狀个元素的全排列数公式可以写成 A狀=狀!. 狀 另外,我们规定,0!=1. 18 第六章 计数原理A7 例3 计算:(1)A3 ; (2)A4 ; (3) 7; (4)A4×A2. 7 7 A4 6 2 4 解:根据排列数公式,可得 (1)A3=7×6×5=210; 7 (2)A4=7×6×5×4=840; 7 A7 7! (3) 7= =7×6×5=210; A4 4! 4 (4)A4×A2=6×5×4×3×2×1=6!=720. 6 2  A7 7! A6 6! 由例3可以看到,A3 7 = A4 7= 4! ;A4 6 ×A2 2 =6!=A6 6 ,即A4 6 = A2 6= 2! .观察这两 4 2 个结果,从中你发现它们的共性了吗? 事实上, A犿=狀(狀-1)(狀-2)…(狀-犿+1) 狀 狀×(狀-1)×(狀-2)×…×(狀-犿+1)×(狀-犿)×…×2×1 = (狀-犿)×…×2×1 A狀 = 狀 A狀-犿 狀-犿 狀! = . (狀-犿)! 因此,排列数公式还可以写成 狀! A 狀 犿= (狀-犿)! . 例4 用0~9这10个数字,可以组成多少个没有重复数字的三位数? 分析:在0~9这10个数字中,因为0不能在百位上,而其他9个数字可以在任意数 位上,因此0是一个特殊的元素.一般地,我们可以从特殊元素的位置入手来考虑问题. 解法1:如图6.25所示,由于三位数的百位上的数字不能是    0,所以可以分两步完成:第1步,确定百位上的数字,可以从 1~9这9个数字中取出1个,有A1 种取法;第2步,确定十位和 9 个位上的数字,可以从剩下的9个数字中取出2个,有A2 种取法. A1 9  A2 9  9 图6.25 根据分步乘法计数原理,所求的三位数的个数为 A1×A2=9×9×8=648. 9 9 第六章 计数原理 19解法2:如图6.26所示,符合条件的三位数可以分成三类:第1类,每一位数字都 不是0的三位数,可以从1~9这9个数字中取出3个,有A3 种取法;第2类,个位上的 9 数字是0的三位数,可以从剩下的9个数字中取出2个放在百位和十位,有A2 种取法; 9 第3类,十位上的数字是0的三位数,可以从剩下的9个数字中取出2个放在百位和个 位,有A2 种取法. 9          0 0 A3 A2 A2 9 9 9 图6.26 根据分类加法计数原理,所求三位数的个数为 A3+A2+A2=9×8×7+9×8+9×8=648. 9 9 9 解法3:从0~9这10个数字中选取3个的排列数为A3 ,其中0在百位上的排列数 10 为A2 ,它们的差就是用这10个数组成的没有重复数字的三位数的个数,即所求三位数的 9 个数为 A3 -A2=10×9×8-9×8=648. 10 9 对于例4这类计数问题,从不同的角度就有不同的解题方法.解法1根据百位数字不 能是0的要求,按分步乘法计数原理完成从10个数中取出3个数组成没有重复数字的三 位数这件事;解法2是以0是否出现以及出现的位置为标准,按分类加法计数原理完成这 件事;解法3是一种间接法,先求出从10个数中取出3个数的排列数,然后减去其中百 位是0的排列数 (不是三位数的个数),就得到没有重复数字的三位数的个数. 从上述问题的解答过程可以看到,引入排列的概念,归纳出排列数公式,我们就能便 捷地求解 “从狀个不同元素中取出犿(犿≤狀)个元素的所有排列的个数”这类特殊的计数 问题.  1.先计算,然后用计算工具检验: A7 (1)A4; (2)A8; (3)A5-15A4; (4) 12. 12 8 15 14 A6 12 2.求证: (1)A犿=狀A犿-1; (2)A8-8A7+7A6=A7. 狀 狀-1 8 7 6 7 3.一个火车站有8股岔道,如果每股道只能停放1列火车,现要停放4列不同的火车,共有多少种不 同的停放方法? 20 第六章 计数原理623 ! %&  从甲、乙、丙3名同学中选2名去参加一项活动,有多少种不同的选法?这一问 题与6.2.1节的问题1有什么联系与区别? 在6.2.1节问题1的6种选法中,存在 “甲上午、乙下午”和 “乙上午、甲下午”2 种不同顺序的选法,我们可以将它看成是先选出甲、乙2名同学,然后再分配上午和下午 而得到的.同样,先选出甲、丙或乙、丙,再分配上午和下午也都各有2种方法.而从 甲、乙、丙3名同学中选2名去参加一项活动,就只需考虑将选出的2名同学作为一组, 不需要考虑他们的顺序.于是,在6.2.1节问题1的6种选法中,将选出的2名同学作为 一组的选法就只有如下3种情况: 甲乙,甲丙,乙丙. 将具体背景舍去,上述问题可以概括为: 从3个不同元素中取出2个元素作为一组,一共有多少个不同的组? 这就是我们要研究的问题. 一般地,从狀个不同元素中取出犿(犿≤狀)个元素作为一组,叫做从狀个不同元素中 取出犿个元素的一个组合 (combination).  你能说一说排列与组合之间的联系与区别吗? 从排列与组合的定义可以知道,两者都是从狀个不同元素中取出犿(犿≤狀)个元素, 这是它们的共同点.但排列与元素的顺序有关,而组合与元素的顺序无关.只有元素相同 且顺序也相同的两个排列才是相同的;而两个组合只要元素相同,不论元素的顺序如何, 都是相同的.例如,在上述探究问题中,“甲乙”与 “乙甲”的元素完全相同,但元素的 排列顺序不同,因此它们是相同的组合,不同的排列.这样,以 “元素相同”为标准分 类,就可以建立起排列和组合之间的对应关系,如图6.27所示.            图6.27 第六章 计数原理 21由此,6.2.1节问题1的6个排列可以分成每组有2个不同排列的3个组,也就是上 面探究问题的3个组合.  校门口停放着9辆共享自行车,下面的问题是排列问题,还是组合问题? (1)从中选3辆,有多少种不同的方法? (2)从中选3辆给3位同学,有多少种不同的方法? 例5 平面内有犃,犅,犆,犇共4个点. (1)以其中2个点为端点的有向线段共有多少条? (2)以其中2个点为端点的线段共有多少条? 分析:(1)确定一条有向线段,不仅要确定两个端点,还要考虑它们的顺序,是排列 问题;(2)确定一条线段,只需确定两个端点,而不需考虑它们的顺序,是组合问题. 解:(1)一条有向线段的两个端点要分起点和终点,以平面内4个点中的2个为端点 的有向线段的条数,就是从4个不同元素中取出2个元素的排列数,即有向线段条数为 A2=4×3=12. 4 这12条有向线段分别为 → → → → → → → → → → → → 犃犅,犅犃,犃犆,犆犃,犃犇,犇犃,犅犆,犆犅,犅犇,犇犅,犆犇,犇犆. (2)由于不考虑两个端点的顺序,因此将 (1)中端点相同、方向不同的2条有向线 段作为一条线段,就是以平面内4个点中的2个点为端点的线段的条数,共有如下6条: 犃犅,犃犆,犃犇,犅犆,犅犇,犆犇.  利用排列和组合之间的关系,以 “元素相同”为标准分类,你能建立起例5 (1) 中排列和 (2)中组合之间的对应关系吗?进一步地,能否从这种对应关系出发,由 排列数求出组合的个数?  1.甲、乙、丙、丁4支足球队举行单循环赛. (1)列出所有各场比赛的双方; (2)列出所有冠、亚军的可能情况. 2.已知平面内犃,犅,犆,犇这4个点中任何3个点都不在一条直线上,写出以其中任意3个点为顶点 的所有三角形. 22 第六章 计数原理3.现有1,3,7,13这4个数. (1)从这4个数中任取2个相加,可以得到多少个不相等的和? (2)从这4个数中任取2个相减,可以得到多少个不相等的差? 624 ! %&$ 类比排列数,我们引进组合数概念: 从狀个不同元素中取出犿(犿≤狀)个元素的所有不同组 符号C犿 中的C是英 合的个数,叫做从狀个不同元素中取出犿个元素的组合数, 狀 文combination(组合)的 用符号C犿 表示. 第一个字母.组合数还可 狀 ( ) 例如,从3个不同元素中取出2个元素的组合数表示为 狀 以用符号 表示. 犿 C2 ,从4个不同元素中取出3个元素的组合数表示为C3. 3 4  前面已经提到,组合和排列有关系,我们能否利用这种关系,由排列数A犿 来求 狀 组合数C犿 呢? 狀 前面,我们利用 “元素相同、顺序不同的两个组合相同”“元素相同、顺序不同的两 个排列不同”,以 “元素相同”为标准,建立了排列和组合之间的对应关系,并求得了从 3个不同元素中取出2个元素的组合数 C2=3. 3 运用同样的方法,我们来求从4个不同元素中取出3个元素的组合数C3.设这4个元 4 素为犪,犫,犮,犱,那么从中取出3个元素的排列数A3=24,以 “元素相同”为标准将这 4 24个排列分组,一共有4组,如图6.28所示,因此组合数C3=4. 4   a b c b a c c a b a b c a c b b c a c b a a b d b a d d a b a b d a d b b d a d b a a c d c a d d a c a c d a d c c d a d c a b c d c b d d b c b c d b d c c d b d c b 图6.28 观察图6.28,也可以这样理解求 “从4个元素中取出3个元素的排列数A3 ”: 4 第1步,从4个元素中取出3个元素作为一组,共有C3 种不同的取法; 4 第2步,将取出的3个元素作全排列,共有A3 种不同的排法. 3 第六章 计数原理 23于是,根据分步乘法计数原理,有 A3=C3 ·A3 , 4 4 3 即 A3 C3= 4=4. 4 A3 3 同样地,求 “从狀个元素中取出犿个元素的排列数A犿 ”,可以看作由以下两个步骤得到: 狀 第1步,从狀个不同元素中取出犿个元素作为一组,共有C犿 种不同的取法; 狀 第2步,将取出的犿个元素作全排列,共有A犿 种不同的排法. 犿 根据分步乘法计数原理,有 A犿=C犿 ·A犿. 狀 狀 犿 因此, A犿 狀(狀-1)(狀-2)…(狀-犿+1) C 狀 犿= A 狀 犿 = 犿! . 犿 这里狀,犿∈犖  ,并且犿≤狀.这个公式叫做组合数公式. 因为 狀! A 狀 犿= (狀-犿)! , 所以,上面的组合数公式还可以写成 狀! C 狀 犿= 犿!(狀-犿)! . 另外,我们规定C0=1. 狀 例6 计算:(1)C3 ; (2)C7 ; (3)C10 ; (4)C0 . 10 10 10 10 解:根据组合数公式,可得 A3 10×9×8 (1)C3 10 = A 1 3 0= 3! =120; 3 10! 10×9×8×7! 10×9×8 (2)C7 10 = 7!(10-7)! = 7!×3! = 3! =120; A10 10! (3)C1 1 0 0 = A1 1 0 0= 10! =1; 10 (4)C0 =1. 10  观察例6的 (1)与 (2),(3)与 (4)的结果,你有什么发现?(1)与 (2)分 别用了不同形式的组合数公式,你对公式的选择有什么想法? 24 第六章 计数原理例7 在100件产品中,有98件合格品,2件次品.从这100件产品中任意抽出3件. (1)有多少种不同的抽法? (2)抽出的3件中恰好有1件是次品的抽法有多少种? (3)抽出的3件中至少有1件是次品的抽法有多少种? 分析:(1)从100件产品中任意抽出3件,不需考虑顺序,因此这是一个组合问题; (2)可以先从2件次品中抽出1件,再从98件合格品中抽出2件,因此可以看作是一个 分步完成的组合问题;(3)从100件产品抽出的3件中至少有1件是次品,包括有1件次 品和有2件次品的情况,因此可以看作是一个分类完成的组合问题. 解:(1)所有的不同抽法种数,就是从100件产品中抽出3件的组合数,所以抽法种 数为 A3 100×99×98 C3 100 = A 1 3 00= 3! =161700; 3 (2)从2件次品中抽出1件的抽法有C1 种,从98件合 2 格品中抽出2件的抽法有C2 种,因此抽出的3件中恰好有1 98 件次品的抽法种数为 从2件次品中抽出1 件的抽法数可以是A1 吗? 98×97 2 C1 2 ×C2 98 =2× 2! =9506. (3)方法1 从100件产品抽出的3件中至少有1件是次品,包括有1件次品和有2件 次品两种情况,因此根据分类加法计数原理,抽出的3件中至少有1件是次品的抽法种数为 C1×C2 +C2×C1 =9506+98=9604. 2 98 2 98 方法2 抽出的3件中至少有1件是次品的抽法种数,就是从100件产品中抽出3件 的抽法种数减去3件都是合格品的抽法种数,即 98×97×96 C3 100 -C3 98 =161700- 3! =9604. 当狀和犿取较小数值时,可以通过手算得出A犿 和C犿.当狀和犿取较大数值时,可 狀 狀 以使用信息技术工具,以使计算更快捷和准确.许多信息技术工具都有计算排列数A犿 和 狀 组合数C犿 的内置函数,输入狀和犿的值后,便可以直接得到结果. 狀  1.先计算,然后用计算工具检验: (1)C2; (2)C7; (3)C3-C2; (4)3C3-2C2. 6 9 7 6 8 5 犿+1 2.求证:C犿= C犿+1. 狀 狀+1 狀+1 3.有政治、历史、地理、物理、化学、生物这6门学科的学业水平考试成绩,现要从中选3门考试成绩. 第六章 计数原理 25(1)共有多少种不同的选法? (2)如果物理和化学恰有1门被选,那么共有多少种不同的选法? (3)如果物理和化学至少有1门被选,那么共有多少种不同的选法? 习题6.2  1.先计算,然后用计算工具检验: (1)5A3+4A2; (2)A1+A2+A3+A4. 5 4 4 4 4 4 2.先计算,然后用计算工具检验: (1)C3; (2)C197; (3)C3÷C4; (4)C狀 ·C狀-2. 15 200 6 8 狀+1 狀 3.壹圆、伍圆、拾圆、贰拾圆的人民币各1张,一共可以组成多少种币值? 4.填空题 (1)有3张参观券,要在5人中确定3人去参观,不同方法的种数是 ; (2)要从5件不同的礼物中选出3件分别送3位同学,不同方法的种数是 ; (3)5名工人各自在3天中选择1天休息,不同方法的种数是 ; (4)集合犃有犿个元素,集合犅有狀个元素,从两个集合中各取1个元素,不同方法的种数 是 . 5.一名同学有4本不同的数学书,5本不同的物理书,3本不同的化学书,现要将这些书放在一 个单层的书架上. (1)如果要选其中的6本书放在书架上,那么有多少种不同的放法? (2)如果要将全部的书放在书架上,且不使同类的书分开,那么有多少种不同的放法? 6.(1)空间中有8个点,其中任何4个点不共面,过每3个点作一个平面,可以作多少个平面? (2)空间中有10个点,其中任何4个点不共面,过每4个点为顶点作一个四面体,可以作多 少个四面体? 7.在一次考试的选做题部分,要求在第1题的4个小题中选做3个小题,在第2题的3个小题中 选做2个小题,在第3题的2个小题中选做1个小题,有多少种不同的选法?  8.求证: (狀+1)! 狀! (狀-犽+1)·狀! (1)A狀 狀 + + 1 1 -A 狀 狀=狀2A狀 狀 - - 1 1 ; (2) 犽! - (犽-1)! = 犽! (犽≤狀). 9.学校要安排一场文艺晚会的11个节目的演出顺序.除第1个节目和最后1个节目已确定外,4 个音乐节目要求排在第2,5,7,10的位置,3个舞蹈节目要求排在第3,6,9的位置,2个 曲艺节目要求排在第4,8的位置,有多少种不同的排法? 26 第六章 计数原理10.班上每个小组有12名同学,现要从每个小组选4名同学代表本组与其他小组进行辩论赛. (1)每个小组有多少种选法? (2)如果还要从选出的同学中指定1名作替补,那么每个小组有多少种选法? (3)如果还要将选出的同学分别指定为第一、二、三、四辩手,那么每个小组有多少种选法? 11.一个数阵有犿行狀列,第一行中的狀个数互不相同,其余行都由这狀个数以不同的顺序组 成.如果要使任意两行的顺序都不相同,那么犿的值最大可取多少? 12. (1)从0,2,4,6中任取3个数字,从1,3,5中任取2个数字,一共可以组成多少个没有 重复数字的五位数? (2)由数字0,1,2,3,4,5,6可以组成多少个没有重复数字,并且比5000000大的正整数? 13.从5名男生和4名女生中选出4人去参加一项创新大赛. (1)如果4人中男生女生各选2人,那么有多少种选法? (2)如果男生中的甲和女生中的乙必须在内,那么有多少种选法? (3)如果男生中的甲和女生中的乙至少要有1人在内,那么有多少种选法? (4)如果4人中必须既有男生又有女生,那么有多少种选法? 14.一个宿舍的6名同学被邀请参加一个晚会. (1)如果必须有人去,去几个人自行决定,有多少种不同的去法? (2)如果其中甲和乙两位同学要么都去,要么都不去,有多少种去法? 15.从含有3件次品的100件产品中,任意抽取5件进行检验. (1)抽出的产品都是合格品的抽法有多少种? (2)抽出的产品中恰好有2件是次品的抽法有多少种? (3)抽出的产品中至少有2件是次品的抽法有多少种? (4)抽出的产品中至多有2件是次品的抽法有多少种?   16.根据某个福利彩票方案,每注彩票号码都是从1~37这37个数中选取7个数.如果所选7个 数与开出的7个数一样 (不管排列顺序),彩票即中一等奖. (1)多少注不同号码的彩票可有一个一等奖? 1 (2)如果要将一等奖的中奖机会提高到 以上且不超过  3000000 1  ,可在37个数中取几个数?  2000000 17.如图,现要用5种不同的颜色对某市的4个区县地图进行着色,要  求有公共边的两个地区不能用同一种颜色,共有几种不同的着色 方法? (第17题) 18.移动互联网给人们的沟通交流带来了方便.某种移动社交软件平台,既可供用户彼此添加 “好友”单独交流,又可供多个用户建立一个 “群”(“群里”的人彼此不一定是 “好友”关 系)共同交流.如果某人在平台上发了信息,他的 “好友”都可以看到,但 “群”里的非 “好友” 第六章 计数原理 27 书书书不能看到.现有一个10人的 “群”,其中1人在平台上发了一条信息,“群”里有3人说看到 了,那么这个 “群”里与发信息这人是 “好友”关系的情况可能有多少种? 19.甲、乙、丙、丁、戊共5名同学进行劳动技术比赛,决出第1名到第5名的名次.甲和乙去 询问成绩,回答者对甲说:“很遗憾,你和乙都没有得到冠军.”对乙说:“你当然不会是最差 的.”从这两个回答分析,5人的名次排列可能有多少种不同情况?  组合数的两个性质 在例6中,我们已经发现C3 与C7 ,C0 与C10 都是相同的数.现在再用计算工 10 10 10 10 具计算下列各组组合数的值,还能发现什么?你能解释你的发现吗? C5 与C7 ,C4 与C11 ,C3 与C15. 12 12 15 15 18 18 通过计算不难发现,各组的两个组合数都相等.观察同组的两个组合数,还 可以发现,它们的上标之和等于下标,即 5+7=12,4+11=15,3+15=18. 如何解释上述结果呢? 等式的两边是对同一问题的两个等价解释,这启发我们,如果把C5 解释为 12 “从12名学生中选出5人参加某项活动的选法种数”,那么C7 可以解释为 “从12名 12 学生中留下7人不参加活动的选法种数”.由于留下7人后其余5人就是参加活动 的,所以不参加活动的人员选法种数C7 就等于参加活动的人员选法种数C5 ,即有 12 12 C5 =C7 . 12 12 一般地,从狀个不同元素中取出犿个元素后,必然剩下(狀-犿)个元素,因 此从狀个不同元素中取出犿个元素的组合,与剩下的(狀-犿)个元素的组合一一 对应.这样,从狀个不同元素中取出犿个元素的组合数,等于从这狀个不同元素 中取出(狀-犿)个元素的组合数.于是我们有 性质1 C犿=C狀-犿. 狀 狀 由于C0=1,因此上面的等式在犿=狀时也成立. 狀 在推导性质1时,我们运用了说明组合等式的一个常用而重要的方法,即把 等号两边的不同表达式解释为对同一个组合问题的两个不同的计数方案. 你能根据上述思想方法,利用分类加法计数原理,说明下面的组合数性质吗? 性质2 C犿 =C犿+C犿-1. 狀+1 狀 狀 28 第六章 计数原理63 二项式定理 上一节学习了排列数公式和组合数公式,本节我们用它 们解决一个在数学上有着广泛应用的(犪+犫) 狀 展开的问题. 631 ! ’()*+  我们知道, (犪+犫) 2=犪2+2犪犫+犫2 , (犪+犫) 3=犪3+3犪2犫+3犪犫2+犫3. (1)观察以上展开式,分析其运算过程,你能发现什么规律? (2)根据你发现的规律,你能写出(犪+犫)4 的展开式吗? (3)进一步地,你能写出(犪+犫) 狀 的展开式吗? 我们先来分析(犪+犫)2 的展开过程.根据多项式乘法法则, (犪+犫)2=(犪+犫)(犪+犫) =犪(犪+犫)+犫(犪+犫) =犪×犪+犪×犫+犫×犪+犫×犫 =犪2+2犪犫+犫2. 可以看到,(犪+犫)2 是2个(犪+犫)相乘,只要从一个(犪+犫)中选一项 (犪或犫),再从另一个 (犪+犫)中选一项 (犪或犫),相乘就得到展开式的一项.于是,由分步乘法计数原理,在合并同类 项之前,(犪+犫)2 的展开式共有C1×C1=22 项,而且每一项都是犪2-犽犫犽 (犽=0,1,2)的形式. 2 2 下面我们再来分析一下形如犪2-犽犫犽 的同类项的个数. 当犽=0时,犪2-犽犫犽=犪2 ,这是由2个(犪+犫)中都不选犫得到的.因此,犪2 出现的次 数相当于从2个(犪+犫)中取0个犫(都取犪)的组合数C0 ,即犪2 只有1个. 2 当犽=1时,犪2-犽犫犽=犪犫,这是由1个(犪+犫)中选犪,另1个(犪+犫)中选犫得到的.由 于犫选定后,犪的选法也随之确定,因此,犪犫出现的次数相当于从2个(犪+犫)中取1个犫 的组合数C1 ,即犪犫共有2个. 2 当犽=2时,犪2-犽犫犽=犫2 ,这是由2个(犪+犫)中都选犫得到的.因此,犫2 出现的次数 相当于从2个(犪+犫)中取2个犫的组合数C2 ,即犫2 只有1个. 2 由上述分析可以得到 (犪+犫)2=C0犪2+C1犪犫+C2犫2. 2 2 2 第六章 计数原理 29 仿照上述过程,你能利用计数原理,写出(犪+犫) 3 ,(犪+犫) 4 的展开式吗? 从上述对具体问题的分析得到启发,对于任意正整数狀,我们有如下猜想: (犪+犫) 狀=C0犪狀+C1犪狀-1犫1+…+C犽犪狀-犽犫犽+…+C狀犫狀 ,狀∈犖  . (1) 狀 狀 狀 狀 下面我们对上述猜想的正确性予以说明. 由于 (犪+犫) 狀 是狀个 (犪+犫)相乘,每个 (犪+犫)在相乘时有两种选择,选犪或犫, 而且每个 (犪+犫)中的犪或犫都选定后,将它们相乘才能得到展开式的一项.因此,由分 步乘法计数原理可知,在合并同类项之前,(犪+犫) 狀 的展开式共有2狀 项,其中每一项都是 犪狀-犽犫犽 (犽=0,1,…,狀)的形式. 对于每个犽(犽=0,1,2,…,狀),对应的项犪狀-犽犫犽 是由 (狀-犽)个 (犪+犫)中选 犪,另外犽个 (犪+犫)中选犫得到的.由于犫选定后,犪的选法也随之确定,因此,犪狀-犽犫犽 出现的次数相当于从狀个 (犪+犫)中取犽个犫的组合数C犽.这样,(犪+犫) 狀 的展开式中, 狀 犪狀-犽犫犽 共有C犽 个,将它们合并同类项,就可以得到上述二项展开式. 狀 公式 (1)叫做二项式定理 (binomialtheorem),右边的多项式叫做(犪+犫) 狀 的二项 展开式,其中各项的系数C犽 (犽=0,1,2,…,狀)叫做二项式系数.式中的C犽犪狀-犽犫犽 叫 狀 狀 做二项展开式的通项,用犜 表示,即通项为展开式的第犽+1项: 犽+1 犜 =C犽犪狀-犽犫犽. 犽+1 狀 在二项式定理中,若设犪=1,犫=狓,则得到公式: (1+狓) 狀=C0+C1狓+C2狓2+…+C犽狓犽+…+C狀狓狀. 狀 狀 狀 狀 狀 ( 1) 例1 求狓+ 6的展开式. 狓 解:根据二项式定理, ( 1) 狓+ 6=(狓+狓-1)6 狓 =C0狓6+C1狓5狓-1+C2狓4狓-2+C3狓3狓-3+C4狓2狓-4+C5狓1狓-5+C6狓-6 6 6 6 6 6 6 6 =狓6+6狓4+15狓2+20+15狓-2+6狓-4+狓-6. 例2 (1)求(1+2狓)7 的展开式的第4项的系数; (1+2狓)7 的展开式的 第4项的二项式系数是 ( 1) 6 (2)求 2槡狓- 的展开式中狓2 的系数. C3=35.一个二项展开式 槡狓 7 的某一项的二项式系数与 解:(1)(1+2狓)7 的展开式的第4项是 这一项的系数是两个不同 犜 =C3×17-3×(2狓) 3 的概念. 3+1 7 30 第六章 计数原理=C3×23狓3=35×8×狓3 7 =280狓3. 因此,展开式第4项的系数是280. ( 1) 6 (2) 2槡狓- 的展开式的通项是 槡狓 C犽 ( 2槡狓 ) 6-犽 ( - 1) 犽 =(-1) 犽26-犽C犽狓3-犽. 6 槡狓 6 根据题意,得 3-犽=2, 犽=1. 因此,狓2 的系数是 (-1)×25×C1=-192. 6  1.写出(狆+狇)5 的展开式. 2.求(2犪+3犫)6 的展开式的第3项. ( ) 1 狀 3.写出 槡3狓- 的展开式的第狉+1项. 2槡3狓 4.(狓-1)10 的展开式的第6项的系数是 ( ). (A)C6 (B)-C6 (C)C5 (D)-C5 10 10 10 10 5.在(狓-1)(狓-2)(狓-3)(狓-4)(狓-5)的展开式中,含狓4 的项的系数是 . 632 ! ’(),$-./ (犪+犫) 狀 的展开式的二项式系数 C0 ,C1 ,C2 ,…,C犽 ,…,C狀 狀 狀 狀 狀 狀 有很多有趣的性质,而且我们可以从不同角度进行研究.  用计算工具计算(犪+犫) 狀 的展开式的二项式系数,并填入表6.31. 表631 狀 (犪+犫)狀 的展开式的二项式系数 1 2 第六章 计数原理 31续表 狀 (犪+犫)狀 的展开式的二项式系数 3 4 5 6 通过计算、填表,你发现了什么规律? 从表6.31可以发现,每一行中的系数具有对称性.除此以外还有什么规律呢?为了 便于发现规律,上表还可以写成如图6.31所示的形式. a b ……………………………………………   a b ………………………………………   表示形式的变化常常 a b …………………………………    能帮助我们发现某些规律. a b ……………………………      a b ………………………      a b …………………        图6.31 观察图6.31,你还能发现哪些规律? f(r) 对于(犪+犫) 狀 的展开式的二项式系数 20 C0 ,C1 ,C2 ,…,C狀 , 15 狀 狀 狀 狀 我们还可以从函数的角度分析它们.C狉 可看成以狉为自变 10 狀 量的函数犳(狉),其定义域是 5 {0,1,2,…,狀}. O 1 2 3 4 5 6 r 对于确定的狀,我们还可以画出它的图象.例如,当狀=6 图6.32 时,函数犳(狉)=C狉狉(∈{0,1,2,3,4,5,6})的图象 狀 是7个离散点,如图6.32所示.  (1)观察图6.32,你发现了什么规律? (2)请你分别画出狀=7,8,9时函数犳(狉)=C狉 的图象,比较它们的异同,你 狀 发现了什么规律? 分析图6.31和图6.32,可以得到二项式系数的以下性质. 32 第六章 计数原理1对称性 与首末两端 “等距离”的两个二项式系数相等.事实 上,这一性质可直接由C犿=C狀-犿? 得到. 狀 狀 ?你能用组合的意义 狀 直线狉= 将函数犳(狉)=C狉 的图象分成对称的两部分, 解释一下这个 “组合等 2 狀 式”吗? 它是图象的对称轴. 2增减性与最大值 因为 狀(狀-1)…(狀-犽+2)(狀-犽+1) 狀-犽+1 C犽 狀 = (犽-1)!犽 =C犽 狀 -1 犽 , 即 C犽 狀-犽+1 狀 = , C犽-1 犽 狀 狀-犽+1 狀+1 狀+1 所以,当 >1,即犽< 时,C犽 随犽的增加而增大;由对称性知,当犽> 犽 2 狀 2 时,C犽 随犽的增加而减小.当狀是偶数时,中间的一项C狀 取得最大值;当狀是奇数时, 狀 狀2 中间的两项C狀-1 与C狀+1 相等,且同时取得最大值. 狀2 狀2 3各二项式系数的和 已知 (1+狓) 狀=C0+C1狓+C2狓2+…+C狀狓狀 , 狀 狀 狀 狀 令狓=1,得 2狀=C0+C1+C2+…+C狀. 狀 狀 狀 狀 这就是说,(犪+犫) 狀 的展开式的各二项式系数的和等于2狀. 例3 求证:在(犪+犫) 狀 的展开式中,奇数项的二项式系数的和等于偶数项的二项式 系数的和. 分析:奇数项的二项式系数的和为 C0+C2+C4+…, 狀 狀 狀 偶数项的二项式系数的和为 ?实际上,犪,犫既可 C1+C3+C5+…. 狀 狀 狀 以取任意实数,也可以取任 由于 意多项式,还可以是别的. (犪+犫) 狀=C0犪狀+C1犪狀-1犫+C2犪狀-2犫2+…+C狀犫狀 我们可以根据具体问题的需 狀 狀 狀 狀 中的犪,犫 可以取任意实数,因此我们可以通过对犪,犫适 要灵活选取犪,犫的值. ? 当赋值来得到上述两个系数和. 证明:在展开式 (犪+犫) 狀=C0犪狀+C1犪狀-1犫+C2犪狀-2犫2+…+C狀犫狀 狀 狀 狀 狀 中,令犪=1,犫=-1,则得 第六章 计数原理 33(1-1) 狀=C0-C1+C2+…+(-1) 犽C犽+…+(-1) 狀C狀. 狀 狀 狀 狀 狀 即 (C0+C2+C4+…)-(C1+C3+C5+…)=0. 狀 狀 狀 狀 狀 狀 因此, C0+C2+C4+…=C1+C3+C5+…, 狀 狀 狀 狀 狀 狀 即在(犪+犫) 狀 的展开式中,奇数项的二项式系数的和等于偶数项的二项式系数的和.  1.填空题 (1)C1+C3+C5+…+C11= ; 11 11 11 11 C0+C1+C2+…+C狀 (2) 狀 狀 狀 狀 = . C0 +C1 +C2 +…+C狀+1 狀+1 狀+1 狀+1 狀+1 2.证明:C0+C2+C4+…+C狀=2狀-1 (狀是偶数). 狀 狀 狀 狀 3.写出狀从1到10的二项式系数表. 4.若一个集合含有狀个元素,则这个集合共有多少个子集? 习题6.3  1.选择题 (1)在(1-狓)5+(1-狓)6+(1-狓)7+(1-狓)8 的展开式中,含狓3 的项的系数是 ( ). (A)74 (B)121 (C)-74 (D)-121 (2)(狓+1)狀 的展开式中狓2 的系数为15,则狀= ( ). (A)7 (B)6 (C)5 (D)4 2.(狓+狔)(狓-狔)5 的展开式中狓3狔3 的系数是 . 3.用二项式定理展开: ( ) 槡狓 2 (1)( 犪+3槡犫 ) 9; (2) - 7 . 2 槡狓 4.化简: (1)( 1+槡狓 ) 5+( 1-槡狓 ) 5; (2)(2狓1+3狓-1)4+(2狓1-3狓-1)4. 2 2 2 2 5. (1)求(1-2狓)15 的展开式的前4项; (2)求(2犪3-3犫2)10 的展开式的第8项; ( ) 槡狓 3 12 (3)求 - 的展开式的中间一项; 3 槡狓 (4)求( 狓槡狔-狔槡狓 ) 15的展开式的中间两项. 34 第六章 计数原理6.求下列各式的二项展开式中指定项的系数: ( ) ( ) 1 10 1 1 10 (1)1- 的含 的项; (2) 2狓3- 的常数项. 2狓 狓5 2狓3  7.证明: ( ) 1 2狀 1×3×5×…×(2狀-1) (1)狓- 狓 的展开式中常数项是(-2)狀 狀! ; 1×3×5×…×(2狀-1) (2)(1+狓)2狀 的展开式的中间一项是 狀! (2狓)狀. 8.已知(1+狓)狀 的展开式中第4项与第8项的二项式系数相等,求这两项的二项式系数. 9.用二项式定理证明: (1)(狀+1)狀-1能被狀2 整除; (2)9910-1能被1000整除.   10.求证:2狀-C1×2狀-1+C2×2狀-2+…+(-1)狀-1C狀-1×2+(-1)狀=1. 狀 狀 狀 11.下图反映了二项式定理产生、完备和推广所走过的漫长历程:  e    a  a n m nN         m a b  a b  a b  a b n nN          a b n nQ          a b n n  a b n nN  x n x nR    x n x nC (第11题) (1)在上述发展过程中,无论是推广还是证明,都是从特殊到一般.如今,数学研究的一个 发展趋势就是尽可能地一般化.请你试一试,从 (犪+犫)狀 推广到 (犪+犪+…+犪)狀 1 2 犿 (犿,狀∈犖 ). (2)请你查阅相关资料,细化上述历程中的某段过程,例如从3次到狀次,从二项到犿项 等,说一说数学家是如何发现问题和解决问题的. 第六章 计数原理 35 01 234567            ’1 89:;< 本章我们首先学习了分类加法计数原理与分步乘法计数原理;然后,从一 般到特殊,学习了两类特殊的计数问题———排列与组合,并用两个计数原理推 导出排列数公式与组合数公式;最后,作为一个应用,根据多项式的乘法运算 法则和计数原理推导出了二项式定理,并研究了二项式系数的一些性质. 当我们面对一个复杂问题时,通过分类或分步,将它分解成为一些简单的 问题.先解决简单问题,然后再将它们整合起来得到整个问题的解答,达到以 简驭繁的效果,这是一种重要而基本的思想方法.两个计数原理就是这种思想 的体现.分类加法计数原理对应着 “分类”活动,而且每一类方法都能完成相 应的事情;分步乘法计数原理对应着 “分步”活动,而且只有完成每一个步骤 才能完成相应的事情.如果从集合的角度来考虑,那么分类加法计数原理表明 了这样一个事实:将集合犝分成一些两两不交的子集犛,犛,…,犛,而且 1 2 犽 犛(犻=1,2,…,犽)的元素个数分别为狀,那么集合犝的元素个数 犻 犻 狀=狀+狀+…+狀. 1 2 犽 排列、组合是两类特殊的计数问题.排列的特殊性在于排列中元素的 “互 异性”和 “有序性”,组合的特殊性在于它只有元素的 “互异性”而不需要考虑 顺序.我们看到,排列与组合之间有紧密的联系,从狀个不同元素中取出 犿(犿≤狀)个元素的组合可以看成是相应排列的一个步骤. 二项式定理是计数原理在多项式展开中的应用.把(犪+犫) 狀 的展开相乘看成 是作狀次选取,每次有2种选择———犪或犫,因此,展开式中的每一项都是 犪狀-犽犫犽 (犽=0,1,…,狀)的形式.利用分步乘法计数原理可知,合并同类项前 共有2狀 项,每一项犪狀-犽犫犽 都可以看作是在狀个 (犪+犫)中恰好有犽个取犫得到 的,从而同类项的个数为C犽. 狀 36 第六章 计数原理在本章中,无论是概念的得出还是数学公式的推导,都是从特殊到一般, 从具体到抽象,通过归纳而得出的,这是代数中研究问题的基本方法,也是数 学学习中经常使用的思维方法. 请你结合下面的问题,复习一下全章的内容吧! 1.在数学学习中,举例是理解一般原理的好方法.例如,进入一个院子要 通过一道墙,这道墙左边有犿个门,右边有狀个门,那么进入院子的方法数为 犿+狀(犿,狀分别表示走左、右边进入院子的方法数);进入一个院子要通过两 道墙,第一道墙有犿个门,第二道墙有狀个门,那么进入院子的方法数为犿× 狀(犿,狀分别表示通过第一、第二道墙的方法数).你能再举几个应用两个计数 原理的例子吗?你觉得在分类和分步时需要注意些什么? 2.加强数学知识间的联系,是深入理解知识的重要方法.例如,把本章的 知识与集合的有关内容联系起来,可以简洁地表述有关原理.你能举例说明吗? 3.举例说明排列和组合的特殊性. 4.运用计数原理和组合知识推导二项式定理,是一个有奇趣、有意味的过 程.请回味这个过程,并和同学谈谈你的学习体会. 5.请你回顾本章学习过程,结合具体知识,如计数原理、排列数公式、组合数 公式或二项式定理,谈谈这些知识的获得是如何从特殊到一般,或从具体到抽象的? 复习参考题6  1.填空题 (1)乘积 (犪+犪+…+犪)(犫+犫+…+犫)展开后,共有 项; 1 2 狀 1 2 狀 (2)学生可从本年级开设的7门选修课中任意选择3门,并从6种课外活动小组中选择2种, 不同的选法种数是 ; (3)安排6名歌手演出顺序时,要求某歌手不是第一个出场,也不是最后一个出场,不同排法 的种数是 ; (4)5个人分4张无座足球票,每人至多分1张,而且票必须分完,那么不同分法的种数 是 ; (5)5名同学去听同时举行的3个课外知识讲座,每名同学可自由选择听其中的1个讲座,不 同选择的种数是 ; (6)正十二边形的对角线的条数是 ; 第六章 计数原理 37(7)(1+狓)2狀 的展开式中,系数最大的项是第 项. 2.一个集合有5个元素. (1)这个集合的含有3个元素的子集有多少个? (2)这个集合的子集共有多少个? 3.填空题 (1)已知C狀-1=21,那么狀= ; 狀+1 (2)某班一天上午有4节课,下午有2节课,现要安排该班一天中语文、数学、政治、英语、体育、 艺术6堂课的课程表,要求数学课排在上午,体育课排在下午,不同排法种数是 ; (3)某人设计的电脑开机密码由2个英文字母后接4个数字组成,且2个英文字母不相同,该 密码可能的个数是 ; (4)以正方体的顶点为顶点的三棱锥的个数是 ; (5)在 (1-2狓)狀 的展开式中,各项系数的和是 . 4. (1)平面内有狀条直线,其中没有两条平行,也没有三条交于一点,共有多少个交点? (2)空间有狀个平面,其中没有两个互相平行,也没有三个交于一条直线,共有多少条交线?  5. (1)求 (1-2狓)5 (1+3狓)4 的展开式中按狓的升幂排列的第3项; ( ) 1 18 (2)求 9狓+ 的展开式的常数项; 3 槡狓 (3)已知 (1+槡狓)狀 的展开式中第9项、第10项、第11项的二项式系数成等差数列,求狀; (4)求 (1+狓+狓2)(1-狓)10 的展开式中狓4 的系数; (5)求 (狓2+狓+狔)5 的展开式中狓5狔2 的系数. 6.用二项式定理证明5555+9能被8整除.(提示:5555+9=(56-1)55+9.) 7. (1)平面内有两组平行线,一组有犿条,另一组有狀条,这两组平行线相交,可以构成多少 个平行四边形? (2)空间有三组平行平面,第一组有犿个,第二组有狀个,第三组有犾个,不同两组的平面 都相交,且交线不都平行,可以构成多少个平行六面体? 8.某种产品的加工需要经过5道工序. (1)如果其中某道工序不能放在最后,那么有多少种加工顺序? (2)如果其中某2道工序既不能放在最前,也不能放在最后,那么有多少种加工顺序? (3)如果其中某2道工序必须相邻,那么有多少种加工顺序? (4)如果其中某2道工序不能相邻,那么有多少种加工顺序?   9.在 (1+狓)3+(1+狓)4+…+(1+狓)狀+2 的展开式中,含狓2 项的系数是多少? 10.你能构造一个实际背景,对等式C犽·C犿-犽=C犿·C犽 的意义作出解释吗? 狀 狀-犽 狀 犿 38 第六章 计数原理  杨辉三角的性质与应用 在探究(犪+犫) 狀 的展开式的二项式系数性质时,我们曾把系数写成一张表 (图1),借 助它发现了系数的一些规律.事实上,在我国南宋数学家杨辉1261年所著的 《详解九章 算法》一书中,就已经出现了这个表.所不同的只是这里的表用阿拉伯数字表示,在那本 书里是用汉字表示 (图2).我们称这个表为杨辉三角.            a b ……………………………………………       a b ………………………………………       a b …………………………………                  a b ……………………………              a b ………………………               a b …………………                          图1 图2 杨辉是我国古代数学史上一位著述丰富的数学家,著有 《详解九章算法》 《日用算法》和 《杨辉算法》.在编写这些 算书时,杨辉广泛引用古代数学典籍,使得我们能够了解 许多已经失传的数学方法.杨辉在 《详解九章算法》里指 ? “释锁”和开方有 出,杨辉三角这种方法出于 《释锁》 算书,且我国北宋数 ? 关.杨辉三角原名为 “开方 学家贾宪 (约11世纪)曾用过.由此可以推断,我国发现 作法本源图”,也有人称它 这个表不晚于11世纪.在欧洲,这个表被认为是法国数学 为 “乘方求廉图”,在我国 家帕斯卡 (B.Pascal,1623—1662)首先发现的,他们把这 古代用来作为开方的工具. 个表叫做帕斯卡三角.这就是说,杨辉三角的发现要比欧洲 早500年左右,由此可见我国古代数学的成就是非常值得中华民族自豪的. 杨辉三角本身包含了很多有趣的性质,利用这些性质,可以解决很多数学问题.下面 让我们一起来探索吧! 数学探究 杨辉三角的性质与应用 3901=>-?@A BCDE-./:FG (一)杨辉三角的性质 1.观察杨辉三角的结构,即杨辉三角中数字排列的规律,例如每一行、相邻两行、 斜行等,画一画,连一连,算一算,写出你发现的结论. 例如: (1)结合图1和图2,可以发现,杨辉三角的第狀行的第狉个数可以表示为C狉-1 ,第 狀 狀行就是(犪+犫) 狀 的展开式的二项式系数,如图3所示.                                      第狀-1行 1 C1 C2 … C狉-1 C狉 … C狀-2 1 狀-1 狀-1 狀-1 狀-1 狀-1 第狀行 1 C1 C2 … C狉-1 C狉 C狉+1 … C狀-1 1 狀 狀 狀 狀 狀 狀   图3 (2)观察杨辉三角的相邻两行,可以发现,三角形的两个 1 腰上的数都是1,其余的数都等于它肩上的两个数相加. 1 1 如图4所示,2=1+1,3=1+2,4=1+3,6=3+3,…. 1 2 1 1 3 3 1 一般地,有 1 4 6 4 1 C狉=C狉-1+C狉 . ① 1 5 10 10 5 1 狀 狀-1 狀-1 1 6 15 20 15 6 1 2.利用已学知识,尝试对所得结论进行证明. 图4 例如,对于①式,可按如下方式进行证明. 因为 (狀-1)! (狀-1)! C狉 狀 - - 1 1 +C狉 狀-1 = 狉(-1)!(狀-狉)! + 狉!(狀-1-狉)! (狀-1)! = [狉+(狀-狉)] 狉!(狀-狉)! 狀! = , 狉!(狀-狉)! 又 狀! C狉 狀 = 狉!(狀-狉)! , 40 数学探究 杨辉三角的性质与应用所以 C狉=C狉-1+C狉 . 狀 狀-1 狀-1 ?利用数学知识间的联 上式是杨辉三角最基本的性质,也是二项式系数和组合 系性,我们可以从不同角度 数的性质.正因为杨辉三角中的数与开方、解方程,以及组 ? 研究这些性质.结合已有知 合数学、概率论中的有关问题都有密切的关系,所以历代数 识,对比一下不同角度发现 学家从不同角度研究它的性质,例如帕斯卡在 《论算术三 和证明性质的过程,说一说 角》一书中就给出了19条性质.你也来试一试吧,看能发 自己的体会. 现和证明多少性质! (二)杨辉三角的应用 在我国古代,杨辉三角是解决很多数学问题的有力工具,像开方问题、数列问题等. 例如,开方古算题 (出自杨辉 《详解九章算法》): 积一百三十三万六千三百三十六尺,问为三乘方几何. 在我国清中叶以前,称平方为自乘,立方为再自乘,四次方为三乘方.因此,这个问题相 当于解方程狓4=1336336. 杨辉三角 (图2)中的五句话,前三句 “左袤乃积数,右袤乃隅算,中藏者皆廉”分 别说明了图中数字代表的意义,后两句 “以廉乘商方,命实而除之”说明了如何应用各行 系数进行开方. 你可以查阅相关书籍或上网搜索相关资料,探究一下开方算法的具体操作及其中蕴含 的算法思想,感受我国古代数学的独特风格. 再如,数列古算题 (出自杨辉 《详解九章算法》): 三角垛,下广,一面十二个,上尖,问计几何. 在我国古代,很多数学家研究数列的问题,并取得了辉煌 的成就.就像通过研究 “三角垛”这样的一类问题———垛积问 题,发现了一系列数列的求和公式.上述三角垛问题一般化 后,就相当于如下将圆球堆成三角垛的问题: 图5 底层是每边堆狀个圆球的三角形 (如图5),向上逐层每 边减少1个,顶层是1个,求总数. 利用杨辉三角,就可以解决以上问题,并获得每层圆球数所构成的数列的一般求和公 式.你可以试一试. 除此之外,你还可以通过查阅相关书籍或上网搜索相关资料,从杨辉三角出发,一步 步探究,拓展到更多类数列的问题. ’1H=>IJ-KL 以独立探究和小组合作相结合的方式开展探究活动.建议按如下步骤完成: 1.小组集体讨论探究方案,确定研究思路. 数学探究 杨辉三角的性质与应用 412.小组成员各自开展独立探究,并以专题作业的形式撰写研究报告. 3.小组内进行交流讨论,完善研究成果,并形成一份小组研究报告. 4.全班进行成果交流、评价. D1M>NO-P?@ABC 第七章 随机变量及其分布                         σ 5= DEFGH 本章我们在已有概率学习的基础上,研究了在一个事件发生的条件下,求 另一个事件发生的概率问题,从而得到了条件概率的计算方法.这一方法的基 本思想是利用一些已知条件,通过缩小样本空间的方法计算概率.利用条件概 率,我们得到了一般的概率乘法公式.特别地,当两个事件相互独立时,乘法 公式就是求两个独立事件的积事件的概率公式.有了这些知识,当我们面对一 个复杂事件时,就可以先把它表示为一些简单事件运算的结果,再利用概率的 加法公式和乘法公式计算出复杂事件的概率.这是全概率公式蕴含的数学思想 方法,体现了利用研究对象的性质探寻解决问题的方法、将复杂问题化归为简 单问题的数学思想. 在古典概型的学习中我们发现,为了计算随机事件的概率,往往需要为不 同背景的问题建立不同的样本空间,这样 “单个地”处理问题显然是麻烦而不 经济的.类似于引入函数概念,通过函数描述现实世界中变量关系和规律一样, 本章我们先引入随机变量的概念,建立起样本空间到实数集的对应关系,为随 机事件的表示带来方便;然后再引入分布列概念,建立起随机变量取值与其概 率的对应关系.有了随机变量及其分布列的概念,就可以将不同背景的概率问 题转化为统一的数学问题,从而为我们利用各种数学工具,系统、全面地研究 随机现象的规律奠定基础. 本章的学习中,我们重点关注了随机变量的分布列和数字特征.分布列全面 89彻底地刻画了随机变量的取值规律;均值和方差是随机变量的两个重要的数字 特征,均值反映了随机变量取值的平均水平,而方差反映了随机变量取值的离 散程度,它们在推断随机现象的规律进而作出决策中有重要作用. 在函数的学习中我们有这样的经验:通过学习幂函数、指数函数、对数函 数、三角函数等基本函数类,不仅加深了对一般函数概念的理解,而且奠定了 建立适当的函数模型解决不同类型实际问题的数学基础.类似地,我们通过研 究二项分布、超几何分布等离散型随机变量的分布,以及正态分布这一连续型 随机变量的分布,不仅进一步理解了随机变量在描述随机现象中的作用,而且 对随机思想在解决实际问题中的作用也有了更深入的理解. 请你带着下面的问题,复习一下全章的内容吧! 1.两个随机事件的独立性和条件概率有什么关系? 2.用全概率公式求一个复杂事件的概率的思路是什么? 3.离散型随机变量的分布列与样本频率分布有什么联系与区别? 4.离散型随机变量的均值与方差的意义和作用是什么?它们与随机变量的 观测值的平均值和方差的联系与区别是什么? 5.归纳二项分布模型的特征.有人说:“随机掷一枚质地均匀的硬币,出现 正面的概率是0.5.因此,随机抛掷100次硬币,出现50次正面的可能性应该 也是0.5.”你认为正确吗?为什么? 6.离散型随机变量的分布规律与服从正态分布的随机变量的分布规律的区 别是什么? 复习参考题7  1.举例说明犘(犅)与犘(犅|犃)没有确定的大小关系. 2.抛掷两枚质地均匀的骰子,求: (1)两个点数都出现偶数的概率; (2)已知第一枚骰子的点数是偶数的条件下,第二枚骰子的点数也是偶数的概率. 3.假设有两箱零件,第一箱内装有10件,其中有2件次品;第二箱内装有20件,其中有3件次 品.现从两箱中随意挑选一箱,然后从该箱中随机取1个零件. (1)求取出的零件是次品的概率;  (2)已知取出的是次品,求它是从第一箱取出的概率. 90 第七章 随机变量及其分布4.已知离散型随机变量犡的分布列如下表所示. 犡 0 1 2 犘 0.36 1-2狇 狇2 求:(1)常数狇的值; (2)犈(犡)和犇(犡). 5.已知随机变量犡取所有的值1,2,…,狀是等可能的,且犈(犡)=10,求狀的值. 6.已知每门大炮击中目标的概率都是0.3,现在狀门大炮同时对某一目标各射击一次. (1)当狀=10时,求恰好击中目标3次的概率 (精确到0.001); (2)如果使目标至少被击中一次的概率超过95%,至少需要多少门大炮?  7.长时间玩手机可能影响视力.据调查,某校学生大约40%的人近视,而该校大约有20%的学 生每天玩手机超过1h,这些人的近视率约为50%.现从每天玩手机不超过1h的学生中任意 调查一名学生,求他近视的概率. 8.某商场要在国庆节开展促销活动,促销活动可以在商场内举行,也可以在商场外举行.统计资 料表明,每年国庆节商场内的促销活动可获得利润2万元;商场外的促销活动,如果不遇到有 雨天气可获得利润8万元,如果遇到有雨天气则会带来经济损失3万元.9月30日气象台预报 国庆节当地的降水概率是40%,商场应该选择哪种促销方式? 9.一份某种意外伤害保险费为20元,保险金额为50万元.某城市的一家保险公司一年能销售10 万份保单,而每一份保单需要赔付的概率为10-5.利用计算工具求 (精确到0.0001): (1)这家保险公司在这个险种上亏本的概率; (2)这家保险公司在这个险种上一年内获利不少于100万元的概率.   10.甲、乙、丙三人相互做传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将 球传给另外两个人中的任何一人.求狀次传球后球在甲手中的概率. 11.某单位有10000名职工,想通过验血的方法筛查乙肝病毒携带者.假设携带病毒的人占5%, 如果对每个人的血样逐一化验,就需要化验10000次.统计专家提出了一种化验方法:随机 地按5人一组分组,然后将各组5个人的血样混合再化验.如果混合血样呈阴性,说明这5 个人全部阴性;如果混合血样呈阳性,说明其中至少有一人的血样呈阳性,就需要对每个人 再分别化验一次. (1)按照这种化验方法能减少化验次数吗? (2)如果携带病毒的人只占2%,按照犽个人一组,犽取多大时化验次数最少? 12.某城市高中数学统考,假设考试成绩服从正态分布犖(75,82).如果按照16%,34%,34%, 16%的比例将考试成绩分为A,B,C,D四个等级,试确定各等级的分数线(精确到1). 第七章 随机变量及其分布 91第八章 成对数据的统计分析 在必修课程中,我们学习了单个变量的观测数据的直观表示 和统计特征的刻画等知识与方法.例如,用直方图描述样本数据 的分布规律,用均值刻画样本数据的集中趋势,用方差刻画样本 数据的离散程度等.这些方法主要适用于通过样本认识单个变量 的统计规律.在现实中,我们还经常需要了解两个或两个以上变 量之间的关系.例如,教育部门为掌握学生身体健康状况,需要 了解身高变量和体重变量之间的关系;医疗卫生部门要制定预防 青少年近视的措施,需要了解有哪些因素会影响视力,以及这些 因素是如何影响视力的;商家要根据顾客的意见改进服务水平, 希望了解哪些因素影响服务水平,以及这些因素是如何起作用 的;等等.为此,我们需要进一步学习通过样本推断变量之间关 系的知识和方法. 本章的学习内容有成对数据的统计相关性、一元线性回归模 型和2×2列联表等,这些知识与方法在解决实际问题中非常有 用.可以发现,两个随机变量的相关性可以通过成对样本数据进 行分析;利用一元线性回归模型可以研究变量之间的随机关系, 进行预测;利用2×2列联表可以检验两个随机变量的独立性. 本章的学习对于提高我们解决实际问题的能力,提升数据分析、 数学建模等素养都是非常有帮助的. 书书书81 成对数据的统计相关性 我们知道,如果变量狔是变量狓的函数,那么由狓就 可以唯一确定狔.然而,现实世界中还存在这样的情况:两 个变量之间有关系,但密切程度又达不到函数关系的程度. 例如,人的体重与身高存在关系,但由一个人的身高值并不 能确定他的体重值.那么,该如何刻画这两个变量之间的关 系呢?下面我们就来研究这个问题. 811 ! "#$%&&’ 我们知道,一个人的体重与他的身高有关系.一般而言,个子高的人往往体重值较 大,个子矮的人往往体重值较小.但身高并不是决定体重的唯一因素,例如生活中的饮食 习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素.像这样,两个变量 有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关 关系 (correlation). 两个变量具有相关关系的事例在现实中大量存在.例如: 1.子女身高狔与父亲身高狓之间的关系.一般来说,父亲的个子高,其子女的个子 也会比较高;父亲个子矮,其子女的个子也会比较矮.但影响子女身高的因素,除父亲身 高外还有其他因素,例如母亲身高、饮食结构、体育锻炼等,因此父亲身高又不能完全决 定子女身高. 2.商品销售收入狔与广告支出狓之间的关系.一般来说,广告支出越多,商品销售 收入越高.但广告支出并不是决定商品销售收入的唯一因素,商品销售收入还与商品质 量、居民收入等因素有关. 3.空气污染指数狔与汽车保有量狓之间的关系.一般来说,汽车保有量增加,空气 污染指数会上升.但汽车保有量并不是造成空气污染的唯一因素,气象条件、工业废气排 放、居民生活和取暖、垃圾焚烧等都是影响空气污染指数的因素. 4.粮食亩产量狔与施肥量狓之间的关系.在一定范围内,施肥量越大,粮食亩产量 就越高.但施肥量并不是决定粮食亩产量的唯一因素,粮食亩产量还要受到土壤质量、降 水量、田间管理水平等因素的影响. 因为在相关关系中,变量狔的值不能随变量狓的值的确定而唯一确定,所以我们无 法直接用函数去描述变量之间的这种关系.对上述各例中两个变量之间的相关关系,我们 第八章 成对数据的统计分析 93往往会根据自己以往积累的经验作出推断.“经验之中有规律”,经验的确可以为我们的决 策提供一定的依据,但仅凭经验推断又有不足.例如,不同经验的人对同一情形可能会得 出不同结论,不是所有的情形都有经验可循等.因此,在研究两个变量之间的相关关系 时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模 型,再利用模型进行估计或推断.  在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪 含量的简单随机样本数据,如表8.11所示.表中每个编号下的年龄和脂肪含量数据 都是对同一个体的观测结果,它们构成了成对数据. 表811 编号 1 2 3 4 5 6 7 年龄/岁 23 27 39 41 45 49 50 脂肪含量/% 9.5 17.8 21.2 25.9 27.5 26.3 28.2 编号 8 9 10 11 12 13 14 年龄/岁 53 54 56 57 58 60 61 脂肪含量/% 29.6 30.2 31.4 30.8 33.5 35.2 34.6 根据以上数据,你能推断人体的脂肪含量与年龄之间存在怎样的关系吗? 为了更加直观地描述上述成对样本数据中脂肪含量与年龄之间的关系,类似于用直方 图描述单个变量样本数据的分布特征,我们用图形展示成对样本数据的变化特征.用横轴 表示年龄,纵轴表示脂肪含量,则表8.11中每个编号下的成对样本数据都可用直角坐标 系中的点表示出来,由这些点组成了如图8.11所示的统计图.我们把这样的统计图叫做 散点图 (scatterplot). /% 40 35 利用统计软件画散点 30 25 图,Excel软件可以通过 20 插入图表,从图表类型中 15 10 选取散点图;R软件可以 5 0 用函数plot. 15 20 25 30 35 40 45 50 55 60 65 / 图8.11 观察图8.11,可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表 明随年龄值的增加,相应的脂肪含量值呈现增加的趋势.这样,由成对样本数据的分布规 律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系. 94 第八章 成对数据的统计分析 书书书从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们 就称这两个变量正相关 (positivecorrelation);当一个变量的值增加时,另一个变量的相 应值呈现减小的趋势,则称这两个变量负相关 (negativecorrelation). 由图8.11,能够推断脂肪含量与年龄这两个变量正相关.  (1)两个变量负相关时,成对样本数据的散点图有什么特点? (2)你能举出生活中两个变量正相关或负相关的一些例子吗? 散点图是描述成对数据之间关系的一种直观方法.观察散点图8.11,从中我们不仅 可以大致看出脂肪含量和年龄呈现正相关,而且从整体上可以看出散点落在某条直线附 近.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我 们就称这两个变量线性相关. 观察散点图8.12,我们发现:图 (1)中的散点落在某条曲线附近,而不是落在一 条直线附近,说明这两个变量具有相关性,但不是线性相关;类似地,图 (2)中的散点 落在一条折线附近,这两个变量也具有相关性,但它们既不是正相关,也不是负相关;图 (3)中的散点杂乱无章,无规律可言,看不出这两个变量有什么相关性. y y y 12 12 12 10 10 10 8 8 8 6 6 6 4 4 4 2 2 2 0 0 0 0 2 4 6 8 10 1214 0 2 4 6 8 10 1214 0 2 4 6 8 10 1214 (1) (2) (3) 图8.12 一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线 性相关或曲线相关.  1.举例说明什么叫相关关系.相关关系与函数关系有什么区别? 2.根据下面的散点图,推断图中的两个变量是否存在相关关系. 第八章 成对数据的统计分析 95y y 10 10 9 9 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 0 0 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 (1) (2) y y 10 10 9 9 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 0 0 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 (3) (4) (第2题) 3.下表给出了一些地区的鸟的种类数与该地区的海拔高度的数据,鸟的种类数与海拔高度是否存在相 关关系?如果是,那么这种相关关系有什么特点? 地区 A B C D E F G H I J K 海拔高度/m 1250 1158 1067 457 701 731 610 670 1493 762 549 鸟的种类/种 36 30 37 11 11 13 17 13 29 4 15 812 ! ()%&’* 通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相 关关系、是正相关还是负相关、是线性相关还是非线性相关等.散点图虽然直观,但无法 确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否 像引入均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的 “数字特 征”,对成对样本数据的相关程度进行定量分析呢? 对于变量狓和变量狔,设经过随机抽样获得的成对样本数据为 (狓,狔), (狓, 1 1 2 狔),…,(狓,狔),其中狓,狓,…,狓 和狔,狔,…,狔 的均值分别为狓和狔.为 2 狀 狀 1 2 狀 1 2 狀 了刻画每个变量的观测数据相对其均值的增减情况,将数据以 (狓,狔)为零点进行平移, 得到平移后的成对数据为 (狓-狓,狔-狔),(狓-狓,狔-狔),…,(狓-狓,狔-狔), 1 1 2 2 狀 狀 并绘制散点图. 96 第八章 成对数据的统计分析利用上述方法处理表8.11中的数据,得到图8.13.我们发现,这时的散点大多数 分布在第一象限、第三象限,大多数散点的横、纵坐标同号.显然,这样的规律是由人体 脂肪含量与年龄正相关所决定的. y 10 5 -30 -25 -20 -15 -10 -5 O 5 10 15 -5 -10 -15 -20 图8.13 一般地,如果变量狓和狔正相关,那么关于均值平移后的大多数散点将分布在第一 象限、第三象限,对应的成对数据同号的居多,如图8.14 (1)所示;如果变量狓和狔 负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数 据异号的居多,如图8.14 (2)所示. O O (1) (2) 图8.14  根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后呈现的 规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗? 从上述讨论得到启发,利用散点(狓-狓,狔-狔)(犻=1,2,…,狀)的横、纵坐标是 犻 犻 否同号,可以构造一个量 1 犔 = [(狓-狓)(狔-狔)+(狓-狓)(狔-狔)+…+(狓-狓)(狔-狔)]. 狓狔 狀 1 1 2 2 狀 狀 一般情形下,犔 >0表明成对样本数据正相关;犔 <0表明成对样本数据负相关. 狓狔 狓狔 第八章 成对数据的统计分析 97 你认为犔 的大小一定能度量出成对样本数据的相关程度吗? 狓狔 因为犔 的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程 狓狔 度的大小.例如,在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高的 单位由米改为厘米,则相应的犔 将变为原来的100倍,但单位的改变并不会导致体重与 狓狔 身高之间相关程度的改变. 为了消除度量单位的影响,需要对数据作进一步的 “标准化”处理.我们用 狊= 槡 1 ∑ 狀 (狓-狓)2 ,狊= 槡 1 ∑ 狀 (狔-狔)2 狓 狀 犻 狔 狀 犻 犻=1 犻=1 分别除狓-狓和狔-狔(犻=1,2,…,狀),得 犻 犻 (狓-狓 狔-狔) (狓-狓 狔-狔) (狓-狓 狔-狔) 1 , 1 , 2 , 2 ,…, 狀 , 狀 . 狊 狊 狊 狊 狊 狊 狓 狔 狓 狔 狓 狔 为简单起见,把上述 “标准化”处理后的成对数据分别记为 (狓′,狔′),(狓′,狔′),…,(狓′,狔′), 1 1 2 2 狀 狀 仿照犔 的构造,可以得到 狓狔 1 狉= (狓′狔′+狓′狔′+…+狓′狔′) 狀 1 1 2 2 狀 狀 ∑ 狀(狓-狓)(狔-狔) 犻 犻 = 犻=1 . (1) 槡 ∑ 狀(狓-狓) 2 槡 ∑ 狀(狔-狔) 2 犻 犻 犻=1 犻=1 我们称狉为变量狓和变量狔的样本相关系数 (samplecorrelationcoefficient). 这样,我们利用成对样本数据构造了样本相关系数狉.样本相关系数狉是一个描述成 对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征: 当狉>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数 据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大. 当狉<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数 据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小. 那么,样本相关系数狉的大小与成对样本数据的相关程度有什么内在联系呢?为此, 我们先考察一下狉的取值范围. 观察狉的结构,联想到二维 (平面)向量、三维 (空间)向量数量积的坐标表示,我 们将向量的维数推广到狀维,狀维向量犪,犫的数量积仍然定义为 犪·犫=|犪||犫|cosθ, 其中θ为向量犪,犫的夹角.类似于平面或空间向量的坐标表示,对于向量犪=(犪,犪, 1 2 98 第八章 成对数据的统计分析…,犪)和犫=(犫,犫,…,犫),我们有 狀 1 2 狀 犪·犫=犪犫+犪犫+…+犪犫. 1 1 2 2 狀狀 设 “标准化”处理后的成对数据(狓′,狔′),(狓′,狔′),…,(狓′,狔′)的第一分量构 1 1 2 2 狀 狀 成狀维向量 狓′=(狓′,狓′,…,狓′), 1 2 狀 第二分量构成狀维向量 狔′=(狔′,狔′,…,狔′), 1 2 狀 则有 1 1 狉= 狓′·狔′= 狓′|狔′|cosθ. 狀 狀 因为狓′=|狔′|=槡狀,所以样本相关系数 狉=cosθ, 其中θ为向量狓′和向量狔′的夹角. 由-1≤cosθ≤1,可知 -1≤狉≤1.  当|狉|=1时,成对样本数据之间具有怎样的关系呢? 当|狉|=1时,狉=cosθ中的θ=0或π,向量狓′和狔′共线.由向量的知识可知,存在 实数λ,使得狔′=λ狓′,即 狔-狔 狓-狓 犻 =λ犻 ,犻=1,2,…,狀. 狊 狊 狔 狓 这表明成对样本数据 (狓,狔)都落在直线 犻 犻 λ狊 狔-狔= 狔(狓-狓) 样本相关系数狉有时 狊 狓 也称样本线性相关系数, 上.这时,成对样本数据的两个分量之间满足一种线性关系. |狉|刻画了样本点集中于 由此可见,样本相关系数狉的取值范围为 [-1,1]. 某条直线的程度.当狉=0 样本相关系数狉的绝对值大小可以反映成对样本数据之间线 时,只表明成对样本数据 性相关的程度: 间没有线性相关关系,但 当|狉|越接近1时,成对样本数据的线性相关程度越强; 不排除它们之间有其他相 当|狉|越接近0时,成对样本数据的线性相关程度越弱. 关关系. 图8.15是不同成对样本数据的散点图和相应的样本相关系数.图 (1)中的散点有 明显的从左下角到右上角沿直线分布的趋势,说明成对样本数据呈现出线性相关关系;样 本相关系数狉=0.97,表明成对样本数据的正线性相关程度很强.图 (2)中的散点有明 第八章 成对数据的统计分析 99显的从左上角到右下角沿直线分布的趋势,说明成对样本数据也呈现出线性相关关系;样 本相关系数狉=-0.85,表明成对样本数据的负线性相关程度比较强.从样本相关系数来 看,图 (1)中成对样本数据的线性相关程度要比图 (2)中强一些;图 (3)和图 (4)中 的成对样本数据的线性相关程度很弱,其中图 (4)中成对样本数据的线性相关程度极弱. y y 3 3 2 2 1 1 0 0 -1 -1 -2 -2 -3 -3 -4 -2 0 2 4 -4 -2 0 2 4 r=0.97 r=-0.85 (1) (2) y y 3 3 2 2 1 1 0 0 -1 -1 -2 -2 -3 -3 -4 -2 0 2 4 -4 -2 0 2 4 r=0.24 r=-0.05 (3) (4) 图8.15 综上可知,两个随机变量的相关性可以通过成对样本数据进行分析,而样本相关系数 狉可以反映两个随机变量之间的线性相关程度:狉的符号反映了相关关系的正负性;|狉| 的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度. 在有限总体中,若要确切地了解两个变量之间相关关系的正负性及线性相关的程度, 我们可以利用这两个变量取值的所有成对数据,通过公式 (1)就可以计算出两个变量的 相关系数.例如,要确切了解脂肪含量狔与年龄狓的线性相关程度,需要调查所有人的年 龄及其脂肪含量,再将得到的成对数据代入公式 (1),计算出相关系数.这个相关系数就 能确切地反映变量之间的相关程度. 不过,在实际中,获得总体中所有的成对数据往往是不容易的.因此,我们还是要用样 本估计总体的思想来解决问题.也就是说,我们先要通过抽样获取两个变量的一些成对样本 100第八章 成对数据的统计分析数据,再计算出样本相关系数,通过样本相关系数去估计总体相关系数,从而了解两个变 量之间的相关程度.对于简单随机样本而言,样本具有随机性,因此样本相关系数狉也具有 随机性.一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好. 例1 根据表8.11中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计 算样本相关系数,并推断它们的相关程度. 解:先画出散点图,如图8.11所示.观察散点图,可以看出样本点都集中在一条直 线附近,由此推断脂肪含量和年龄线性相关. 根据样本相关系数的定义, ∑14 ∑14 (狓-狓)(狔-狔) 狓狔-14狓狔 犻 犻 犻犻 狉= 犻=1 = 犻=1 . ① 槡∑14 (狓-狓) 2 槡∑14 (狔-狔) 2 槡∑14 狓2-14狓2 槡∑14 狔2-14狔2 犻 犻 犻 犻 犻=1 犻=1 犻=1 犻=1 利用计算工具计算可得 ∑14 狓≈48.07,狔≈27.26, 狓狔=19403.2, 犻犻 利用统计软件计算样 犻=1 ∑14 ∑14 本相关系数,Excel软件 狓2=34181, 狔2=11051.77. 犻 犻 用函数CORREL;R软件 犻=1 犻=1 代入 ① 式,得 用函数cor. 19403.2-14×48.07×27.26 狉≈ ≈0.97. 槡34181-14×48.072× 槡11051.77-14×27.262 由样本相关系数狉≈0.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关 程度很强. 例2 有人收集了某城市居民年收入 (所有居民在一年内收入的总和)与A商品销售 额的10年数据,如表8.12所示. 表812 第狀年 1 2 3 4 5 6 7 8 9 10 居民年收入/亿元 32.2 31.1 32.9 35.8 37.1 38.0 39.0 43.0 44.6 46.0 A商品销售额/万元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0 画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断A商品销 售额与居民年收入的相关程度和变化趋势的异同. 解:画出成对样本数据的散点图,如图8.16所示.从散点图看,A商品销售额与居 民年收入的样本数据呈现出线性相关关系. 第八章 成对数据的统计分析 101A  55 50 45 40 35 30 25 20 30 35 40 45 50  图8.16 由样本数据计算得样本相关系数狉≈0.95.由此可以推断,A商品销售额与居民年收 入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强. 例3 在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据, 如表8.13所示. 表813 编号 身高/cm 体重/kg 臂展/cm 编号 身高/cm 体重/kg 臂展/cm 1 173 55 169 14 166 66 161 2 179 71 170 15 176 61 166 3 175 52 172 16 176 49 165 4 179 62 177 17 175 60 173 5 182 82 174 18 169 48 162 6 173 63 166 19 184 86 189 7 180 55 174 20 169 58 164 8 170 81 169 21 182 54 170 9 169 54 166 22 171 58 164 10 177 54 176 23 177 61 173 11 177 59 170 24 173 58 165 12 178 67 174 25 173 51 169 13 174 56 170 体重与身高、臂展与身高分别具有怎样的相关性? 解:根据样本数据画出体重与身高、臂展与身高的散点图,分别如图8.17(1)和 (2)所示,两个散点图都呈现出线性相关的特征. /kg /cm 90 190 85 185 80 75 180 70 175 65 60 170 55 165 50 160 45 40 155 165 170 175 180 185  /cm 165 170 175 180 185 /cm (1) (2) 图8.17 102第八章 成对数据的统计分析通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为 正线性相关.其中,臂展与身高的相关程度更高.  1.由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的相关关系? 为什么? 2.已知变量狓和变量狔的3对随机观测数据 (2,2),(3,-1),(5,-7),计算成对样本数据的样 本相关系数.能据此推断这两个变量线性相关吗?为什么? 3.画出下列成对数据的散点图,并计算样本相关系数.据此,请你谈谈样本相关系数在刻画成对样本 数据相关关系上的特点. (1)(-2,-3),(-1,-1),(0,1),(1,3),(2,5),(3,7); (2)(0,0),(1,1),(2,4),(3,9),(4,16); (3)(-2,-8),(-1,-1),(0,0),(1,1),(2,8),(3,27); (4)(2,0),(1, 槡3),(0,2),(-1, 槡3),(-2,0). 4.随机抽取7家超市,得到其广告支出与销售额数据如下: 超市 A B C D E F G 广告支出/万元 1 2 4 6 10 14 20 销售额/万元 19 32 44 40 52 53 54 请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征. 习题8.1  1.在以下4幅散点图中,推断哪些图中的狔和狓之间存在相关关系?其中哪些正相关,哪些负 相关?哪些图所对应的成对样本数据呈现出线性相关关系?哪些图所对应的成对样本数据呈现 出非线性相关关系? 0 2 1 0 1 2 (1) (2) 第八章 成对数据的统计分析 103y y 2 2 1 1 0 0 -1 -1 -2 -2 -3 -2 -1 0 1 2 -3 -2 -1 0 1 2 (3) (4) (第1题)  2.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,所得数据 如下: 航空公司编号 1 2 3 4 5 6 7 8 9 10 航班正点率/% 81.8 76.8 76.6 75.7 73.8 72.2 71.2 70.8 91.4 68.5 顾客投诉/次 21 58 85 68 74 93 72 122 18 125 顾客投诉次数和航班正点率之间是否呈现出线性相关关系?它们之间的相关程度如何?变化趋 势有何特征? 3.根据物理中的胡克定律,在弹性限度内,弹簧伸长的长度与所受的外力成正比.在弹性限度 内,测得一根弹簧伸长长度狓和相应所受外力犉的一组数据如下: 编号 1 2 3 4 5 6 7 8 9 10 狓/cm 1 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.8 3.0 犉/N 3.08 3.76 4.31 5.02 5.51 6.25 6.74 7.40 8.54 9.24 两个变量的样本相关系数是否为1?请你解释其中的原因.   4.某地区的环境条件适合天鹅栖息繁衍.有人发现了一个有趣的现象,该地区有5个村庄,其中 3个村庄附近栖息的天鹅较多,婴儿出生率也较高;2个村庄附近栖息的天鹅较少,婴儿的出 生率也较低.有人认为婴儿出生率和天鹅数之间存在相关关系,并得出一个结论:天鹅能够带 来孩子.你同意这个结论吗?为什么? 104第八章 成对数据的统计分析82 一元线性回归模型及其应用 通过前面的学习我们已经了解到,根据成对样本数据的 散点图和样本相关系数,可以推断两个变量是否存在相关关 系、是正相关还是负相关,以及线性相关程度的强弱等.进 一步地,如果能像建立函数模型刻画两个变量之间的确定性 关系那样,通过建立适当的统计模型刻画两个随机变量的相 关关系,那么我们就可以利用这个模型研究两个变量之间的 随机关系,并通过模型进行预测. 下面我们研究当两个变量线性相关时,如何利用成对样 本数据建立统计模型,并利用模型进行预测的问题. 821 ! +,-./012 生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父 亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了 某所高校14名男大学生的身高及其父亲的身高,得到的数据如表8.21所示. 表821 编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 父亲身高/cm 174 170 173 169 182 172 180 172 168 166 182 173 164 180 儿子身高/cm 176 176 170 170 185 176 178 174 170 168 178 172 165 182 利用前面表示数据的方法,以横轴表示  /cm 父亲身高、纵轴表示儿子身高建立直角坐标 190 系,再将表8.21中的成对样本数据表示为散 185 点图,如图8.21所示.可以发现,散点大致 180 175 分布在一条从左下角到右上角的直线附近,表 170 明儿子身高和父亲身高线性相关.利用统计软 165 160 件,求得样本相关系数为狉≈0.886,表明儿子 160 165 170 175 180 185  /cm 图8.21 身高和父亲身高正线性相关,且相关程度较高.  根据表8.21中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数 模型刻画吗? 第八章 成对数据的统计分析 105在表8.21的数据中,存在父亲身高相同,而儿子身高不同的情况.例如,第6个和 第8个观测的父亲身高均为172cm,而对应的儿子身高分别为176cm和174cm;同样, 第3,4两个观测中,儿子身高都是170cm,而父亲身高分别为173cm和169cm.可见 儿子身高和父亲身高之间不是函数关系,也就不能用函数模型刻画. 图8.21中的散点大致分布在一条直线附近,表明儿子身高和父亲身高这两个变量之 间有较强的线性相关关系,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响, 而把影响儿子身高的其他因素,如母亲身高、生活环境、饮食习惯等作为随机误差,得到 刻画两个变量之间关系的线性回归模型.其中,随机误差是一个随机变量. 用狓表示父亲身高,犢表示儿子身高,犲表示随机误 差.假定随机误差犲的均值为0,方差为与父亲身高无关的 定值σ2 ,则它们之间的关系可以表示为 为什么假设犈(犲)= 0,而不假设其为某个不 烄犢=犫狓+犪+犲, 烅 (1) 为0的常数? 烆犈(犲)=0,犇(犲)=σ2. 我们称 (1)式为犢关于狓的一元线性回归模型 (simplelinearregressionmodel).其中, 犢称为因变量或响应变量,狓称为自变量或解释变量;犪和犫为模型的未知参数,犪称为 截距参数,犫称为斜率参数;犲是犢与犫狓+犪之间的随机误差.模型中的犢也是随机变 量,其值虽然不能由变量狓的值确定,但是却能表示为犫狓+犪与犲的和 (叠加),前一部 分由狓所确定,后一部分是随机的.如果犲=0,那么犢与狓之间的关系就可用一元线性 函数模型来描述. 对于父亲身高狓和儿子身高犢的一元线性回归模型 (1),可以解释为父亲身高为狓 犻 的所有男大学生的身高组成一个子总体,该子总体的均值为犫狓+犪,即该子总体的均值 犻 与父亲身高是线性函数关系.而对于父亲身高为狓 的某一名男大学生,他的身高狔 并不 犻 犻 一定为犫狓+犪,它仅是该子总体中的一个观测值,这个观测值与均值有一个误差项犲= 犻 犻 狔-(犫狓+犪). 犻 犻  你能结合具体实例解释产生模型 (1)中随机误差项的原因吗? 在研究儿子身高与父亲身高的关系时,产生随机误差犲的原因有: (1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食 习惯和锻炼时间等; (2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差; (3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元 线性回归模型来近似这种关系,这种近似也是产生随机误差犲的原因. 106第八章 成对数据的统计分析 1.说明函数模型与回归模型的区别,并分别举出两个应用函数模型和回归模型的例子. 2.在一元线性回归模型 (1)中,参数犫的含义是什么? 3.将图8.21中的点按父亲身高的大小次序用折线连起来,所得到的图象是一个折线图,可以用这条 折线表示儿子身高和父亲身高之间的关系吗? 822 ! +,-./0123*$456789 在一元线性回归模型中,表达式犢=犫狓+犪+犲刻画的是变量犢与变量狓之间的线性 相关关系,其中参数犪和犫未知,需要根据成对样本数据进行估计.由模型的建立过程可 知,参数犪和犫刻画了变量犢与变量狓的线性关系,因此通过成对样本数据估计这两个 参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线 最接近.  利用散点图8.21找出一条直线,使各散点在整体上与此直线尽可能接近. 有的同学可能会想,可以采用测量的方法,先画出一条直线,测量出各点与它的距 离,然后移动直线,到达一个使距离的和最小的位置.测量出此时的斜率和截距,就可得 到一条直线,如图8.22所示.  /cm  /cm 190 190 185 185 180 180 175 175 170 170 165 165 160 160 160 165 170 175 180 185 /cm 160 165 170 175 180 185  /cm 图8.22 图8.23 有的同学可能会想,可以在图中选择这样的两点画直线,使得直线两侧的点的个数基 本相同,把这条直线作为所求直线,如图8.23所示. 还有的同学会想,在散点图中多取几对点,确定出几条直线的方程,再分别求出这些 直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距如图8.24 所示. 第八章 成对数据的统计分析 107 /cm 190 185 180 175 170 165 160 160 165 170 175 180 185  /cm 图8.24 同学们不妨去实践一下,看看这些方法是不是真的可行. 上面这些方法虽然有一定的道理,但比较难操作,我们需要另辟蹊径. 先进一步明确我们面临的任务:从成对样本数据出发,用数学的方法刻画 “从整体上 看,各散点与直线最接近”. 通常,我们会想到利用点到直线狔=犫狓+犪的 “距离”来刻画散点与该直线的接近程 度,然后用所有 “距离”之和刻画所有样本观测数据与该直线的接近程度.我们设满足一 元线性回归模型的两个变量的狀对样本数据为 (狓,狔), (狓,狔),…, (狓,狔), 1 1 2 2 狀 狀 由狔=犫狓+犪+犲(犻=1,2,…,狀),得 犻 犻 犻 狔-(犫狓+犪)=犲 .显然犲 越小,表  /cm 犻 犻 犻 犻 示点 (狓,狔)与点 (狓,犫狓+犪)的 “距 190 犻 犻 犻 犻 185 离”越小,即样本数据点离直线狔=犫狓+犪的 180 竖直距离越小,如图8.25所示.特别地,当 175 170 犲=0时,表示点 (狓,狔)在这条直线上. 165 犻 犻 犻 160 因此,可以用这狀个竖直距离之和 160 165 170 175 180 185  /cm 图8.25 ∑狀 狔-(犫狓+犪) 犻 犻 犻=1 来刻画各样本观测数据与直线狔=犫狓+犪的 “整体接近程度”. 在实际应用中,因为绝对值使得计算不方便,所以人们通常用各散点到直线的竖直距 离的平方之和 ∑狀 犙= (狔-犫狓-犪) 2 犻 犻 犻=1 来刻画 “整体接近程度”. 在上式中,狓,狔(犻=1,2,3,…,狀)是已知的成对样本数据,所以犙由犪和犫所 犻 犻 决定,即它是犪和犫的函数.因为犙还可以表示为 ∑狀 犲2 ,即它是随机误差的平方和,这 犻 犻=1 个和当然越小越好,所以我们取使犙达到最小的犪和犫的值,作为截距和斜率的估计值. 下面利用成对样本数据求使犙取最小值的犪,犫. 记狓= 1 ∑狀 狓,狔= 1 ∑狀 狔.因为 狀 犻 狀 犻 犻=1 犻=1 108第八章 成对数据的统计分析∑狀 犙(犪,犫)= (狔-犫狓-犪) 2 犻 犻 犻=1 ∑狀 = [狔-犫狓-(狔-犫狓)+(狔-犫狓)-犪] 2 犻 犻 犻=1 ∑狀 = [(狔-狔)-犫(狓-狓)+(狔-犫狓)-犪] 2 犻 犻 犻=1 ∑狀 ∑狀 = [(狔-狔)-犫(狓-狓)] 2+2 [(狔-狔)-犫(狓-狓)]× 犻 犻 犻 犻 犻=1 犻=1 [(狔-犫狓)-犪]+狀[(狔-犫狓)-犪] 2 , 注意到 ∑狀 [(狔-狔)-犫(狓-狓)](狔-犫狓-犪) 犻 犻 犻=1 ∑狀 =(狔-犫狓-犪) [(狔-狔)-犫(狓-狓)] 犻 犻 犻=1 ∑狀 ∑狀 =(狔-犫狓-犪)[ (狔-狔)-犫 (狓-狓)] 犻 犻 犻=1 犻=1 =(狔-犫狓-犪)[(狀狔-狀狔)-犫(狀狓-狀狓)] =0, 所以 ∑狀 犙(犪,犫)= [(狔-狔)-犫(狓-狓)] 2+狀(狔-犫狓-犪) 2. 犻 犻 犻=1 上式右边各项均为非负数,且前狀项与犪无关.所以,要使犙取到最小值,狀(狔- 犫狓-犪) 2 的值应为0,即犪=狔-犫狓.此时 ∑狀 犙(犪,犫)= [(狔-狔)-犫(狓-狓)] 2 犻 犻 犻=1 ∑狀 ∑狀 ∑狀 =犫2 (狓-狓) 2-2犫 (狓-狓)(狔-狔)+ (狔-狔) 2. 犻 犻 犻 犻 犻=1 犻=1 犻=1 上式是关于犫的二次函数,因此要使犙取得最小值,当且仅当犫的取值为 ∑狀 (狓-狓)(狔-狔) 犻 犻 ^ 犫=犻=1 . ∑狀 (狓-狓) 2 犻 犻=1 综上,当犪,犫的取值为 烄 ∑狀 (狓-狓)(狔-狔) 犻 犻 ^ 犫=犻=1 , 烅 ∑狀 (狓-狓) 2 (2) 犻 犻=1 ^ 烆^犪=狔-犫狓 时,犙达到最小. 第八章 成对数据的统计分析 109我们将^狔= ^ 犫狓+^犪称为犢关于狓的经验回归方程,也称 经验回归函数或经验回归公式,其图形称为经验回归直线. ?这里的 “二乘”是 这种求经验回归方程的方法叫做最小二乘法 ,求得的^ 犫,^ 犪 ? 平方的意思. 叫做犫,犪的最小二乘估计 (leastsquaresestimate). 对于表8.21中的数据,利用公式 (2)可以计算出 ^ 犫=0.839,^犪=28.957,得到儿子身高犢关于父亲身高狓的 经验回归方程为 ^狔=0.839狓+28.957, 相应的经验回归直线如图8.26所示. 利用统计软件求经验  /cm 回归模型,Excel软件可 以用数据分析中的 “回 190 185 归”分析工具或通过 “添 180 加趋势线”得到;R软件 175 170 y?=0.839x+28.957 可以用函数lm计算参数 165 的最小二乘估计结果. 160 160 165 170 175 180 185  /cm 图8.26  当狓=176时,^狔≈177.如果一位父亲的身高为176cm,他儿子长大成人后的身 高一定是177cm吗?为什么? 显然不一定,因为还有其他影响儿子身高的因素,父亲 身高不能完全决定儿子身高.不过,我们可以作出推测,当 英国著名统计学家高 父亲身高为176cm时,儿子身高一般在177cm左右. 尔顿 (F.Galton,1822— 实际上,如果把这所学校父亲身高为176cm的所有儿 1911)把这种后代的身高 子身高作为一个子总体,那么177cm是这个子总体的均值 向中间值靠近的趋势称为 的估计值. “回归现象”.后来,人们 这里的经验回归方程^狔=0.839狓+28.957,其斜率可以 把由一个或多个变量的变 化去推测另一个变量的变 解释为父亲身高每增加1cm,其儿子身高平均增加0.839cm. 化的方法称为回归分析. 分析模型还可以发现,高个子父亲有生高个子儿子的趋势, 但一群高个子父亲的儿子们的平均身高要低于父亲们的平均 身高,例如 根据模型,父亲身高 狓=185(cm),则^狔=184.172(cm); 为多少时,长大成人的儿 矮个子父亲有生矮个子儿子的趋势,但一群矮个子父亲的儿 子的平均身高与父亲的一 子们的平均身高要高于父亲们的平均身高,例如 样?你怎么看这个判断? 110第八章 成对数据的统计分析狓=170(cm),则^狔=171.587(cm). 对于响应变量犢,通过观测得到的数据称为观测值,通过经验回归方程得到的^狔称为 预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可 以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为 残差分析. 例如,对于表8.21中的第6个观测,父亲身高为172cm,其儿子身高的观测值为 狔=176(cm), 6 预测值为 ^狔=0.839×172+28.957=173.265(cm), 6 残差为 176-173.265 2.735(cm). ! 类似地,可以得到其他的残差,如表8.22所示. 表822 编号 父亲身高/cm 儿子身高观测值/cm 儿子身高预测值/cm 残差/cm 1 174 176 174.943 1.057 2 170 176 171.587 4.413 3 173 170 174.104 -4.104 4 169 170 170.748 -0.748 5 182 185 181.655 3.345 6 172 176 173.265 2.735 7 180 178 179.977 -1.977 8 172 174 173.265 0.735 9 168 170 169.909 0.091 10 166 168 168.231 -0.231 11 182 178 181.655 -3.655 12 173 172 174.104 -2.104 13 164 165 166.553 -1.553 14 180 182 179.977 2.023 为了使数据更加直观,用父亲身高作为横坐标,残差作为纵坐标,可以画出残差图, 如图8.27所示.  /cm 5 4 3 2 1  /cm 0 160 165 170 175 180 185 -1 -2 -3 -4 -5 图8.27 第八章 成对数据的统计分析 111观察表8.22可以看到,残差有正有负,残差的绝对值最大是4.413.观察残差的散 点图可以发现,残差比较均匀地分布在横轴的两侧.说明残差比较符合一元线性回归模型 的假定,是均值为0、方差为σ2 的随机变量的观测值.可见,通过观察残差图可以直观判 断模型是否满足一元线性回归模型的假设. 一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差 分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.  观察图8.28中四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机 误差的假定?   100 1500 1000 50 500 0 0 -500 -50 -1000 -100 -1500 0 20 40 60 80 100 0 20 40 60 80 100  (1) (2)  200  150 4 3 100 2 50 1 0 0 -50 -1 -100 -2 -150 -3 -200 -4 0 10 20 30 40 50 60 70 80 90 100 0 100 200 300 400 500 600 700 800 900 1000 (3) (4) 图8.28 四种类型的残差图 根据一元线性回归模型中对随机误差的假定,残差应是均值为0、方差为σ2 的随机 变量的观测值.在图8.28中,图 (1)显示残差与观测时间有线性关系,应将时间变量 纳入模型;图 (2)显示残差与观测时间有非线性关系,应在模型中加入时间的非线性函 数部分;图 (3)说明残差的方差不是一个常数,随观测时间变大而变大;图 (4)的残差 比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内.可见,在图8.28中, 只有图 (4)满足一元线性回归模型对随机误差的假设. 112第八章 成对数据的统计分析 1.对一元线性回归模型参数犪和犫的估计中,有人认为:“估计方法不止一种,根据不同的样本观测数 据到直线 ‘整体接近程度’的定义,可以得到参数犪和犫不同的估计,只要 ‘整体接近程度’定义 合理即可.”你觉得这个说法对吗? 2.假如女儿身高狔(单位:cm)关于父亲身高狓(单位:cm)的经验回归方程为^狔=0.81狓+25.82. 已知父亲身高为175cm,请估计女儿的身高. 3.根据8.1.1节表8.11中的数据,建立人体的脂肪含量关于年龄的经验回归方程,画出残差图,描 述残差图的特点. 4.计算表8.22中的所有残差之和,你能发现什么规律? 5.假设变量狓与变量犢的狀对观测数据为 (狓,狔),(狓,狔),…,(狓,狔),两个变量满足一元 1 1 2 2 狀 狀 线性回归模型 烄犢=犫狓+犲, 烅 烆犈(犲)=0,犇(犲)=σ2. 请写出参数犫的最小二乘估计. 例 经验表明,一般树的胸径 (树的主干在地面以上1.3m处的直径)越大,树就 越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与 胸径之间的关系时,某林场收集了某种树的一些数据 (表8.23),试根据这些数据建立 树高关于胸径的经验回归方程. 表823 编号 1 2 3 4 5 6 胸径/cm 18.1 20.1 22.2 24.4 26.0 28.3 树高/m 18.8 19.2 21.0 21.0 22.1 22.1 编号 7 8 9 10 11 12 胸径/cm 29.6 32.4 33.7 35.7 38.3 40.2 树高/m 22.4 22.6 23.0 24.3 23.9 24.7 分析:因为要由胸径预测树高,所以要以成对样本数据的胸径为横坐标、树高为纵坐 标画出散点,进而得到散点图,再根据散点图推断树高与胸径是否线性相关.如果是,再 利用公式 (2)计算出^ 犫,^犪即可. 解:以胸径为横坐标、树高为纵坐标作 /m 26 散点图,得到图8.29. 24 22 在图8.29中,散点大致分布在一条从 20 左下角到右上角的直线附近,表明两个变量 18 线性相关,并且是正相关,因此可以用一元 16 15 20 25 30 35 40 45  /cm 线性回归模型刻画树高与胸径之间的关系. 图8.29 第八章 成对数据的统计分析 113用犱表示胸径,犺表示树高,根据最小二乘法,计算可得经验回归方程为 ^ 犺=0.2493犱+14.84, 相应的经验回归直线如图8.210所示. /m 26 24 22 h?=0.249 3d+14.84 20 18 16 15 20 25 30 35 40 45  /cm 图8.210 根据经验回归方程,由表8.23中胸径的数据可以计算出树高的预测值 (精确到 0.1)以及相应的残差,如表8.24所示. 表824 编号 胸径/cm 树高观测值/m 树高预测值/m 残差/m 1 18.1 18.8 19.4 -0.6 2 20.1 19.2 19.9 -0.7 3 22.2 21.0 20.4 0.6 4 24.4 21.0 20.9 0.1 5 26.0 22.1 21.3 0.8 6 28.3 22.1 21.9 0.2 7 29.6 22.4 22.2 0.2 8 32.4 22.6 22.9 -0.3 9 33.7 23.0 23.2 -0.2 10 35.7 24.3 23.7 0.6 11 38.3 23.9 24.4 -0.5 12 40.2 24.7 24.9 -0.2 以胸径为横坐标,残差为纵坐标,作残差图,得到图8.211.  /m 1.0 0.5 0.0 15 20 25 30 35 40 45  /cm -0.5 -1.0 图8.211 观察残差表和残差图,可以看到,残差的绝对值最大是0.8,所有残差分布在以横轴 为对称轴、宽度小于2的带状区域内.可见经验回归方程较好地刻画了树高与胸径的关 系,我们可以根据经验回归方程由胸径预测树高. 114第八章 成对数据的统计分析问题 人们常将男子短跑100m的高水平运动员称为 “百米飞人”.表8.25给出了 1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数 据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程. 表825 编号 1 2 3 4 5 6 7 8 年份 1896 1912 1921 1930 1936 1956 1960 1968 纪录/s 11.80 10.60 10.40 10.30 10.20 10.10 10.00 9.95 以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图,得到图 8.212.  s 12.0 11.5 11.0 10.5 10.0 9.5 1890 1900 1910 1920 1930 1940 1950 1960 1970  图8.212 在图8.212中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型 建立经验回归方程. 用犢表示男子短跑100m的世界纪录,狋表示纪录产生的年份,利用一元线性回归 模型 烄犢=犫狋+犪+犲, 烅 烆犈犲()=0,犇犲()=σ2 来刻画世界纪录和世界纪录产生年份之间的关系.根据最小二乘法,由表中的数据得到经 验回归方程为 ^狔=-0.02033743狋+49.76913031. ① 1 将经验回归直线叠加到散点图,得到图8.213. Ys 12.0 11.5 11.0 10.5 10.0 9.5 1890 1900 1910 1920 1930 1940 1950 1960 1970 t 图8.213 第八章 成对数据的统计分析 115 从图8.213中可以看到,经验回归方程①较好地刻画了散点的变化趋势.请再 仔细观察图形,你能看出其中存在的问题吗? 以经验回归直线为参照,可以发现经验回归方程的不足之处,以及散点的更为精细的 分布特征.例如,第一个世界纪录所对应的散点远离经验回归直线,并且前后两时间段中 的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方.这说明散 点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律, 即成对样本数据呈现出明显的非线性相关的特征.  你能对模型进行修改,以使其更好地反映散点的分布特征吗? 仔细观察图8.212,可以发现散点更趋向于落在中间下凸且递减的某条曲线附近. 回顾已有的函数知识,可以发现函数狔=-ln狓的图象具有类似的形状特征.注意到 100m短跑的第一个世界纪录产生于1896年,因此可以认为散点是集中在曲线 狔=犳(狋)=犮+犮ln(狋-1895) 1 2 的周围,其中犮和犮为未知的参数,且犮<0. 1 2 2 用上述函数刻画数据变化的趋势,这是一个非线性经验回归函数,其中犮,犮 是待 1 2 定参数.现在问题转化为如何利用成对数据估计参数犮和犮. 1 2 为了利用一元线性回归模型估计参数犮 和犮,我们引进一个中间变量狓,令狓= 1 2 ln(狋-1895).通过狓=ln(狋-1895),将年份变量数据进行变换,得到新的成对数据 (精 确到0.01),如表8.26所示. 表826 编号 1 2 3 4 5 6 7 8 狓 0.00 2.83 3.26 3.56 3.71 4.11 4.17 4.29 犢/s 11.80 10.60 10.40 10.30 10.20 10.10 10.00 9.95 如果表8.26对应的散点图呈现出很强的线性相关特征,我们就可以借助一元线性回 归模型和新的成对数据,对参数犮和犮作出估计,进而可以得到犢关于狋的非线性经验 1 2 回归方程. 在直角坐标系中画出表8.26中成对数据的散点图,如图8.214所示,散点的分布 呈现出很强的线性相关特征. 116第八章 成对数据的统计分析Ys 12.0 11.5 11.0 10.5 10.0 9.5 0 1 2 3 4 5 图8.214 因此,用一元线性回归模型 烄犢=犮狓+犮+狌, 2 1 烅 烆犈(狌)=0,犇(狌)=δ2 拟合表8.26中的成对数据,得到经验回归方程 ^狔=-0.4264398狓+11.8012653, () 2 再在图8.214中画出 ()式所对应的经验回归直线,得到图8.215. Ys 12.0 11.5 11.0 10.5 10.0 9.5 0 1 2 3 4 5 图8.215 图8.215表明,经验回归方程 ()对于表8.26中的成对数据具有非常好的拟合 精度.将图8.215与图8.213进行对比,可以发现狓和犢之间的线性相关程度比原始样 本数据的线性相关程度强得多. 将狓=ln狋(-1895)代入 ()式,得到由创纪录年份预报世界纪录的经验回归方程 ^狔=-0.4264398ln(狋-1895)+11.8012653. ② 2 在同一直角坐标系中画出成对数据散点图、非线性经验回归方程②的图象 (蓝色)以 及经验回归方程①的图象 (红色),如图8.216所示.我们发现,散点图中各散点都非常 靠近②的图象,表明非线性经验回归方程②对于原始数据的拟合效果远远好于经验回归 方程①. 下面通过残差来比较这两个经验回归方程对数据刻画的好坏.在表8.25中,用狋表 犻 示编号为犻的年份数据,用狔 表示编号为犻的纪录数据,则经验回归方程①和②的残差 犻 计算公式分别为 ^犲=狔+0.02033743狋-49.76913031,犻=1,2,…,8; 犻 犻 犻 ^狌=狔+0.4264398ln狋( -1895)-11.8012653,犻=1,2,…,8. 犻 犻 犻 第八章 成对数据的统计分析 117Ys 12.0 11.5 11.0 10.5 10.0 9.5 1890 1900 1910 1920 1930 1940 1950 1960 1970 t 图8.216 两个经验回归方程的残差 (精确到0.001)如表8.27所示.观察各项残差的绝对值, 发现经验回归方程②远远小于①,即经验回归方程②的拟合效果要远远好于①. 表827 编号 1 2 3 4 5 6 7 8 狋 1896 1912 1921 1930 1936 1956 1960 1968 ^犲 0.591 -0.284 -0.301 -0.218 -0.196 0.111 0.092 0.205 ^狌 -0.001 0.007 -0.012 0.015 -0.018 0.052 -0.021 -0.022 在一般情况下,直接比较两个模型的残差比较困难,因为在某些散点上一个模型的残 差的绝对值比另一个模型的小,而另一些散点的情况则相反.可以通过比较残差的平方和 来比较两个模型的效果.由 ∑8 ∑8 犙 = ^犲( )2≈0.669,犙 = ^(狌)2≈0.004, 1 犻 2 犻 犻=1 犻=1 可知犙 小于犙.因此在残差平方和最小的标准下,非线性回归模型 2 1 烄犢=犮ln狋(-1895)+犮+狌, 2 1 烅 烆犈(狌)=0,犇(狌)=δ2 的拟合效果要优于一元线性回归模型的拟合效果. 也可以用决定系数犚2 来比较两个模型的拟合效果,犚2 的计算公式为 ∑狀 (狔-^狔)2 犻 犻 犚2=1-犻=1 . ∑狀 (狔-狔)2 犻 犻=1 在犚2 表达式中, ∑狀 (狔-狔) 2 与经验回归方程无关,残差平方和∑狀 (狔-^狔)2 与经验回 犻 犻 犻 犻=1 犻=1 归方程有关.因此犚2 越大,表示残差平方和越小,即模型的拟合效果越好;犚2 越小,表 示残差平方和越大,即模型的拟合效果越差. 由表8.27容易算出经验回归方程①和②的犚2 分别约为0.7325和0.9983,因此经 验回归方程②的刻画效果比经验回归方程①的好很多. 另外,我们还可以用新的观测数据来检验模型的拟合效果.事实上,我们还有1968 年之后的男子短跑100m世界纪录数据,如表8.28所示. 118第八章 成对数据的统计分析表828 编号 9 10 11 12 13 14 狋 1983 1988 1991 1991 1994 1996 犢/s 9.93 9.92 9.90 9.86 9.85 9.84 编号 15 16 17 18 19 20 狋 1999 2005 2007 2008 2008 2009 犢/s 9.79 9.77 9.74 9.72 9.69 9.58 在散点图8.212中,绘制表8.28中的散点 (绿色),再添加经验回归方程①所对应 的经验回归直线 (红色),以及经验回归方程②所对应的经验回归曲线 (蓝色),得到图 8.217.显然绿色散点分布在蓝色经验回归曲线的附近,远离红色经验回归直线,表明经 验回归方程②对于新数据的预报效果远远好于①. Y/s 12.0 11.5 11.0 10.5 10.0 9.5 9.0 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000 2010 t 图8.217  在上述问题情境中,男子短跑100m世界纪录和纪录产生年份之间呈现出对数关 系,能借助于样本相关系数刻画这种关系的强弱吗? 在使用经验回归方程进行预测时,需要注意下列问题: (1)经验回归方程只适用于所研究的样本的总体.例如,根据我国父亲身高与儿子身 高的数据建立的经验回归方程,不能用来描述美国父亲身高与儿子身高之间的关系.同 样,根据生长在南方多雨地区的树高与胸径的数据建立的经验回归方程,不能用来描述北 方干旱地区的树高与胸径之间的关系. (2)经验回归方程一般都有时效性.例如,根据20世纪80年代的父亲身高与儿子身 高的数据建立的经验回归方程,不能用来描述现在的父亲身高与儿子身高之间的关系. (3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范 围内,经验回归方程的预报效果会比较好,超出这个范围越远,预报的效果越差. (4)不能期望经验回归方程得到的预报值就是响应变量的精确值.事实上,它是响应 变量的可能取值的平均值. 第八章 成对数据的统计分析 119 1.在回归分析中,分析残差能够帮助我们解决哪些问题? 2.1997—2006年我国的国内生产总值 (GDP)的数据 (摘自 《中国统计年鉴—2017》)如下: 年份 GDP/亿元 年份 GDP/亿元 1997 79715.0 2002 121717.4 1998 85195.5 2003 137422.0 1999 90564.4 2004 161840.2 2000 100280.1 2005 187318.9 2001 110863.1 2006 219438.5 (1)作GDP和年份的散点图,根据该图猜想它们之间的关系可以用什么模型描述; (2)建立年份为解释变量,GDP为响应变量的一元线性回归模型,并计算残差; (3)根据你得到的一元线性回归模型,预测2017年的GDP,看看你的预测值与实际的GDP的误差 是多少; (4)你认为这个模型能较好地刻画GDP和年份的关系吗?请说明理由. (5)随着时间的发展,又收集到2007—2016年的GDP数据 (摘自 《中国统计年鉴—2017》)如下: 年份 GDP/亿元 年份 GDP/亿元 2007 270232.3 2012 540367.4 2008 319515.5 2013 595244.4 2009 349081.4 2014 643974.0 2010 413030.3 2015 689052.1 2011 489300.6 2016 744127.2 建立年份 (1997—2016)为解释变量,GDP为响应变量的经验回归方程,并预测2017年的 GDP,与实际的GDP误差是多少?你能发现什么? 习题8.2  1.如果散点图中所有的散点都落在一条斜率为非0的直线上,请回答下列问题: (1)解释变量和响应变量的关系是什么? (2)犚2 是多少? 2.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集 数据如表所示. 120第八章 成对数据的统计分析零件数/个 10 20 30 40 50 60 70 80 90 100 加工时间/min 62 68 75 81 89 95 102 108 115 122 (1)画出散点图; (2)建立加工时间关于零件数的一元线性回归模型; (3)关于加工零件的个数与加工时间,你能得出什么结论? 3.根据8.1.2节例2中某城市居民年收入与A商品销售额的数据: (1)建立A商品销售额关于居民年收入的一元线性回归模型; (2)如果这座城市居民的年收入为40亿元,估计A商品的销售额是多少.  4.人口问题是关乎国计民生的大问题.下表是1949—2016年我国的人口总数 (摘自 《中国统计 年鉴—2017》). 年份 总人口/万人 年份 总人口/万人 年份 总人口/万人 1949 54167 1982 101654 2000 126743 1950 55196 1983 103008 2001 127627 1951 56300 1984 104357 2002 128453 1955 61465 1985 105851 2003 129227 1960 66207 1986 107507 2004 129988 1965 72538 1987 109300 2005 130756 1970 82992 1988 111026 2006 131448 1971 85229 1989 112704 2007 132129 1972 87177 1990 114333 2008 132802 1973 89211 1991 115823 2009 133450 1974 90859 1992 117171 2010 134091 1975 92420 1993 118517 2011 134735 1976 93717 1994 119850 2012 135404 1977 94974 1995 121121 2013 136072 1978 96259 1996 122389 2014 136782 1979 97542 1997 123626 2015 137462 1980 98705 1998 124761 2016 138271 1981 100072 1999 125786 (1)画出散点图; (2)建立总人口数关于年份的一元线性回归模型; (3)直接用上面建立的回归模型预测2020年的我国人口总数,得到的结果合理吗?为什么? 第八章 成对数据的统计分析 1215.在某地区的一段时间内观测到的不小于某震级狓的地震数犖的数据如下表: 震级狓 3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4 4.6 4.8 5.0 地震数犖283812038014795106957641 5502 3842 2698 1919 1356 973 震级狓 5.2 5.4 5.6 5.8 6.0 6.2 6.4 6.6 6.8 7.0 地震数犖 746 604 435 274 206 148 98 57 41 25 试建立经验回归方程表示二者之间的关系,该模型对预测地震有帮助吗?   6.生活中有许多变量之间的关系是值得我们去研究的.例如,数学成绩、物理成绩和化学成绩两 两之间是相关的吗?哪两个学科成绩之间相关性更大,你能解释其中的原因吗?语文成绩对数 学成绩有影响吗?等等,请用你们班的某次考试成绩,研究它们之间的关系.如果它们之间有 关系,请建立统计模型进行分析.   回归与相关 回归分析法和相关分析法是统计学中的两种重要方法,前者用于由一个或多 个变量的变化去推测另一个变量的变化,后者研究随机变量间的相关关系,它们 是由英国科学家高尔顿创立的. 高尔顿的科研兴趣十分广泛,在地理学、气象学、统计学、心理学、人类学 等众多领域都有建树.他在遗传学的研究中发现了一个令人困惑的问题.通常, 高个子的人会和高个子的人结婚,矮个子的人会和矮个子的人结婚,而人类的遗 传是把上一代的优势性状传递给下一代.这样,在人群中,高个子、矮个子的比 例都应逐渐增多,而中等个子的比例应逐渐下降.但事实并非如此,为什么呢? 这个问题一直萦绕在他的心头. 1875年,为了确定豌豆尺寸的遗传规律,他将自己精心挑选的490粒甜豌豆按 照尺寸大小分成7组,在7个不同地区各种植70粒 (每组10粒).豌豆成熟后,他 仔细测量了新豌豆 (子代)的尺寸,并与豌豆种子 (母代)的尺寸进行比较.数据 分析发现,母代尺寸大的子代尺寸较大,母代尺寸小的子代尺寸也较小.但无论尺 寸大小,都有子代向母代的平均值 (7种尺寸豌豆的平均值)靠近的趋势. 122第八章 成对数据的统计分析这一结论在遗传学上是否具有普遍性呢?能否用它来解释人的个子高矮的遗 传现象呢?为此,在1885年,高尔顿随机选取了205对夫妇及其928个成年子女 的身高数据进行研究.由于男女身高存在差异,他采用女子身高乘1.08的方法将 女子身高换算成男子身高.他将父母的平均身高称为 “中亲身高”,用 犪×1.08+犫 2 进行计算,其中犪为母亲身高,犫为父亲身高.记中亲身高为犡 (母代变量),子 女身高为犢(子代变量),分析犡和犢的数据,他惊奇地发现,犡和犢的平均值 均为173.4cm.在此基础上,他还发现:当中亲身高大于平均值时,他们的子女 相对较高,但与父母相比还是矮一些,例如,当中亲身高为181.6cm时,他们 子女的平均身高仅为177.5cm ;当中亲身高小于平均值时,他们的子女相对较 矮,但比父母又要高一些,例如,当中亲身高为166.4cm时,他们子女的平均 身高为169.4cm.这表明,子女身高有向平均值 “回归”的倾向.1886年,高尔 顿将这一研究成果写成了论文 《遗传身高向平均身高的回归》,文中正式引入了 “回归”这个概念.1888年,高尔顿发表了统计史上第一篇有关相关系数值的论 文,文中用到了一种用图形估计相关系数值的方法. 高尔顿提出的回归和相关思想是开创性的,但他的工作做得还不够彻底.后 来,埃奇沃思 (F.Y.Edgeworth,1845—1926)和皮尔逊 (K.Pearson,1857— 1936)等一批学者加入到研究中来,使回归和相关理论得到了完善与发展.埃奇 沃思不仅给出了常见的样本相关系数的公式,还赋予 “回归”以纯数学的意义, 为这一方法的广泛应用奠定了基础.皮尔逊则系统整理和完善了当时的已有成果, 用极大似然法对相关系数的估计问题做了改进,并把相关和回归方法运用到生物 测量数据,推动了这一方法在生物领域的应用. 回归和相关方法的创立,为统计方法增添了重要的工具,推动了统计学的应 用和发展,标志着统计学描述时代的结束和推断时代的开始.随着时代的发展, “回归”一词的内涵得到了极大扩展,它可以泛指在任何情况下自变量与因变量 之间的统计关系;回归分析、相关分析也在科学研究的各个方面得到广泛应用, 成为探索变量之间关系的重要方法. 请你进一步查阅资料,了解回归与相关的发展和应用. 第八章 成对数据的统计分析 12383 列联表与独立性检验 前面两节所讨论的变量,如人的身高、树的胸径、树的 高度、短跑100m世界纪录和创纪录的时间等,都是数值变 量.数值变量的取值为实数,其大小和运算都有实际含义. 在现实生活中,人们经常需要回答一定范围内的两种现 象或性质之间是否存在关联性或相互影响的问题.例如,就 读不同学校是否对学生的成绩有影响,不同班级学生用于体 育锻炼的时间是否有差别,吸烟是否会增加患肺癌的风险, 等等.本节将要学习的独立性检验方法为我们提供了解决这 类问题的方案. 在讨论上述问题时,为了表述方便,我们经常会使用一 种特殊的随机变量,以区别不同的现象或性质,这类随机变 量称为分类变量.分类变量的取值可以用实数表示,例如, 学生所在的班级可以用1,2,3等表示,男性、女性可以用 1,0表示,等等.在很多时候,这些数值只作为编号使用, 并没有通常的大小和运算意义.本节我们主要讨论取值于 {0,1}的分类变量的关联性问题. 831 ! :;"#<=>? 如何利用统计数据判断一对分类变量之间是否具有关联性呢?对于这样的统计问题, 有时可以利用普查数据,通过比较相关的比率给出问题的准确回答,但在大多数情况下, 需要借助概率的观点和方法.我们先看下面的具体问题. 问题 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对 本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查.全校学 生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼. 你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗? 这是一个简单的统计问题.最直接的解答方法是,比较经常锻炼的学生在女生和男生 中的比率.为了方便,我们设 经常锻炼的女生数 经常锻炼的男生数 犳= ,犳= . 0 女生总数 1 男生总数 那么,只要求出犳 和犳 的值,通过比较这两个值的大小,就可以知道女生和男生在锻 0 1 124第八章 成对数据的统计分析炼的经常性方面是否有差异.由所给的数据,经计算得到 331 473 犳= ≈0.633,犳= ≈0.787. 0 523 1 601 由 犳-犳≈0.787-0.633=0.154 1 0 可知,男生经常锻炼的比率比女生高出15.4个百分点,所以该校的女生和男生在体育锻 炼的经常性方面有差异,而且男生更经常锻炼. 上面的问题还可以通过建立一个古典概型,使用条件概率的语言,给出另外一种解答 方法.用Ω表示该校全体学生构成的集合,这是我们所关心的对象的总体.考虑以Ω为样 本空间的古典概型,并定义一对分类变量犡和犢如下:对于Ω中的每一名学生,分别令 烄0, 该生为女生, 烄0, 该生不经常锻炼, 犡=烅 犢=烅 烆1, 该生为男生, 烆1, 该生经常锻炼. 我们希望通过比较条件概率犘(犢=1犡=0)和犘(犢=1犡=1)回答上面的问题.按照条件 概率的直观解释,如果从该校女生和男生中各随机选取一名学生,那么该女生属于经常锻 炼群体的概率是犘(犢=1犡=0),而该男生属于经常锻炼群体的概率是犘(犢=1犡=1). 因此,“性别对体育锻炼的经常性没有影响”可以描述为 犘(犢=1犡=0)=犘(犢=1犡=1); 而 “性别对体育锻炼的经常性有影响”可以描述为 犘(犢=1犡=0)≠犘(犢=1犡=1). 为了清楚起见,我们用表格整理数据,如表8.31所示. 表831 单位:人 锻炼 性别 合计 不经常 (犢=0) 经常 (犢=1) 女生 (犡=0) 192 331 523 男生 (犡=1) 128 473 601 合计 320 804 1124 我们用{犡=0,犢=1}表示事件{犡=0}和{犢=1}的积事件,用{犡=1,犢=1}表示事 件{犡=1}和{犢=1}的积事件.根据古典概型和条件概率的计算公式,我们有 狀(犡=0,犢=1) 331 犘(犢=1犡=0)= = ≈0.633, 狀(犡=0) 523 狀(犡=1,犢=1) 473 犘(犢=1犡=1)= = ≈0.787. 狀(犡=1) 601 由犘(犢=1犡=1)大于犘(犢=1犡=0)可以作出判断,在该校的学生中,性别对体育锻炼 的经常性有影响,即该校的女生和男生在体育锻炼的经常性方面存在差异,而且男生更经 常锻炼. 第八章 成对数据的统计分析 125在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类 统计,并做成表格加以保存.我们将如表8.31这种形式的数据统计表称为2×2列联表 (contingencytable).2×2列联表给出了成对分类变量数据的交叉分类频数.以表8.31 为例,它包含了犡和犢的如下信息:最后一行的前两个数分别是事件{犢=0}和{犢=1}中 样本点的个数;最后一列的前两个数分别是事件{犡=0}和{犡=1}中样本点的个数;中间 的四个格中的数是表格的核心部分,给出了事件{犡=狓,犢=狔}(狓,狔=0,1)中样本点 的个数;右下角格中的数是样本空间中样本点的总数. 在上面问题的两种解答中,使用了学校全部学生的调查 将所关心的对象的全 数据,利用这些数据能够完全确定解答问题所需的比率和条 体看成古典概型的样本空 件概率.然而,对于大多数实际问题,我们无法获得所关心 间,就可以用概率的语言 的全部对象的数据,因此无法准确计算出有关的比率或条件 刻画相关的问题,进而用 概率.在这种情况下,上述古典概型和条件概率的观点为我 频率稳定于概率的原理推 们提供了一个解决问题的思路.比较简单的做法是利用随机 断问题的答案.很多统计 方法都是基于这种思想建 抽样获得一定数量的样本数据,再利用随机事件发生的频率 立起来的. 稳定于概率的原理对问题答案作出推断. 例1 为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名 学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学 生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异. 解:用Ω表示两所学校的全体学生构成的集合.考虑以Ω为样本空间的古典概型. 对于Ω中每一名学生,定义分类变量犡和犢如下: 烄0, 该生来自甲校, 烄0, 该生数学成绩不优秀, 犡=烅 犢=烅 烆1, 该生来自乙校, 烆1, 该生数学成绩优秀. 我们将所给数据整理成表8.32. 表832 单位:人 数学成绩 学校 合计 不优秀 (犢=0) 优秀 (犢=1) 甲校 (犡=0) 33 10 43 乙校 (犡=1) 38 7 45 合计 71 17 88 表8.32是关于分类变量犡和犢的抽样数据的2×2列联表:最后一行的前两个数分 别是事件{犢=0}和{犢=1}的频数;最后一列的前两个数分别是事件{犡=0}和{犡=1}的频 数;中间的四个格中的数是事件{犡=狓,犢=狔}(狓,狔=0,1)的频数;右下角格中的数 是样本容量.因此,甲校学生中数学成绩不优秀和数学成绩优秀的频率分别为 126第八章 成对数据的统计分析33 10 ≈0.7674和 ≈0.2326; 43 43 乙校学生中数学成绩不优秀和数学成绩优秀的频率分别为 38 7 ≈0.8444和 ≈0.1556. 45 45 我们可以用等高堆积条形图直观地展示上述计算结果,如图8.31所示. 1.0  0.8  利用统计软件画条形 0.6 图,Excel软件可以通过 插入图表,从图表类型中 0.4 选取条形图;R软件可以 0.2 用函数barplot. 0.0   图8.31 在图8.31中,左边的蓝色和红色条的高度分别是甲校学生中数学成绩不优秀和数学 成绩优秀的频率;右边的蓝色和红色条的高度分别是乙校学生中数学成绩不优秀和数学成 绩优秀的频率.通过比较发现,两个学校学生抽样数据中数学成绩优秀的频率存在差异, 甲校的频率明显高于乙校的频率.依据频率稳定于概率的原理,我们可以推断 犘(犢=1犡=0)>犘(犢=1犡=1).也就是说,如果从甲校和乙校各随机选取一名学生, 那么甲校学生数学成绩优秀的概率大于乙校学生数学成绩优秀的概率.因此,可以认为两 校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高.  你认为 “两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的? 事实上,“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差 异推断出来的.有可能出现这种情况:在随机抽取的这个样本中,两个频率间确实存在差 异,但两校学生的数学成绩优秀率实际上是没有差别的.这就是说,样本的随机性导致了 两个频率间出现较大差异.在这种情况下,我们推断出的结论就是错误的.后面我们将讨 论犯这种错误的概率大小问题.  1.成语 “名师出高徒”可以解释为 “知名老师指导出高水平学生的概率较大”,即老师的名声与学生的 水平之间有关联.你能举出更多的描述生活中两种属性或现象之间关联的成语吗? 第八章 成对数据的统计分析 1272.例1中的随机抽样数据是否足够确定与犡和犢有关的所有概率和条件概率?为什么? 3.根据有关规定,香烟盒上必须印上 “吸烟有害健康”的警示语.那么 (1)吸烟是否对每位烟民一定会引发健康问题? (2)有人说吸烟不一定引起健康问题,因此可以吸烟.这种说法对吗? 4.假设在本小节 “问题”中,只是随机抽取了44名学生,按照性别和体育锻炼情况整理为如下的列联表: 单位:人 锻炼 性别 合计 不经常 经常 女生 5 15 20 男生 6 18 24 合计 11 33 44 (1)据此推断性别因素是否影响学生锻炼的经常性; (2)说明你的推断结论是否可能犯错,并解释原因. 832 ! @A.BC 前面我们通过2×2列联表整理成对分类变量的样本观测数据,并根据随机事件频率 的稳定性推断两个分类变量之间是否有关联.对于随机样本而言,因为频率具有随机性, 频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误 的可能性会较大.因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推 断的概率有一定的控制或估算. 考虑以Ω为样本空间的古典概型.设犡和犢为定义在Ω上,取值于{0,1}的成对分 类变量.我们希望判断事件{犡=1}和{犢=1}之间是否有关联.注意到{犡=0}和{犡=1}, {犢=0}和{犢=1}都是互为对立事件,与前面的讨论类似,我们需要判断下面的假定关系 犎:犘(犢=1犡=0)=犘(犢=1犡=1) 0 是否成立,通常称犎 为零假设或原假设 (nullhypothesis).这里,犘(犢=1犡=0)表示从 0 {犡=0}中随机选取一个样本点,该样本点属于{犡=0,犢=1}的概率;而犘(犢=1犡=1)表 示从{犡=1}中随机选取一个样本点,该样本点属于{犡=1,犢=1}的概率. 由条件概率的定义可知,零假设犎 等价于 0 犘(犡=0,犢=1) 犘(犡=1,犢=1) = , 犘(犡=0) 犘(犡=1) 或 犘(犡=0,犢=1)犘(犡=1)=犘(犡=1,犢=1)犘(犡=0). ① 注意到{犡=0}和{犡=1}为对立事件,于是犘(犡=0)=1-犘(犡=1).再由概率的性质, 我们有 128第八章 成对数据的统计分析犘(犡=0,犢=1)=犘(犢=1)-犘(犡=1,犢=1). 由此推得①式等价于 犘(犡=1)犘(犢=1)=犘(犡=1,犢=1). 因此,零假设犎 等价于{犡=1}与{犢=1}独立. 0 根据已经学过的概率知识,下面的四条性质彼此等价: {犡=0}与{犢=0}独立;{犡=0}与{犢=1}独立; {犡=1}与{犢=0}独立;{犡=1}与{犢=1}独立. 如果这些性质成立,我们就称分类变量犡和犢独立.这相当于下面四个等式成立: 犘(犡=0,犢=0)=犘(犡=0)犘(犢=0); 犘(犡=0,犢=1)=犘(犡=0)犘(犢=1); ② 犘(犡=1,犢=0)=犘(犡=1)犘(犢=0); 犘(犡=1,犢=1)=犘(犡=1)犘(犢=1). 因此,我们可以用概率语言,将零假设改述为 犎:分类变量犡和犢独立. 0 假定我们通过简单随机抽样得到了犡和犢的抽样数据列联表,如表8.33所示. 表833 犢 犡 合计 犢=0 犢=1 犡=0 犪 犫 犪+犫 犡=1 犮 犱 犮+犱 合计 犪+犮 犫+犱 狀=犪+犫+犮+犱 表8.33是关于分类变量犡和犢的抽样数据的2×2列 联表:最后一行的前两个数分别是事件{犢=0}和{犢=1}的 对于随机样本,表 频数;最后一列的前两个数分别是事件{犡=0}和{犡=1}的 8.33中的频数犪,犫,犮, 频数;中间的四个数犪,犫,犮,犱是事件{犡=狓,犢=狔}(狓, 犱都是随机变量,而表 狔=0,1)的频数;右下角格中的数狀是样本容量. 8.32中的相应数据是这些 随机变量的一次观测结果.  如何基于②中的四个等式及列联表8.33中的数据,构造适当的统计量,对成对 分类变量犡和犢是否相互独立作出推断? 在零假设犎 成立的条件下,根据频率稳定于概率的原理,由②中的第一个等式,我 0 们可以用概率犘(犡=0)和犘(犢=0)对应的频率的乘积 第八章 成对数据的统计分析 129(犪+犫)(犪+犮) 狀2 估计概率犘(犡=0,犢=0),而把 (犪+犫)(犪+犮) 狀 视为事件 {犡=0,犢=0}发生的频数的期望值 (或预期值).这样,该频数的观测值犪和 (犪+犫)(犪+犮) 期望值 应该比较接近. 狀 综合②中的四个式子,如果零假设犎 成立,下面四个量的取值都不应该太大: 0 (犪+犫)(犪+犮) (犪+犫)(犫+犱) 犪- ,犫- , 狀 狀 ③ (犮+犱)(犪+犮) (犮+犱)(犫+犱) 犮- ,犱- . 狀 狀 反之,当这些量的取值较大时,就可以推断犎 不成立. 0 显然,分别考虑③中的四个差的绝对值很困难.我们需要找到一个既合理又能够计算 分布的统计量,来推断犎 是否成立.一般来说,若频数的期望值较大,则③中相应的差 0 的绝对值也会较大;而若频数的期望值较小,则③中相应的差的绝对值也会较小.为了合 理地平衡这种影响,我们将四个差的绝对值取平方后分别除以相应的期望值再求和,得到 如下的统计量: 烄 (犪+犫)(犪+犮)烌2 烄 (犪+犫)(犫+犱)烌2 犪- 犫- 烆 狀 烎 烆 狀 烎 χ= + + 2 (犪+犫)(犪+犮) (犪+犫)(犫+犱) 狀 狀 烄 (犮+犱)(犪+犮)烌2 烄 (犮+犱)(犫+犱)烌2 犮- 犱- 烆 狀 烎 烆 狀 烎 + . (犮+犱)(犪+犮) (犮+犱)(犫+犱) 狀 狀 该表达式可化简为 狀(犪犱-犫犮)2 χ= . (1) 2 (犪+犫)(犮+犱)(犪+犮)(犫+犱) 统计学家建议,用随机变量χ取值的大小作为判断零假设犎 是否成立的依据,当它 2 0 比较大时推断犎 不成立,否则认为犎 成立.那么,究竟χ大到什么程度,可以推断 2 0 0 犎 不成立呢?或者说,怎样确定判断χ大小的标准呢? 2 0 根据小概率事件在一次试验中不大可能发生的规律,上面的想法可以通过确定一个与 犎 相矛盾的小概率事件来实现.在假定犎 的条件下,对于有放回简单随机抽样,当样 0 0 本容量狀充分大时,统计学家得到了χ的近似分布.忽略χ的实际分布与该近似分布的误 2 2 差后,对于任何小概率值α,可以找到相应的正实数狓,使得下面关系成立: α 犘(χ 2 ≥狓)=α. ④ α 130第八章 成对数据的统计分析我们称狓为α的临界值,这个临界值就可作为判断χ大小的标准.概率值α越小,临界值 2 α 狓越大.当总体很大时,抽样有、无放回对χ的分布影响较小.因此,在应用中往往不严 2 α 格要求抽样必须是有放回的. 由④式可知,只要把概率值α取得充分小,在假设犎 成立的情况下,事件{χ≥狓}是 2 0 α 不大可能发生的.根据这个规律,如果该事件发生,我们就可以推断犎 不成立.不过这 0 个推断有可能犯错误,但犯错误的概率不会超过α. 基于小概率值α的检验规则是: 当χ≥狓时,我们就推断犎 不成立,即认为犡和犢不独立,该推断犯错误的概率 2 α 0 不超过α; 当χ<狓时,我们没有充分证据推断犎 不成立,可以认为犡和犢独立. 2 α 0 这种利用χ的取值推断分类变量犡和犢是否独立的方法称为χ独立性检验,读作 2 2 “卡方独立性检验”,简称独立性检验 (testofindependence). 表8.34给出了χ独立性检验中5个常用的小概率值和相应的临界值. 2 表834 α 0.1 0.05 0.01 0.005 0.001 狓 2.706 3.841 6.635 7.879 10.828 α 例如,对于小概率值α=0.05,我们有如下的具体检验规则: (1)当χ≥狓 =3.841时,我们推断犎 不成立,即认为犡和犢不独立,该推断 2 0.05 0 犯错误的概率不超过0.05; (2)当χ<狓 =3.841时,我们没有充分证据推断犎 不成立,可以认为犡和犢独立. 2 0.05 0 例2 依据小概率值α=0.1的χ独立性检验,分析例1中的抽样数据,能否据此推 2 断两校学生的数学成绩优秀率有差异? 解:零假设为 犎:分类变量犡与犢相互独立,即两校学生的数学成绩优秀率无差异. 0 根据表8.32中的数据,计算得到 88×(33×7-10×38)2 χ= ≈0.837<2.706=狓 . 2 43×45×71×17 0.1 根据小概率值α=0.1的χ独立性检验,没有充分证据推断犎 不成立,因此可以认 2 0 为犎 成立,即认为两校的数学成绩优秀率没有差异. 0  例1和例2都是基于同一组数据的分析,但却得出了不同的结论,你能说明其中 的原因吗? 第八章 成对数据的统计分析 131事实上,如前所述,例1只是根据一个样本的两个频率间存在差异得出两校学生数学 成绩优秀率有差异的结论,并没有考虑由样本随机性可能导致的错误,所以那里的推断依 据不太充分.在例2中,我们用χ独立性检验对零假设犎 进行了检验.通过计算,发现 2 0 χ≈0.837小于α=0.1所对应的临界值2.706,因此认为没有充分证据推断犎 不成立, 2 0 所以接受犎,推断出两校学生的数学成绩优秀率没有显著 0 差异的结论.这个检验结果意味着,抽样数据中两个频率的 当我们接受零假设 差异很有可能是由样本随机性导致的.因此,只根据频率的 犎 时,也可能犯错误. 0 差异得出两校学生的数学成绩优秀率有差异的结论是不可靠的. 我们不知道犯这类错误的 由此可见,相对于简单比较两个频率的推断,用χ 2 独立 概率狆的大小,但是知 性检验得到的结果更理性、更全面,理论依据也更充分. 道,若α越大,则狆越小. 例3 某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的 方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治 愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试 根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好. 解:零假设为 犎:疗法与疗效独立,即两种疗法效果没有差异. 0 将所给数据进行整理,得到两种疗法治疗数据的列联表,如表8.35所示. 表835 单位:人 疗效 疗法 合计 未治愈 治愈 甲 15 52 67 乙 6 63 69 合计 21 115 136 根据列联表中的数据,经计算得到 136×(15×63-52×6) 2 χ= ≈4.881<7.879=狓 . 2 67×69×21×115 0.005 根据小概率值α=0.005的独立性检验,没有充分证据推断犎 不成立,因此可以认 0 为犎 成立,即认为两种疗法效果没有差异. 0  在表8.35中,若对调两种疗法的位置或对调两种疗效的位置,则表达式 (1) 中犪,犫,犮,犱的赋值都会相应地改变.这样做会影响χ取值的计算结果吗? 2 132第八章 成对数据的统计分析例4 为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法, 调查了9965人,得到成对样本观测数据的分类统计结果,如表8.36所示.依据小概率 值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险. 表836 单位:人 肺癌 吸烟 合计 非肺癌患者 肺癌患者 非吸烟者 7775 42 7817 吸烟者 2099 49 2148 合计 9874 91 9965 解:零假设为 犎:吸烟与患肺癌之间无关联. 0 根据列联表中的数据,经计算得到 9965×(7775×49-42×2099) 2 χ= ≈56.632>10.828=狓 . 2 7817×2148×9874×91 0.001 根据小概率值α=0.001的独立性检验,我们推断犎 不成立,即认为吸烟与患肺癌 0 有关联,此推断犯错误的概率不大于0.001. 根据表8.36中的数据计算,不吸烟者中不患肺癌和患肺癌的频率分别为 7775 42 ≈0.9946和 ≈0.0054; 7817 7817 吸烟者中不患肺癌和患肺癌的频率分别为 2099 49 ≈0.9772和 ≈0.0228. 2148 2148 由 0.0228 ≈4.2 0.0054 可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌的频率的4倍以上.于是, 根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌 的概率,即吸烟更容易引发肺癌. 总结上面的例子,应用独立性检验解决实际问题大致应包括以下几个主要环节: (1)提出零假设犎:犡和犢相互独立,并给出在问题中的解释. 0 (2)根据抽样数据整理出2×2列联表,计算χ的值,并与临界值狓比较. 2 α (3)根据检验规则得出推断结论. (4)在犡和犢不独立的情况下,根据需要,通过比较相应的频率,分析犡和犢间的 影响规律. 注意,上述几个环节的内容可以根据不同情况进行调整.例如,在有些时候,分类变 量的抽样数据列联表是问题中给定的. 第八章 成对数据的统计分析 133 独立性检验的思想类似于我们常用的反证法,你能指出二者之间的相同和不同之 处吗? 简单地说,反证法是在某种假设犎 之下,推出一个矛盾结论,从而证明犎 不成 0 0 立;而独立性检验是在零假设犎 之下,如果出现一个与犎 相矛盾的小概率事件,就推 0 0 断犎 不成立,且该推断犯错误的概率不大于这个小概率.另外,在全部逻辑推理正确的 0 情况下,反证法不会犯错误,但独立性检验会犯随机性错误. 独立性检验的本质是比较观测值与期望值之间的差异,由χ所代表的这种差异的大 2 小是通过确定适当的小概率值进行判断的.这是一种非常重要的推断方法,不仅有相当广 泛的应用,也开启了人类认识世界的一种新的思维方式.  1.对于例3中的抽样数据,采用小概率值α=0.05的独立性检验,分析乙种疗法的效果是否比甲种疗 法好. 2.根据同一抽查数据推断两个分类变量之间是否有关联,应用不同的小概率值,是否会得出不同的结 论?为什么? 3.为考察某种药物A对预防疾病B的效果,进行了动物试验,根据105个有放回简单随机样本的数 据,得到如下列联表: 单位:只 疾病B 药物A 合计 未患病 患病 未服用 29 15 44 服用 47 14 61 合计 76 29 105 依据α=0.05的独立性检验,分析药物A对预防疾病B的有效性. 4.从某学校获取了容量为400的有放回简单随机样本,将所得数学和语文期末考试成绩的样本观测数 据整理如下: 单位:人 语文成绩 数学成绩 合计 不优秀 优秀 不优秀 212 61 273 优秀 54 73 127 合计 266 134 400 依据α=0.05的独立性检验,能否认为数学成绩与语文成绩有关联? 134第八章 成对数据的统计分析习题8.3  1.为什么必须基于成对样本数据推断两个分类变量之间是否有关联? 2.为什么χ独立性检验方法不适用于普查数据? 2 3.等高堆积条形图在两个分类变量之间关联性的研究中能够起到什么作用? 4.对于已经获取的成对样本数据,检验结论 “两个变量之间有关联”的实际含义是什么?检验结 论 “两个变量之间没有关联”的实际含义又是什么?  5.为了研究高三年级学生的性别和身高是否大于170cm的关联性,调查了某中学所有高三年级 的学生,整理得到如下列联表: 单位:人 身高 性别 合计 低于170cm 不低于170cm 女 81 16 97 男 28 75 103 合计 109 91 200 请画出列联表的等高堆积条形图,判断该中学高三年级学生的性别和身高是否有关联.如果结 论是性别与身高有关联,请解释它们之间如何相互影响. 6.第5题中的身高变量是数值型变量还是分类变量?为什么? 7.从第5题的高三学生中获取容量为40的有放回简单随机样本,由样本数据整理得到如下列 联表: 单位:人 身高 性别 合计 低于170cm 不低于170cm 女 14 7 21 男 8 11 19 合计 22 18 40 (1)依据α=0.05的独立性检验,能否认为该中学高三年级学生的性别与身高有关联?解释所 得结论的实际含义. (2)得到的结论与第5题的一致吗?如果不一致,你认为原因是什么. 8.调查某医院一段时间内婴儿出生的时间和性别的关联性,得到如下的列联表: 第八章 成对数据的统计分析 135单位:人 出生时间 性别 合计 晚上 白天 女 24 31 55 男 8 26 34 合计 32 57 89 依据α=0.1的独立性检验,能否认为性别与出生时间有关联?解释所得结论的实际含义.   9.对例1列联表8.32中的数据,依据α=0.1的独立性检验,我们已经知道独立性检验的结论 是学校和成绩无关.如果表8.32中所有数据都扩大为原来的10倍,在相同的检验标准下,再 用独立性检验推断学校和数学成绩之间的关联性,结论还一样吗?请你试着解释其中的原因. 136第八章 成对数据的统计分析 +D )EFGHI         2f2  6D /J