当前位置:首页>文档>专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版

专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版

  • 2026-04-10 12:02:35 2026-04-10 12:01:20

文档预览

专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版
专题11统计-备战2019年高考数学(理)之纠错笔记系列(原卷版)_02高考数学_新高考复习资料_2022年新高考资料_2022年一轮复习各版本_1.新高考2022年高考数学一轮复习_原卷版

文档信息

文档格式
doc
文档大小
3.458 MB
文档页数
48 页
上传时间
2026-04-10 12:01:20

文档内容

易错点1 不能正确区分总体、样本、样本容量 为了了解2016年参加市运动会的240名运动员的身高情况,从中抽取40名运动员进行测量.下列说 法正确的是 A.总体是240名运动员 B.个体是每一名运动员 C.40名运动员的身高是一个个体 D.样本容量是40 【错解】选择A、B、C中的一个. 【错因分析】对于选项A、B,对总体、个体、样本的概念把握不准,误将考察的对象当作运动员;对于选项C,把 个体和样本混淆致误. 【试题解析】选D.根据统计的相关概念并结合题意可得,此题的总体、个体、样本这三个概念的考察对象都是 运动员的身高,而不是运动员,并且一个个体是指一名运动员的身高,选项A,B表达的对象都是运动员,选 项C未将个体和样本理解透彻.在这个问题中,总体是240名运动员的身高,个体是每名运动员的身高,样本 是40名运动员的身高,样本容量是40.因此选D. 【参考答案】D. 1.明确相关概念 对总体、个体、样本、样本容量的概念要熟练把握,要明确总体与样本的包含关系及样本与样本容量的区 别,如本例选项C,是对概念把握不准. 2.注意考察对象 解决考查总体、个体、样本、样本容量的概念问题时,关键是明确考察对象,根据相关的概念可知总体、个 体与样本的考察对象是相同的,如本例中选项A,B表达的对象都是运动员的身高而不是运动员.1.某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从中随机抽取了100名学生的成绩单, 就这个问题来说,下面说法中正确的是 A.1000名学生是总体 B.每名学生是个体 C.每名学生的成绩是所抽取的一个样本 D.样本的容量是100 【答案】D 【解析】根据总体、个体样本的概念知选项A、B表达的对象都是学生,而不是成绩,所以A、B都错误. 每名学生的成绩是所抽取的一个样本也是错的,应是每名学生的成绩是一个个体. D:样本的容量是100,正确. 故选:D. 【名师点睛】本题主要考查总体、个体与样本的概念,解决成立问题的关键是明确考查的对象,根据有关的 概念可得总体、个体与样本的考查对象是相同的,此题属于基础题. 易错点2 对随机抽样的概念理解不透彻 对于下列抽样方法: ①运动员从8个跑道中随机抽取1个跑道;②从20个零件中一次性拿出3个来检验质量;③某班50名学生,指 定其中成绩优异的2名学生参加一次学科竞赛;④为了保证食品安全,从某厂提供的一批月饼中,拿出一个检 查后放回,再拿一个检查,反复5次,拿了5个月饼进行检查.其中,属于简单随机抽样的是_______.(把正确的序 号都填上) 【错解】②③④ 【错因分析】对简单随机抽样的概念理解不透彻. 【试题解析】对于②,一次性拿出3个来检验质量,违背简单随机抽样特征中的“逐个”抽取;对于③,指定其中 成绩优异的2名学生,不满足等可能抽样的要求;对于④,不满足不放回抽样的要求.故填①. 【参考答案】①1.简单随机抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等. 2.应用简单随机抽样应注意的问题: (1)一个抽样试验能否用抽签法,关键看两点: 一是抽签是否方便; 二是号签是否易搅匀. 一般地,当总体容量和样本容量都较小时可用抽签法. (2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个 或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去. (3)简单随机抽样需满足: ①被抽取的样本总体的个体数有限; ②逐个抽取; ③是不放回抽取; ④是等可能抽取. 2.某班50名学生中有30名男生,20名女生,用简单随机抽样抽取1名学生参加某项活动,则抽到女生的可能 性为 A.40% B.50% C.60% D. 【答案】A 【解析】在简单随机抽样中,由于每个个体被抽到的可能性是相等的,所以抽到一名女生的可能性为 ,故选A. 简单随机抽样在抽样过程中每一个个体被抽取的机会都相等(随机抽样的等可能性).若样本容量为n,总体的个体数为N,则用简单随机抽样时,每一个个体被抽到的可能性都是 ,体现了这种抽样方法的客观性和 公平性. 易错点3 对系统抽样的特点理解不到位 从2003名学生中抽取一个容量为40的样本,应如何抽取? 【错解】将2003名学生按0001到2003编上号;将号码随机分成40份,每一份再用抽签法随机抽取一名学生, 即得到了一个容量为40的样本. 【错因分析】由于2003不能被40整除,误以为只能用简单随机抽样进行抽取,对两种抽样方法的特点理解不 到位. 【试题解析】先将2003名学生按0001到2003编上号,利用随机数表法从中剔除3名学生,再对剩余的2000名 学生重新从0001到2000编号,按编号顺序分成40组,每组50人,先在第一组中用抽签法抽出某一号,如0006, 依次在其他组抽取0056,0106,…,1956,这样就得到了一个容量为40的样本. 【参考答案】见试题解析 1.当总体容量较大,总体可以分为均匀的几个部分时,用系统抽样较为合理,但当总体容量除以样本容量不是 整数时,要先在总体中剔除部分个体. 2.系统抽样的操作步骤: 第一步编号:先将总体的N个个体编号; 第二步分段:确定分段间隔k,对编号进行分段,当 (n是样本容量)是整数时,取k= ; 第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k); 第四步获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号 ,再加k得 到第3个个体编号 ,依次进行下去,直到获取整个样本.系统抽样是等距抽样,用系统抽样法抽取样本,当 不为整数时,取 ,即先从总体中用简单随机 抽样的方法剔除(N-nk)个个体,且剔除多余的个体不影响抽样的公平性. 3.滴滴公司为了调查消费者对滴滴打车出行的真实评价,采用系统抽样方法从2000人中抽取100人做问卷 调查,为此将他们随机编号1,2, ,2000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为 9,抽到的100人中,编号落入区间 的人做问卷 ,编号落入区间 的人做问卷 ,其余的人 做问卷 ,则抽到的人中,做问卷 的人数为 A. B. C. D. 【答案】B 【解析】若采用系统抽样方法从 人中抽取 人做问卷调查,则需要分为 组,每组20人,若第一组 抽到的号码为 ,则以后每组有抽取的号码分别为 , 所以抽到的号码构成以9为首项,20为公差的等差数列, 此等差数列的通项公式为 . 由题意可知,落在区间[1521,2000]的有: . 解得: .,所以 . 编号落入区间 的有 (人), 故选B. 【名师点睛】本题主要考查系统抽样的方法,属于简单题. 系统抽样适合抽取样本较多且个体之间没有明 显差异的总体,系统抽样最主要的特征是,所抽取的样本相邻编号等距离,可以利用等差数列的性质解答. 易错点4 对个体的入样可能性与抽样间隔理解不透中央电视台动画城节目为了对本周的热心观众给予奖励,要从2014名小观众中抽取50名幸运小观 众.先用简单随机抽样从2014人中剔除14人,剩下的2000人再按系统抽样方法抽取50人,则在2014人中, 每个人被抽取的可能性 A.均不相等 B.不全相等 C.都相等,且为 D.都相等,且为 【错解】选A或D. 【错因分析】对于选项A,误认为剔除14人,被抽取到的机会就不相等了,错选A; 对于选项D,认为被抽取的机会相等,但利用了剔除后的数据计算,错选D. 【试题解析】选C.因为在系统抽样中,若所给的总体个数不能被样本容量整除,则应先剔除几个个体,本题先 剔除14人,然后再分组,在剔除过程中,每个个体被剔除的机会相等.所以,每个个体被抽到的机会都相等, 均为=. 【参考答案】C. 1.明确系统抽样的操作要领 系统抽样操作要领是先将个体数较多的总体分成均衡的若干部分,然后按照预先指定的规则,从每一部 分中抽取一个个体,得到所需样本.系统抽样是等距离抽样,每个个体被抽到的机会是相等的,如本题中 2000人要分为50段. 2.对系统抽样合理分段 在系统抽样过程中,为将整个编号分段,要确定分段间隔,当在系统抽样过程中比值不是整数时,要从总 体中剔除一些个体(用简单随机抽样),但每一个个体入样的机会仍然相等.如本题中剔除14人后,每个人 被抽取的可能性不变. 4.为了了解参加某次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本, 那么从总体中应随机剔除的个体数目为 A.2 B.3 C.4 D.5 【答案】A 【解析】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除.∵1252=50×25+2, 故应从总体中随机剔除个体的数目是2, 故选A. 【名师点睛】本题考查系统抽样,系统抽样的步骤,得到总数不能被容量整除时,应从总体中随机剔除个体, 保证整除是解题的关键. 在系统抽样中,总体的每个个体被剔除的机会是均等的,也就是每个个体不被剔除的机会也是均等的,由 此可知在整个抽样过程中每个个体被抽到的机会仍然相等. 若计算为:每名志愿者被抽到的可能性为 , 则是错误的. 易错点5 忽略分层抽样的特点 某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为 36的样本,则适合的抽样方法是 A.简单随机抽样 B.系统抽样 C.直接运用分层抽样 D.先从老年人中剔除1人,再用分层抽样 【错解】因为总体由差异明显的三部分组成,所以考虑用分层抽样.因为总人数为28+54+81=163,样本容量为 36,由于按 抽样,无法得到整数解,因此考虑先剔除1人,将抽样比变为 .若从老年人中随机地剔除 1人,则老年人应抽取27× =6(人),中年人应抽取54× =12(人),青年人应抽取81× =18(人),从而组成容量 为36的样本.故选D.【错因分析】如果用简单随机抽样先从老年人中剔除1人的话,老年人被抽到的概率显然比其他人群小了,这 不符合随机抽样的特征——每个个体入样的几率相等.注意题干明确地说“先从老年人中剔除1人”,这和以 前做的从总体中随机剔除1人是不一样的. 【试题解析】直接运用分层抽样,老年人、中年人和青年人中应抽取的人数分别为 ×28≈6, ×54≈12, ×81≈18,故选C. 【方法点睛】分层抽样的一个很重要的特点是每个个体被抽到的概率是一样的.当按照比例计算出的值不是整 数时,一般是采用四舍五入的方法取值,若四舍五入后得到的样本容量与要求的不尽相同,则可根据问题的实 际意义适当处理,使之相同,这只是细节性问题,并未改变分层抽样的本质. 【参考答案】C. 1.分层抽样的前提和遵循的两条原则 (1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中 所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取. (2)遵循的两条原则: ①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原 则; ②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体 数量的比等于抽样比. 2.与分层抽样有关问题的常见类型及解题策略: (1)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本 (或总体)数. (2)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数. 进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本 差异要大,且互不重叠. (2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同. (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样. 5.某学校老师中, 型血有36人、型血有24人、型血有12人,现需要从这些老师中抽取一个容量为 的样 本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量减少一个,则在采用系统抽样 时,需要在总体中剔除2个个体,则样本容量 可能为 A. B. C. D. 【答案】C 【解析】因为采用系统抽样和分层抽样方法抽取,都不用剔除个体;所以样本容量 为 的 约数,因为 ,所以样本容量 为 的倍数,因此舍去B,D; 因为如果样本容量减少一个,则在采用系统抽样时,需要在总体中剔除2个个体,所以样本容量 为 的约数加1,因此选C. 在分层抽样中,确定抽样比k是抽样的关键.一般地,抽样比k= (N为总体容量,n为样本容量),再按抽样比k 在各层中抽取个体,就能确保抽样的公平性.在每层抽样时,应采用简单随机抽样或系统抽样的方法进行. 易错点6 误将频率分布直方图的纵坐标当作频率中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生, 对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右五个 小组的频率之比为5∶7∶12∶10∶6,则该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有多少人? 【错解】由图可知,第五小组的频率为0.5,所以第一小组的频率为0.5× . 所以该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000× =25000(人). 【错因分析】表面上看本题的回答似乎正确无误,其实答案是错误的,其错因在于没有看懂所提供的频率分布 直方图中的数据的含义,误将该频率分布直方图中的纵坐标(频率与组距的比)看成了频率,从而导致问题的解 答出错. 【试题解析】由图可知,第五小组的频率为0.5×0.3=0.15, 所以第一小组的频率为0.15× =0.125. 所以该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000×0.125=7500(人). 【参考答案】7500. 在数据的频率分布直方图中,纵坐标表示的是频率与组距的比, 每个小长方形的面积=组距×=频率,将频 率与组距的比错认成频率是初学者经常犯的错误之一,解题过程中要引起足够的重视. 1.画频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组;(4)列频率分布表; (5)画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值). 2.频率分布直方图的性质 (1)落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1. (2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形中的某个(些)点的横坐标即是众数; ②中位数左边和右边的小长方形的面积和是相等的; ③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边 中点的横坐标之和. 绘制频率分布直方图的注意事项: (1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照. (2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越 多,分组越多. (3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点. (4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数. (5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率. 6.我国是世界严重缺水的国家,城市缺水问题较为突出,某市政府为了鼓励居民节约用水,计划在本市试行 居民生活用水定额管理,即确定一个合理的居民月用水量标准(吨),用水量不超过 的部分按平价收费, 超过 的部分按议价收费,为了了解全市民月用水量的分布情况,通过抽样,获得了100位居民某年的月 用水量(单位:吨),将数据按照 分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的 值; (2)已知平价收费标准为 元/吨,议价收费标准为 元/吨,当 时,估计该市居民的月平均水费(. 同一组 中的数据用该组区间的中点值代替) 【答案】(1) ;(2)8.42. 【解析】(1)由频率分布直方图,可得 , 解得 . (2)设居民月用水量为 吨,相应的水费为 元, 则 即 , 由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下: 组号 1 2 3 4 5 6 7 8 9 分组 频率 0.04 0.08 0.15 0.20 0.26 0.15 0.06 0.04 0.02 根据题意,该市居民的月平均水费估计为 . 【名师点睛】本题考查的知识点是频率分布直方图,用样本估计总体,考查计算能力,难度不大,属于中档 题.有关频率分布直方图的考查常见的有:众数,中位数,平均数的计算等,众数即出现次数最多的数据, 中位数即最中间的数据,平均数即将所有数据加到一起,除以数据个数.频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式 呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度: (1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与总体的关 系,利用频率和等于1就可求出其他数据. (2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解. (3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解. 易错点7 对茎叶图的画法规则认识不够 某市对上下班情况作了抽样调查,上下班时间各抽测了12辆机动车的车速如下(单位:km/h): 上班时间:30,33,18,27,32,40,26,28,21,28,35,20; 下班时间:27,19,32,29,36,29,30,22,25,16,17,30.用茎叶图表示以上数据. 【错解】机动车行驶速度的茎叶图如图所示. 【错因分析】茎叶图对于重复出现的数据要重复记录. 【试题解析】机动车行驶速度的茎叶图如图.【方法点睛】画茎叶图需要注意,将每个数据分为茎和叶两部分,将表示茎的数字按照大小顺序由上到下排列, 在写每行叶子的时候,重复出现的数字应该按原次数写入叶子部位,不能只按一次写入. 【参考答案】见试题解析. 1.茎叶图将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从 上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序). 2.绘制茎叶图的关键是分清茎和叶.一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的数字 为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的特点 合理地选择茎和叶. 3.应用茎叶图对两组数据进行比较时,要从数据分布的对称性、中位数、稳定性等几方面来比较. 4.茎叶图只适用于样本数据较少的情况. 在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对 数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在 图中占据一个空间,如果数据很多,枝叶就会很长. 7.某大学为调查来自南方和北方的同龄大学生的身高差异,从2016级的年龄在18~19岁之间的大学生中 随机抽取了来自南方和北方的大学生各10名,测量他们的身高,量出的身高如下(单位:cm): 南方:158,170,166,169,180,175,171,176,162,163. 北方:183,173,169,163,179,171,157,175,184,166. (1)根据抽测结果,画出茎叶图,对来自南方和北方的大学生的身高作比较,写出统计结论. (2)设抽测的10名南方大学生的平均身高为x cm,将10名南方大学生的身高依次输入如图所示的程序框 图进行运算,问输出的s大小为多少?并说明s的统计学意义. (3)为进一步调查身高与生活习惯的关系,现从来自南方的这10名大学生中随机抽取2名身高不低于170 cm的学生,求身高为176 cm的学生被抽中的概率.【答案】(1)答案见解析;(2)答案见解析;(3) . 【解析】(1)茎叶图如图所示.统计结论(给出下述四个结论供参考):①北方大学生的平均身高大于南方大 学生的平均身高;②南方大学生的身高比北方大学生的身高更整齐;③南方大学生的身高的中位数为 169.5 cm,北方大学生的身高的中位数是172 cm; ④南方大学生的身高基本上是对称的,而且大多 数集中在均值附近,北方大学生的身高分布较为分散. (2)s=42.6,s表示10位南方大学生身高的方差,是描述身高的离散程度的量.s值越小,表示身高越整齐,s值 越大,表示身高越参差不齐. (3)记“身高为176 cm的学生被抽中”为事件A,从这10名南方大学生中抽出2名身高不低于170 cm的学 生有(170,171),(170,175),(170,176),(170,180),(171,175),(171,176),(171,180),(175,176),(175,180), (176,180),共10个基本事件,而事件A含有4个基本事件,故P(A)= = . 【名师点睛】这个题目考查了概率统计中的茎叶图的应用,以及如何根据条件进行评价;一般情况下高考易在 这道题目中出现新颖的背景及应用,面对这一特点,要静下心来认真读题,将题目中的问题,转化为我们熟知 的知识,应用数学工具来解决. 易错点8 忽略方差的统计意义 甲、乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t /km2): 品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙 9.4 10.3 10.8 9.7 9.8 若某村要从中引进一种冬小麦大量种植,给出你的建议.【错解】由题意得 (9.8+9.9+10.1+10+10.2)=10, (9.4+10.3+10.8+9.7+9.8)=10, 甲、乙两种冬小麦的平均产量都等于10,所以引进两种冬小麦的任意一种都可以. 【错因分析】上述错误在于只对两种冬小麦的平均产量做了比较,而忽略了对冬小麦产量稳定性的讨论. 【试题解析】由题意得 (9.8+9.9+10.1+10+10.2)=10, (9.4+10.3+10.8+9.7+9.8)=10, ×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02, ×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244, 甲、乙两种冬小麦的平均产量都等于10,且 , 所以产量比较稳定的为甲种冬小麦,推荐引进甲种冬小麦大量种植. 【方法点睛】平均数反映的是样本个体的平均水平,方差和标准差则反映了样本的波动、离散程度.对于形如 “谁发挥更好、谁更稳定、谁更优秀”之类的题目,除比较数据的平均值外,还应该比较方差或标准差的大小, 以作出更为公正、合理的判断. 【参考答案】推荐引进甲种冬小麦大量种植. 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的 平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况. 1.平均数与方差都是重要的数字特征,是对总体的一种简明的描述. 2.众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.平均数反映的是样本个体 的平均水平,众数和中位数则反映样本中个体的“重心”. 3.数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数 据中的极端值极为敏感.一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.方差和标准差反映了数据波动程度的大小.标准差、 方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定. 8.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水 稻品种的产量比较稳定. 品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙 9.4 10.3 10.8 9.7 9.8 【答案】甲种水稻的产量比较稳定 【解析】甲品种的样本平均数为10,样本方差为 [(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02. 乙品种的样本平均数也为10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.244. 因为0.244>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定. 易错点9 运用数字特征作评价时考虑不周 一次数学知识竞赛中,两组学生成绩如下: 分数 50 60 70 80 90 100 甲组 2 5 10 13 14 6 人数 乙组 4 4 16 2 12 12 经计算,已知两个组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说 明理由. 【错解】由于乙组90分以上的人数比甲组90分以上的人数多,所以乙组更优秀. 【错因分析】对一组数据进行分析的时候,应从平均数、众数、中位数、方差、极差等多个角度进行判断.【试题解析】(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数这一角度看,甲组成绩好些. (2) ×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100- 80)2]=172. 同理 =256. 因为 ,所以甲组的成绩比乙组的成绩稳定. (3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80 分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好. (4)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成 绩在高分段的人数多.同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好. 【参考答案】见解析. 1.平均数受个别极端数据(比其他数据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极端数 据时,平均数对总体估计的可靠性较差,往往用众数或中位数去估计总体.有时也采用剔除最大值与最小值 后所得的平均数去估计总体. 2.运用数字特征进行评价时,要全面考虑各数字特征的优缺点,从不同层面或两两综合进行评价,才能得到较 为可靠的估计. 9.全国大学生机器人大赛是由共青团中央,全国学联,深圳市人民政府联合主办的赛事,是中国最具影响力 的机器人项目,是全球独创的机器人竞技平台.全国大学生机器人大赛比拼的是参赛选手们的能力,坚持 和态度,展现的是个人实力以及整个团队的力量.2015赛季共吸引全国240余支机器人战队踊跃报名,这 些参赛战队来自全国六大赛区,150余所高等院校,其中不乏北京大学,清华大学,上海交大,中国科大, 西安交大等众多国内顶尖高校,经过严格筛选,最终由111支机器人战队参与到2015年全国大学生机器 人大赛的激烈角逐之中,某大学共有“机器人”兴趣团队1000个,大一、大二、大三、大四分别有100, 200,300,400个,为挑选优秀团队,现用分层抽样的方法,从以上团队中抽取20个团队. (1)应从大三抽取多少个团队?(2)将20个团队分为甲、乙两组,每组10个团队,进行理论和实践操作考试(共150分),甲、乙两组的分 数如下: 甲:125,141,140,137,122,114,119,139,121,142 乙:127,116,144,127,144,116,140,140,116,140 从甲、乙两组中选一组强化训练,备战机器人大赛.从统计学数据看,若选择甲组,理由是什么?若选择乙 组,理由是什么? 【答案】(1)6个团队;(2)见解析. 【解析】(1)由题知,大三团队个数占总团队数的 , 则用分层抽样的方法,应从大三中抽取 个团队. (2)甲组数据的平均数 ,乙组数据的平均数 , 甲组数据的方差 ,乙组数据的方差 , 选甲队理由:甲、乙两队平均数相差不大,且 ,甲组成绩波动小. 选乙队理由: ,且乙队中不低于140分的团队多,在竞技比赛中,高分团队获胜的概率大. 本题考查分层抽样的方法,平均数、方差的计算方法以及应用,考查用样本的数据特征估计总体的数据特征 的方法,考查运算求解能力和数据处理能力,考查运用基本知识分析解决实际问题的能力. 平均数:能较好地反映一组数据的总体平均水平,但易受少数极端值的影响; 方差:反映数据的波动程度,方差值越大,数据的波动越大. 易错点10 弄错回归方程中 , 的位置某班5名学生的数学和物理成绩如下表: (1)画出散点图. (2)求物理成绩y对数学成绩x的线性回归方程. 【错解】(1)散点图如图所示: (2)计算得 , , , , 所以 , . 所以y对x的线性回归方程是 . 【错因分析】错解中回归方程记忆错误,应为 . 【试题解析】(1)散点图如图所示:(2)计算得 , , , , 所以 , . 所以y对x的线性回归方程是 . 【参考答案】 . 由回归直线方程得到的预报值不是预报变量的精确值,事实上,它是预报变量的可能取值的平均值. 1.求回归直线方程的一般步骤: (1)作出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈条状分布,即是否 在一条直线附近,从而判断两变量是否具有线性相关关系. (2)当两变量具有线性相关关系时,求回归系数 ,写出回归直线方程.(3)根据方程进行估计. 2.不要受前面学习的直线方程的影响,而将回归方程写为 ,实际上,回归方程应为 . 10. 是指空气中直径小于或等于 微米的颗粒物(也称可入肺颗粒物).为了探究车流量与 的浓 度是否相关,现采集到某城市周一至周五某一时间段车流量与 的数据如下表: 时间 周一 周二 周三 周四 周五 车流量 (万辆) 的浓度 (微克/立方米) (1)根据上表数据,请在所给的坐标系中画出散点图; (2)根据上表数据,用最小二乘法求出 关于 的线性回归方程 ; (3)若周六同一时间段的车流量是 万辆,试根据(Ⅱ)求出的线性回归方程,预测此时 的浓度为 多少(保留整数)? 参考公式:由最小二乘法所得回归直线的方程是: , , . 其中 , 称为样本点的中心. 【答案】(1)见解析;(2) ;(3)37. 【解析】(1)散点图如下图所示.(2) , , , , , , 故 关于 的线性回归方程是: . (3)当 时, , 所以可以预测此时 的浓度约为 . 回归系数 的含义是: (1) 代表x每增加一个单位,y的平均增加单位数,而不是增加单位数. (2)当 >0时,两个变量呈正相关关系,含义为:x每增加一个单位,y平均增加 个单位数; 当 <0时,两个变量呈负相关关系,含义为:x每增加一个单位,y平均减少 个单位数.易错点11 忽略求回归方程的前提——线性相关 假设某设备的使用年限和所支出的维修费用如下表中统计资料所示: 使用年限x(年) 1 2 3 4 5 6 维修费用y(万元) 5.0 0.8 0.5 6.5 7.0 1.2 能否用线性回归模型描述两个变量间的关系? 【错解】求出相关的数据直接代入公式求得 =0.16, =2.94, 则线性回归方程为 =0.16x+2.94. 故可以用线性回归模型描述两个变量之间的关系. 【错因分析】没有先判断两个变量是否具有线性相关关系. 【试题解析】画出散点图,如图所示, 从散点图上看,这些点的分布几乎没有什么规则,故不能用线性回归模型描述两个变量之间的关系. 【参考答案】不能用线性回归模型描述两个变量之间的关系. 相关关系与函数关系的异同点: 共同点:二者都是指两个变量间的关系. 不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系. 1.两个变量x与y相关关系的判断方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;如果发现点的分布从整体上 看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响. (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断. 2.求线性回归方程时,先利用散点图判断两个变量是否存在线性相关关系,只有在两个变量之间存在线性相 关关系时,求出的线性回归方程才有意义.否则,如果两个变量之间不存在线性相关关系,即使由样本数据 求出回归方程,用其估计和预测的结果也是不可信的. 11.在一次抽样调查中测得样本的5个样本点数值如下表: x 0.25 0.5 1 2 4 y 16 12 5 2 1 试建立y与x之间的回归方程. 【答案】 . 【解析】由数值表可作散点图如图所示: 根据散点图可知y与x近似地呈反比例函数关系,设y=,令t=,则y=kt,原数据变为:t 4 2 1 0.5 0.25 y 16 12 5 2 1 由置换后的数值表作散点如图所示: 由散点图可以看出y与t呈近似的线性相关关系.列表如下: i t y ty i i i i 1 4 16 64 16 256 2 2 12 24 4 144 3 1 5 5 1 25 4 0.5 2 1 0.25 4 5 0.25 1 0.25 0.0625 1 ∑ 7.75 36 94.25 21.3125 430 所以 =1.55, =7.2, 所以 , , 所以 . 所以y与x的回归方程是 .若两变量间的关系不是线性相关关系,应观察分析其散点图,找出拟合函数,通过变量代换再作线性回归. 如果本题直接如下求解: ∵==1.55,==7.2, =0.25×16+0.5×12+1×5+2×2+4×1=23, =0.252+0.52+12+22+42=21.3125, =162+122+52+22+12=430. ∴ . ,∴ =12.67-3.53x. 这种解法是错误的,原因是这两个变量之间不是线性相关关系.此类问题的解决,应先对两个变量间的相 关关系进行相关性检验,然后结合作出的散点图,选择适宜的回归方程. 易错点12 没有准确掌握公式中参数的含义 有甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表: 班级与成绩列联表: 优秀 不优秀 总计 甲班 10 35 45 乙班 7 38 45 总计 17 73 90试问能有多大把握认为“成绩与班级有关系”? 参考公式及数据: ,其中 . 0.05 0.01 0.005 0.001 3.841 6.635 7.879 10.828 【错解】计算得 的观测值为 , 因为56.86>6.635,所以有99%的把握认为“成绩与班级有关系”. 【错因分析】由于对2×2列联表中a、b、c、d的位置不清楚,在代入公式时代错了数值导致计算结果的错误. 【试题解析】计算得 的观测值为 , 因为0.653<3.841,所以没有充分证据认为“成绩与班级有关系”. 【参考答案】没有充分证据认为“成绩与班级有关系”. 独立性检验中,参数K2的公式复杂,计算量大,要弄清公式的特点,熟记公式,小心计算,避免粗心致误. 解决一般的独立性检验问题,首先由题目所给的2×2列联表确定a,b,c,d,n的值,然后代入随机变量 的计 算公式求出观测值k,将k与临界值k 进行对比,确定有多大的把握认为“两个分类变量有关系”. 0 列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结 论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而 不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性 结论,否则就可能对统计计算的结果作出错误的解释.12.高中生在被问及“家,朋友聚集的地方,个人空间”三个场所中“感到最幸福的场所在哪里?”这个问 题时,从中国某城市的高中生中,随机抽取了55人,从美国某城市的高中生中随机抽取了45人进行答 题.中国高中生答题情况是:选择家的占 、朋友聚集的地方占 、个人空间占 .美国高中生答题情况是: 朋友聚集的地方占 、家占 、个人空间占 .如下表: 在家里最幸福 在其它场所幸福 合计 中国高中生 美国高中生 合计 (1)请将 列联表补充完整;试判断能否有 的把握认为“恋家”与否与国别有关; (2)从被调查的不“恋家”的美国学生中,用分层抽样的方法选出4人接受进一步调查,再从4人中随 机抽取2人到中国交流学习,求2人中含有在“个人空间”感到幸福的学生的概率. 附: ,其中 . 0.050 0.025 0.010 0.001 3.841 5.024 6.635 10.828 【答案】(1)见解析(2) . 【解析】(1)由已知得 在家里最幸福 在其它场所幸福 合计 中国高中生 22 33 55 美国高中生 9 36 45 合计 31 69 100 ∴ , ∴有 的把握认为“恋家”与否与国别有关.(2)用分层抽样的方法抽出4人,其中在“朋友聚焦的地方”感到幸福的有3人,在“个人空间”感到幸福 的有1人,分别设为 . ∵ ,∴ . 设“含有在“个人空间”感到幸福的学生”为事件 , , ∴ .则 . 一、三种抽样方法 1.三种抽样方法的比较 类别 共同点 各自特点 相互联系 适用范围 简单随 总体中的个 从总体中逐个抽取 — 机抽样 数较少 是不放回 抽样,抽样 将总体均分成几部分,按 在起始部分抽样时, 总体中的个 系统抽样 过程中,每 事先确定的规则,在各部 采用简单随机抽样 数比较多 个个体被 分抽取 抽到的机 会(概率)相 各层抽样时,采用简 总体由差异 等 将总体分成几层,分层进 分层抽样 单随机抽样或者系统 明显的几部 行抽取 抽样 分组成 2.抽样方法的选取方法 (1)若总体由差异明显的几个层次组成,则选用分层抽样. (2)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样. 当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当总体容量较大,样 本容量也较大时宜用系统抽样. 利用系统抽样的两个关键步骤: (1)分组,当总体个数N能被样本容量n整除时,分为n个组,分段间隔k=;(2)获取样本用简单随机抽样在第一组抽取起始数s,通常把起始数s加上间隔k得到第2个个体编号(s+ k),再加上k得第3个个体编号(s+2k),依次进行下去,直到获取样本. 二、用样本估计总体 1.数字特征 (1)众数、中位数、平均数 数字特征 定义 与频率分布直方图的关系 众数 出现次数最多的数据 最高的小长方形中的某个(些)点的横坐标 将数据按大小依次排列,处在最中间位置的 中位数左边和右边的小长方形的面积和是 中位数 一个数据(或最中间两个数据的平均数) 相等的 每个小矩形的面积乘以小矩形底边中点的 平均数 样本数据的算术平均数 横坐标之和 (2)极差、方差和标准差 极差:即一组数据中最大值与最小值的差. 方差: . 标准差: . (3)性质 ①若 的平均数为 ,那么 的平均数为 . ②数据 与数据 的方差相等,即数据经过平移后方 差不变. ③若 的方差为s2,那么 的方差为 . 2.统计表 (1)频率分布的估计:频率分布是指各个小组数据在样本中所占比例的大小,可以用样本的频率分布估计 总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看 到样本的频率分布. (2)尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用样本来估计.由于样本是随机的,不同的样本得到的频率分布折线图不同;即使对于同一个样本,不同的分 组情况得到的频率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变化而变化的,因此 不能用样本的频率分布折线图得到准确的总体密度曲线. (3)估计总体分布的步骤是: ①选择适当的抽样方法从总体中抽取样本,即收集数据. ②利用样本数据画出统计图或计算数字特征. ③结合统计图分析样本取值的分布规律. ④用样本取值的分布规律估计总体分布,由于是用科学抽样抽取的样本,那么样本与总体取值的分布规 律近似,有时也可看成相同. ⑤利用总体分布解决有关问题. (4)各种统计表的优点与不足 优点 不足 频率分布表 表示数据较确切 分析数据分布的总体态势不方便 频率分布直 表示数据分布情况非常直观 原有的具体数据信息被抹掉了 方图 频率分布折 能反映数据的变化趋势 不能显示原有数据 线图 一是所有的信息都可以从这个茎叶图中得到;二 样本数据较多或数据位数较多时, 茎叶图 是茎叶图便于记录和表示,能够展示数据的分布 不方便表示数据 情况 频率分布表、频率分布直方图、频率分布折线图、总体密度曲线都是描述样本数据分布情况,估计总体频率 分布规律的,其联系如下: 三、变量间的相关关系 1.相关关系当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫做相关关系.即相关 关系是一种非确定性关系. 当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关; 当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关. 2.散点图 将样本中的n个数据点 描在平面直角坐标系中,所得图形叫做散点图. 从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在从 左上角到右下角的区域内,两个变量的相关关系为负相关. 具有正相关关系的两个变量的散点图如图1,具有负相关关系的两个变量的散点图如图2. 3.回归分析 如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直 线叫做回归直线. 回归直线对应的方程叫做回归直线方程(简称回归方程). 4.回归方程的求解 (1)求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小. 若变量x与y具有线性相关关系,有n个样本数据 ,则回归方程 中 , . 其中 , 称为样本点的中心.(2)线性回归模型 ,其中 称为随机误差,自变量 称为解释变量,因变量 称为预报变量. ①回归直线 必过样本点的中心 ,这个结论既是检验所求回归直线方程是否准确的依据, 也是求参数的一个依据. ②利用回归直线方程不但可以预测在x取某一个值时,y的估计值,同时也能知道x每增加1个单位, 的变化量. ③在回归直线方程中, 既表示直线的斜率,又表示自变量x的取值每增加一个单位时,函数y的改变 量. 5.相关系数 (1)样本相关系数r的计算公式 我 们 可 以 利 用 相 关 系 数 来 定 量 地 衡 量 两 个 变 量 之 间 的 线 性 相 关 关 系 , 计 算 公 式 为 . (2)样本相关系数r的性质 ① ; ②当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关; ③|r|越接近于1,表明两个变量的线性相关性越强; ④|r|越接近于0,表明两个变量的线性相关性越弱. 6.非线性回归分析 对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成线性回归问题,然后用线性回归 的方法进行研究. 在大量的实际问题中,所研究的两个变量不一定都呈线性相关关系,当两变量y与x不具有线性相关关系 时,要借助散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模 型,利用变量代换转化为线性函数关系,从而使问题得以解决.求非线性回归方程的步骤: ①确定变量,作出散点图. ②根据散点图,选择恰当的拟合函数. ③变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程. ④分析拟合效果:通过计算相关指数或画残差图来判断拟合效果. ⑤根据相应的变换,写出非线性回归方程. 7.刻画回归效果的方式 方式方法 计算公式 刻画效果 越接近于1,表示回归的效果越好 残差点比较均匀地落在水平的带状区域中, 称为相应于点 的 残差图 说明选用的模型比较合适,其中这样的带状 残差, 区域的宽度越窄,说明模型拟合精确度越高. 残差平方和 残差平方和越小,模型的拟合效果越好 四、独立性检验 1.独立性检验 利用随机变量 (也可表示为 ) (其中 为样本容量)来 判断“两个变量有关系”的方法称为独立性检验. 2.独立性检验的一般步骤 (1)根据样本数据列出 列联表; (2)计算随机变量 的观测值k,查下表确定临界值k: 0(3)如果 ,就推断“X与Y有关系”,这种推断犯错误的概率不超过 ;否则,就认为在犯 错误的概率不超过 的前提下不能推断“X与Y有关系”. (1)通常认为 时,样本数据就没有充分的证据显示“X与Y有关系”. (2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论, 因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计 计算的结果作出错误的解释. (3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断. 1.(2018年全国新课标I卷理)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更 好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得 到如下饼图: 则下面结论中不正确的是 A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 2.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃. 下面叙述不正确的是 A. 各月的平均最低气温都在0℃以上 B. 七月的平均温差比一月的平均温差大 C. 三月和十一月的平均最高气温基本相同 D. 平均最高气温高于20℃的月份有5个 3.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月 接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是 A.月接待游客量逐月增加 B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 4.某中学进行初中与高中各年级的期末考试,该校共有50个考场,每个考场有30个考生,每个考生的座位号 按1~30号随机编排,每个考场抽取座位号为18号考生的试卷进行评分,这种抽样方法是 A.简单随机抽样 B.系统抽样 C.分层抽样 D.分组抽样 5.对两个变量 进行线性回归分析,计算得到相关系数 ,则下列说法中正确的是 A. 与 正相关 B. 与 具有较强的线性相关关系C. 与 几乎不具有线性相关关系 D. 与 的线性相关关系还需进一步确定 6.福利彩票“双色球”中红色球的号码由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表 选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依 次选取两个数字,则选出来的第6个红色球的编号为 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 A.23 B.09 C.17 D.02 7.某疾病研究所想知道吸烟与患肺病是否有关,于是随机抽取1000名成年人调查是否吸烟及是否患有肺病, 得到2×2列联表,经计算得 ,已知在假设吸烟与患肺病无关的前提条件下, ,则该研究所可以 A.有95%以上的把握认为“吸烟与患肺病有关” B.有95%以上的把握认为“吸烟与患肺病无关” C.有99%以上的把握认为“吸烟与患肺病有关” D.有99%以上的把握认为“吸烟与患肺病无关” 8.某市疾病控制中心对某校高二学生进行了某项健康调查,调查的方法是采取分层抽样的方法抽取样本.我 校高二学生共有2000人,抽取了一个200人的样本,其中男生103人,请问该校共有女生 A.970人 B.1030人 C.997人 D.206人 9.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和 是 A.51 B.58 C.61 D.62 10.已知一组数据3,5,7,x,10的平均数为6,则这组数据的方差为A. B.6 C. D.5 11.采用系统抽样方法从1000人中抽取50人做问卷调查,为此将他们随机编号为1,2,…,1000,适当分组后在 第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间[1,400]的人做问卷A,编号 落入区间[401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为 A.12 B.13 C.14 D.15 12.为了全面推进素质教育,教育部门对某省500所中小学进行调研考评,考评分数在80以上(包括80分)的授 予“素质教育先进学校”称号,考评统计结果按[50,60),[60,70),[70,80),[80,90),[90,100]绘制成如图所示 的频率分布直方图,则应授予“素质教育先进学校”称号的学校的个数为 A.175 B.145 C.180 D.240 13.某厂家为了解销售轿车台数与广告宣传费之间的关系,得到如表所示的统计数据表:根据数据表可得回归 直线方程 其中 据此模型预测广告费用为9万元时,销售轿车台数为 广告费用 万元) 2 3 4 5 6 销售轿车 台数) 3 4 6 10 12 A.17 B.18 C.19 D.20 14.(2018年江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的 平均数为________.15.(2018年全国新课标Ⅲ)某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的 评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适 的抽样方法是________. 16.采用系统抽样的方法从800名学生中抽取50名学生进行视力检査.为此,将他们随机编号为1,2,3,…,800, 若在1 16号中随机抽到的号码数为7,则从33 48这16个号码数中应抽取的号码为________. 17.已知x,x,…,x 的标准差为10,则10x-1,10x-1,…,10x-1的标准差是________. 1 2 6 1 2 6 18.《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三 人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“仅有甲带了560钱,乙带了350钱,丙带了 180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出________钱(所得结果 四舍五入,保留整数). 19.为了判断高中二年级学生选修文科或理科是否与性别有关,现随机抽取50名学生,得到如下的2×2列联 表: 理科 文科 总计 男 13 10 23 女 7 20 27 总计 20 30 50 已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025,根据表中数据,可得有________的把握认为选修文科或理科 与性别有关. 20.(2018全国新课标III理)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种 新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工 人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min) 绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数 ,并将完成生产任务所需时间超过 和不超过 的 工人数填入下面的列联表: 超过 不超过 第一种生产方式第二种生产方式 (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附: , 21.某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均 用电量(单位:百千瓦时),将数据按 , , , , , 分成9组,制成了如图所 示的频率分布直方图. (1)求直方图中 的值; (2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦时的人数及每户居民月均 用电量的中位数;(3)政府计划对月均用电量在4百千瓦时以下的用户进行奖励,月均用电量在 内的用户奖励20 元/月,月均用电量在 内的用户奖励10元/月,月均用电量在 内的用户奖励2元/月.若该市共有 400万户居民,试估计政府执行此计划的年度预算. 22.(2018全国新课标II理)下图是某地区2000年至2016年环境基础设施投资额 (单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了 与时间变量 的两个线性回归模型.根据2000 年至2016年的数据(时间变量 的值依次为 )建立模型①: ;根据2010年至 2016年的数据(时间变量 的值依次为 )建立模型②: . (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.23.(2018全国新课标I)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头 50天的日用水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频数分布表 日用水量 频数 1 3 2 4 9 26 5 使用了节水龙头50天的日用水量频数分布表 日用水量 频数 1 5 13 10 16 5 (1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率; (3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据 所在区间中点的值作代表.) 24.(2017新课标I)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取 一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序 1 2 3 4 5 6 7 8零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 抽取次序 9 10 11 12 13 14 15 16 零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得 , , , ,其中 为抽取的第 个零件的尺寸, . (1)求 的相关系数 ,并回答是否可以认为这一天生产的零件尺寸不随生产过程 的进行而系统地变大或变小(若 ,则可以认为零件的尺寸不随生产过程的进行而系统地变大 或变小). (2)一天内抽检零件中,如果出现了尺寸在 之外的零件,就认为这条生产线在这一天的 生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查? (ⅱ)在 之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的 均值与标准差.(精确到0.01) 附:样本 的相关系数 , . 25.(2017新课标全国Ⅱ理科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽 取了100 个网箱,测量各箱水产品的产量(单位:kg).其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg,新养殖法的箱 产量不低于50kg”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关; 箱产量<50kg 箱产量≥50kg 旧养殖法 新养殖法 (3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附: ,26.“阿曼德比萨”是一个制作和外卖意大利比萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺 的销售额与店铺附近大学生人数的关系,随机抽取10个分店作为样本,得到数据如下: 店铺编号 附近大学生人数x/万人 季度销售额y/万元 1 0.2 5.8 2 0.6 10.5 3 0.8 8.8 4 0.8 11.8 5 1.2 11.7 6 1.6 13.7 7 2 15.7 8 2 16.9 9 2.2 14.9 10 2.6 20.2 (1)画出散点图,并判断x与y是否具有相关关系? (2)求回归直线方程,根据回归方程预测一个附近大学生人数为1万人的店铺的季度销售额; (3)若店铺的季度销售额低于10万元则亏损,试求附近大学生人数至少约多少人时才适合建店.________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________