文档内容
<="+?"#$%&!#;@AB!#* )!*+",-.0# 123.&’4 CDEFGF"" #+4H* 5"$%$$267$ .89:!;$%$$ %#$#%&’(#$$26 7<%=>’$.?@ ABC!; &’(#$$ 槡 % $# F"" #+ IJK! ,-./0!1"2 &% 341$%&2 142 243 5%%./-0,5!34) .6,-0!1 7-& LM!NOPQR1’($CDEFSIJKTUVWXYZ[ 39 书书书 书书书第 11 章 算法初步 ················································· 1"#$! !"!!#$%&’( "!! "%&’()*+#,,+-./#00+-.,#11 +-./#2’34!$5678+9:!;"#9:#;!#9:$ ;"#<=>?@ABCD8+% )*+,! EFG9:!;"A+%"###’’#’(#’$#")#"!#"*#& HFG9:#;!A+%!#’!#’"!#"& IJF+K#LEGMANO+P&% !Q#ABCNR+P’#%J7?@>ST67UP&+’#,8 +#FGI6V+P"!#!& HFG9:$;"A+"#-#’*#"!#!)#& UWG=>XY?@ABC+P"!% Z[\#]^_‘XYKA,7?@>ST67%a’)#9;"!% bc ’defg(KhGI7 "’()*+$A2Xi#jkl !! !!"#$"%& ’()*!""+,-# mn^opAqr#hGmIs2XA(tuv% ./01234+56 wmxy#+z{|p}~(cid:127)(cid:128)(cid:129)(cid:130)mI6fv#(cid:131)(cid:132)(cid:133)(cid:134)(cid:135) 789#:;<=> !!"#$"?@A# (cid:136)#(cid:137)(cid:138)(cid:139)% BCD:;EA>F ,nt(cid:140)1(cid:141)(cid:142)#0(cid:143)(cid:144)(cid:145)(cid:146)6(cid:147)# $%C# 1e(cid:148)(cid:149)D(cid:150)(cid:151)#9(cid:152)(cid:153)0jW)% IL(cid:127)A(cid:154)(cid:155)P%~!9(cid:156)WA;+(cid:157)\$)#(cid:158)\~#9(cid:156)W ;+(cid:157):"’#H(cid:158)\~$9(cid:156)WA;+(cid:157)\’##(cid:159)(cid:160)p¡’)#U¢ £’)#AR+#I⁄U)(cid:139)(cid:156)XY?@ABC+P"!% Iƒ2XA›~uvfifl¡<67((cid:176)§|– #!"!#$"# "!"#%$!# $!"$&$" AD8+u’ 40 书书书 书书书第 11 章 算法初步 ················································· 1"#$%&’()*+,-!./01’23!"456(! 7!"""#809’:2""#"$";"%!$%&!"#%!$%&"" $%!$%"<=>!%!?@ABC$DE"%’"#%!"$%’F GHIJK"LC$DEMNOPQ$RJK"S!TU("VC$ DEHIJKI"SWX!’Y& Z[\],](( ’)0^* ](( ’) _‘a! +,’ &% +,+-( .,+ $%&! /,+ $%&" 0,+ $% 1%%234561!.,’74&/,!74&0,’ 28645!+ 94& 41 书书书第 11 章 算法初步 ················································· 1"!!#$% !"#$%&’()*+ !,-./"012.345#678 9:;#<,-.=>?@AB4CDEF?@#GHIJ>KLE F?@M$NOP=>?@Q4R3STIJ#UVWXST#YZ ’[\]^_‘’.01>! a"bcdefg#eh345.fi&-! "!!’,-!!""#""$"%#$%K %%##&j./.012# ^kZ%&%"& &!’!!%"#%##!!#"###!!%"(!!#""%# )?@ %%##&R,-.=>?@#^_R#’%$##%&%"$ l?@ %%##&.m+%&"#no!!%&""$%%&()**$p !!%&""(!!#""%qrs.=>?@R %%&"##^_R#’%&"$ %&"#%&%"$ l?@ %%&"##&.m+%&+"#no!!%&+""$%%&%#,+$p !!%&+""(!!#""%qrs.=>?@R %%&+"##^_R#’ %&+"$%&,"#%&%"$ l?@ %%&+"##&.m+%&*+"#no!!%&*+""$%&-*+.$p !!%&+""(!!%&*+"""%qrs.=>?@R %%&+"#%&*+"^_ R%&*+"’%&+"$%,"#%&%"$ l?@ %%&+"#%&*+"&.m+%&*#,"#no!!%&*#,""$ %)))$p!!%&+""(!!%&*#,"""%qrs.=>?@R %%&+"# %&*#,"^_R%&*#,"’%&+"$%&%),"#%&%"$ l?@ %%&+"#%&*#,"&.m+%&+*#,"#no!!%&+*#,""$ %&%+,,.$p!!%&+""(!!%&+*#,"""%qrs.=>?@R %%&+"#%&+*#,"^_R%&+*#,"’%&+"$%&%-#,""%&%"$ !!!"#!$%& tVu\]^_‘’#Qvl?@ %%&+"#%&+*#,"&.m+ "!"#$!!"#%&’$#’ (!)*+,-./ %&+)"),"#wx;,-.QE01>& !"!$ 0 1 2 3 ( 4 ’%$(! 56( yj".>z&-#${i#Q|}~(cid:127)‘(cid:128)XST#(cid:129)(cid:130)#$ q(cid:131)(cid:132)(cid:133)(cid:134)(cid:135)b(cid:136)(cid:137)fi(cid:138)Qo5(cid:139)(cid:140)& 42 书书书 书书书第 11 章 算法初步 ················································· 1"#$%&’!!""#!()*+,- #$$%%./0123 4&567+589:;& "#&<=*+,- #$$%%>?@&’ $’% "$&A #$$%%5BC"# ’ ! $ "%&D!$(%!"&$EFG"&’HEIJ" KL:;’ ! "&&D!!""#!$EFG"’’HE"#" M#&’5N$IJ ! ! "$KL:;’ ! "’&D!!$"!!""$!$E+( #"$%%$O" PQ$’D ! ! ! !!$"!!""%!$E+( #$$"%$O" PQ%’RS"$( ! ! ! ’TUVWV## %!XY( V## %! Z[\& 43 书书书第 11 章 算法初步 ················································· 1"#$%!&!’!( )*+"&,’#$- ./1012")*#"#*3"4356"&7’##+( 182"$2")*#"*%/1" !!’+)* 1061 !!&+)* 1"418 )*+"&,’#$- .1"4 #91"%!)* 1"4 !"!!#$%&’ !"#$%&!""##":$";$"<$"-$"$=’"#:()*+% ,-./)012!34!""##":$";$"<$"-$"$=! 56!":##::$:;$:<$:-$:,= #<=-:,>-:,=-:,-:,:,= #*>% 7(!809=,-,<,;+=* ":#;1<=!::>1<=% ?@6AB,-C1DE=& !":##::$:;$:<$:-$:,= #:@":;$:<$:-$:,=#$= #:@":@":<$:-$:,=#$=#$= #:@":@":@":-$:,=#$=#$=#$= #:@":@":@":@":,=#$=#$=#$=#$= 7"FG0;:;1<=!::>1<=H@69%IJKL! 7-01MN9<=:O!3PQRST<=UV% 44 书书书第 11 章 算法初步 ················································· 1"#!$1%!&’()""##$%#!&% #!’!&$&%#& ! !’! ! % *+,-./)% " ""##$%#!&% #!’!&$&%#&% ! !’! ! " $"%#!’!&% #!’#&$&%##&% ! !’! ! " $""%#!’#&% #!’$&$&%##&%##&% ! !’! # ! " $$$ $"$""%#&% ##&% ##&$&%##&%( ! !’! !’# ! " 0’()123!456789:;<91&’()12!= )$%#&% ! ! ! !’! >?@9ABC:671&’()12!= )$)#&% ! # ! !’# )$)#&% ! $ # !’$ $$ !! !!"#$%"& )$) #&%( ! !’! " ’()*+,-$%# DE!0!&’()""##12FGHI0!%1&’()12( ./01234,-5 67! JDEK1L!&’()102MNGHI0!%1&’()1 !"# $89: 217OPIQRS7O!TUUVHW67XY!=Z[\]!^ "#$%%8"#&";< =>#?@A;B#C _67‘ab’()102MN3!QRS7Oc>d8e17O( DEFG $HIJKL !!!fg1%h&’()""##$%#%#&&$’%#$’#’(##& MNB&!O;PQR ST3$U#VWXY !’)#’"’*!_QRS7O0D%’()i#$%312( Z[\]^#_‘Ya "!K’()j/% b#Vcde.fgh i $H [ \ h i j& ""##$""""%###&$’%##’#’(##&!’)##’"’*! B!!"#klm’n k@lmB1no!c&671&’()i#$%312% o’pqrs*@:2 3[t4! )$%! " )$%+%,#-#)! ! )$#)+%,$’%-!$*’%! # )$!$*’%+%.#’(-(*/’/! $ )$(*/’/+%,!’)-$&%!’#! & )$$&%!’#+%."’*-!)#%%’#( % pq!i#$%3!’()12rs!)#%%’#( !"# 45 书书书 书书书 书书书第 11 章 算法初步 ················································· 1"!#$%&’()*+,!-./0""##$%#!&% #!’! ! !’! &$&%#&% 1#$# 2343*+56789% ! " " !"#$! :;<3=>?@ABCD&E*( 2F&G( 34&HI ) )’! ($%&JK " ! ($( #&% ")$!&$&!# ) )’! !’) LMNOPQR3ST&UV&WXYZ8[D* \]*+ST^_! $!!‘a./0-b!’cd-/3eb% f#34( ! $#!g(34hijk%&g)34hijk!’!( ! $%!‘a)-/3eb%( ) $&!($(#&%&)$)’!( ) $’!lm)Lnopqrp"&HL&stu$%(ns‘7./ 034(( @vwx^x!! %!y6( x!! %! 46 书书书第 11 章 算法初步 ················································· 1"#! !"#$% "&’#$& !"#$% "(&’#$( !"#$% ")’#$) *’( +’&,- ./!01!+"’2 #3!"% "+’#$+ !"#$% "(+’#$( *’*#)4( +’+,- .1"5 #3!"%!* 1"5 ! !" ! -!$%&’()*627+89,-./01! 6!23456%787891%:;<8$=8=891%:;78$>8>8 91%:;?8!@ABC456DE2:E8F& :!$GH)*IJ":#"#-’2KLM ’-%-;9(N,38OPQ )RSTUV 2;22-*! 7!WA:XY$)"*%"9&9"7&-2":&-2"6&9"&-%$Z[\])*C8:X Y^"%#6_,‘! 47 书书书第 11 章 算法初步 ················································· 1!!"#$%&’()*&+,-.1"#$)%"%11/01234! &!56789"!#"$"#’%(%1#"&’#%#:;<=(.>?789@ #$1A/B! 48 书书书第 11 章 算法初步 ················································· 111!"#$% 进位制 11 !"#$%!#!&’()*+,-!"./!0(1234 +&5!#!6+789:;",& ?@AB$C&5!#?DE&F %G5!,&+)H!I+!, JK!LMNO,-!#’’’"!#!PQRS,"TU+?DE V& %G"!,&!WX"YZ=?!5[!#&G5[!,!C !#P&GC!,!6(+=?\]&"%^#! 0(_‘!,;5!#?""!!WXa"U+"QR";"!#! b"!!!5"+"QR";"!"!b"!!;"+!QR!;"!!!b !!M&" ""!&"’"!##"’"!"#!’"!!! cdK!,;C!#?""!!WXe"+"QR";##!b(! f"+"QR";#"!b#!gf"+!QR!;#!!b!!M&" ""! $"’###"’#"#!’#!! (#) ,;5[!#?""!!WXe"+"QR";"%#!b#)%!f "+"QR";"%"!b"%!gf"+!QR!;"%!!b!! M&" !!!"#$%!&’ ""! $"’"%##"’"%"#!’"%!! ()*+,-./)0 ("%) hi!j?#X!k?"U+?@lQRm+nopqrs? (1234!5!"#$"%# 627&’(!8&’ @>t+no9u!vrs?@lj+"T9u!0(%wuxy (9:;<-.& ?+"z! 5!#?+"z&{"!y|+}!C!#?+"z&{#y |+}!5[!#?+"z&{"%y|+}!?"?@A%B#<%!CD(EF#B!G3(HI# 0*+,!JK$LMN "9;CBL#! !!!7!""!"! $#% -./0*+,$ "!!""!"! $#% %!’(")("*(!#("!(!" %*#("("()("(! %*+$ OP&QRS!6TU"*+,-.?0*+,’ #$%&! VQW"*+,#XY$:!-./0*+,%!9:;<% =>?@A%B#<%G3"*+,#Z,[&:,\#]"&’! $"" & "!##"#,%#^_#("&’! $"""!##"#,%‘a#bc!d & efgbhhijL!klmn6o& -!&pq#!"!$) -#&%("!&(!) -*&%(%)#("&’!!&(&)!) & -)&rs&$$3t?u!v3!pD%#\)twxy-*! z{|}6}!! *#~(cid:127)! 50 书书书第 11 章 算法初步 ················································· 1!! "# !"#! $%&’( ")#*#+,$%)#*#+ -,. /,! 01 2,)310!. -,-42!*"&/5!’ ),)#!. /,/4! 611&’%($6$/%+ &7$%($- 8%0 51 书书书第 11 章 算法初步 ················································· 1!!!!!""#$%&’(# "!)*!!!"$%&"’(!! "’$%&%)(!! %)$%&!*(+! !*$%&’(+! ’$%&,(!! ,$%&!(!! !$%&+(!! +,!!!"$%&"%&"%&"%&"%&"%&"%&+(!#(!#(!#( +#(+#(!#(! $!&%-(!&%"(!&%*(+&%,(+&%%(!&%!( !&%+# +,!!!"$!!!++!! "%# # !!!"#$"%!& -.$/01!2345&’6("#$!"!""!%#!#.# ’()*+,-./0 &’(% 123456./17 89:;<=>" 4789:&;<=!>?,@A45&’6("#$!"!" "!%#!#.#&’(B/09:!C* &D!EF:’"GHIJ$ "!#K!LDMNB5&’(!EGF(O*"#PB!&’ (QBRST(U( "%#K!LD+@BV!EGF(O*"#PB!&’(QB W/T(U( ",#XYZ;"%#[O!/\AV*+]^" #$%&! _‘?,Kab]cde78Bf:"45&’(#"#$! &’($Bf:ghijJ$ /!$kl5&’6(#!m(!( /%$%$!!’$#012!( /,$!@ABF(nopqrs( /*$t%%+!I#&%!uvw/%(xI!kNF(Brs@ A!&’($" 52 书书书 书书书第 11 章 算法初步 ················································· 1"#$%$!! ""&’# !!! "" ()*! $%&’(!)"* +,- .,- /0 1,)"* 2,)30/* +,+42#!-$. .,.4! ),1 500&’%($5!1,- &6$%(!+ 7%/ +,-!./01234./056789:94./012 3!./05;!<=:">?@A0/B05CDEFGH I-" 53 书书书第 11 章 算法初步 ················································· 11 小结与复习 !! "#$% 11 !"#$%&’()*+,-./0!#1!2%*+,3 4!56789:;<*=>?@!!"A2%;<"BC?@D ?E6FGFH*I)!JKLMNBCOP*QRST!!"U VWX.Y78Z([\*]^$%_‘!a,bcde*#!D fg8$%Dhijkl*!"UV! mno]pjq!"*rs!tuvw!"UV#oxpyz {[|$%}~*0(cid:127)!C)(cid:128)(cid:129)(cid:130)(cid:131)(cid:132)(cid:133)q(cid:134)(cid:135)(cid:136)*!"!|(cid:137) (cid:138)(cid:139)(cid:140)(cid:141)A(cid:132)(cid:133)!"D*I)!(cid:142)q(cid:138)(cid:139)(cid:140)(cid:141)*(cid:143)^3m(cid:144)(cid:145)y (cid:146)#o(cid:143)p(cid:147)(cid:148)(cid:149)(cid:150)"(cid:151)I"(cid:152)(cid:153)!%(cid:154)!"*(cid:138)(cid:139)(cid:130)(cid:131)(cid:132)(cid:133)!(cid:142) q(cid:155)^3m!"(cid:130)(cid:156)$$$(cid:157)N(cid:130)(cid:156)"(cid:157)e(cid:130)(cid:156)"(cid:158)(cid:159)(cid:130)(cid:156)"(cid:160)¡(cid:130) (cid:156)"¢£(cid:130)(cid:156)#o⁄p(cid:147)(cid:148)(cid:155)¥ƒ§!"*0(cid:127)!|C!"*3m UV¤&!"*+,'“«‹'!?@«(cid:160)(cid:142)›Ufifl(cid:132)(cid:133)*(cid:176) –!†‡(cid:144)(cid:145)U·*(cid:176)–! &! ’(%) 11 "!!"*(cid:181)¶"(cid:138)(cid:139)(cid:140)(cid:141) %"&(cid:147)(cid:148){q(cid:134)[|(cid:135)(cid:136)(cid:148)(cid:138)flu•*0(cid:127)!|C!"*U V!jq!"*(cid:181)¶! 54 书书书第 11 章 算法初步 ················································· 1!"!"#$#%’($)*+,-./0123456 7"-"89:56734"-;$<3-./07=>?@AB CD%E.CD#FGCD#HICD" !"?@JKLM )*N9:567-./0OPQ-.LM7"-$<3R> ?@JKLM&&&STLM#SULM#VWLM#FGLM#H ILM$:XJK7?@YZ" #"!"[\]^7JK_‘$abc:XJKYZ$:X; defghijkghlm7no$pqrstuv" !! "#$%&’( !! $"JKbwx9y9:P#-.P#z{P7|}$~(cid:127)(cid:128) 9y(cid:129)(cid:130)(cid:131)(cid:132)(cid:133)#(cid:134)(cid:135)(cid:133)(cid:136)(cid:137)(cid:138)(cid:133)"i(cid:139)b(cid:140)9:JK(cid:141)(cid:142)$(cid:143)J K(cid:144)(cid:145)(cid:146)JKL(cid:142)7(cid:147)(cid:148)$(cid:149)(cid:150)b(cid:140)(cid:151)(cid:152)(cid:153)(cid:154)(cid:155)(cid:156)N(cid:157)(cid:158)JK7(cid:159) (cid:160)"JK¡Y¢7F $?@AB*CDE=! $%F!G/01HIJ56KLMCNO!GPQ>$R56- *2ST!PU5678!VW>$<56XY=-ZJ![\] ^5678_‘"#>$1a-bGc! !"#$% #!defg-@hij "j## $"#!AIkS’l!!!!! j## $" %!fg-mnoIkp!qr-S’l!!!!! 56 书书书第 11 章 算法初步 ················································· 1"# $"%&’ ()!1"’!*+,- 1"$%. ,/0, $"$1. ,-2() 34(-*!1%$!$%1 ,-2 .!!"#$%""##$’56.##%’578#7%’589#.%’5..#&%’5##%8!&’()* +,-.#$%/#$#012! 8 8 8 7!34561789&!:;,81 1 1$1 121<=>?!@A;B & . & CD! #!EFG.*+!,81&171$1&7:12!@:;<=>?! 9!-HIJKC1G.LM*+NO%GPQRGPS!TPUVGPW!X9 76!Y98;!#ZQR#ZS& ;![\]&’87^1^_‘a2b&’’cd!e\]fghiFjh^_‘a2k j#<1lmno!EFG.*+!p;iF^_‘a2qr.’’cd1st ^u! 6!:;<=>?!pvwxy#12!p;z9 % "#%&! "#"’#! ’$$7! ! "#$’#! &"#(& "##’# 1z92! 57 书书书第 11 章 算法初步 ················································· 1!!"#$%&’""#($11%)*+,-.!/!0$123456)78! 槡 $&!!9:&’ ");<= ">?@AB&’&&%#! $$!CDEFGH$IJKLMNO!P8@AB()*+!QRSNT&’""U% P8FNOVAB()*+!QAWX:YZ:[&’$URSFNT!@\$)*+ Y$)*+]^!_FNOV‘"")*+#!FNT!‘#"U#!a_]bc^ &!]^FN)T!! $"!FBEdefCDgh.i)jk^&lm(niopq! 58 书书书12 第 章 统计学初步 数据纷繁沙一盘 管窥蠡测理当然 !! ! 总体抽样图良策 均值方差求指南 !! ! 辨明真假成功路 分清主次艳阳天 !! ! 国运民生关统计 知风知浪好行船 !! ! 高 斯 (Gauss)研究 测量误差时 发现了正态 分布曲线,这 是对统计学 的重要贡献. 现代生活是建立在数据之上的 没有数据 一切 ! ! 很难想象 统计学就是研究如何从数据中提取有用信 ! 息的科学 内容包括如何收集 整理 描述和分析数 ! " " 据 基于统计学的数据处理方法称为统计方法 ! ! 统计学初步仅仅帮助你了解统计学的一些基本语 言 知道一些统计学的基本概念 学习了统计学初步 ! ! 后你也许会觉得知道一些统计学的初步知识是有用的 ! 我们认为统计学还可以激发你的智力 给你的生活带 ! 来更多的乐趣 ! 书书书第 12 章 统计学初步 ··············································· 总体和个体 !1"2#.!1!总体和个体 !! 日常生活中我们总是自觉或不自觉地和总体与样本打交道 夏天 !! ! 买西瓜时 先要看看这批西瓜甜不甜 如果瓜甜又不很贵 你可能买 ! ! ! 一个或两个 ! 我们可以称这批西瓜是一个总体 单个的西瓜是个体 但是这样 ! ! 就不能强调我们关心的是西瓜的甜度 因为西瓜的好坏还有其他的指 ! 标 例如个的大小 是否新上市的 等等 ! ! ! ! 在关心这批西瓜的甜度时 我们称单个西瓜的甜度是 个体 ! " #! 称所有的西瓜的甜度为 总体 这样就把西瓜的甜不甜数量化了 " #! ! 要了解一批西瓜的甜度情况 你不可能品尝每个西瓜 你只能买 ! ! 一两个尝一尝 然后通过这一两个西瓜的甜度判断这批西瓜的甜度 ! ! 这就是用少数个体推断总体 我们把买的西瓜的甜度称为 样本 ! " #! 于是你已经可以用样本推断总体 ! !! !1"#2.!#1.!1!总 总 体 体 ! 、个 个 体 体 和 和 总 总 体 体 均 均 值 值 要调查全校期中考试的数学成绩时 称全校同学的期中数学成绩 ! 总体 个体和均值 是总体 称单个同学的数学成绩是个体 !! ! ! ! 是统计学的最基本概 要调查全校同学期中考试的语文成绩时 称全校同学的语文成绩 念 ! ! 是总体 称单个同学的语文成绩是个体 ! ! 在统计学中 我们把所要调查对象的全体叫作总体 ! $$%$&’() 把总体中的每个成员叫作个体 *+%,%! $+,-+.+-&(’%/ 总体中个体的某一特征总可以用数量表示 为了叙述的简单和明 ! 确 我们把个体看成数量 把总体看成数量的集合 ! ! ! 调查全校同学期中考试成绩时 指出数学或语文是为了明确总 ! 体 不同的总体不能混为一谈 ! ! 60 书书书 书书书第 12 章 统计学初步 ················································ 总体中个体的数目有时是确定的 有时较难确定 调查全校同学 在判断一批西瓜甜 ! ! !! 不甜时 你没有必要知 期中考试的数学成绩时 参加考试的人数是明确的 相应总体的个数 ! ! ! 道一共有多少个西瓜 ! 也就明确了 在调查全国人口的年龄分布时 总体是全国人口的年 ! ! 龄 是明确的 但是个体总数很难精确下来 ! ! ! 全校同学期中数学考试成绩的平均值是总体平均 全校同学期中 ! 语文考试成绩的平均值也是总体平均 总体平均是总体的指标之一 ! ! 是我们所关心的指标 ! 总体平均是总体的平均值 也称为总体均值 ! "!"#$#! 在统计学中 常用 音 表示总体均值 当总体含有 个 ! ! " !% ! " 个体 第 个个体是 时 总体均值 ! # $ ! # $&$&$&$ !% ’ ( "! " 练 习 练习的结论表明 !! ! 用 表示数据 的均值 用 表示常数 对于数据 每个数据增加相同的 ’! ’!’!$!’ ! ) ! ’ ( ( 量 数据的均值也增加 " $’ %’ ’ &)!"$( %’ ( &)!"$!"$( %’ ( &) 相同的量 ! 的均值 验证 $*! % $*%’!&)!"" 习题 " ! 简述总体平均的含义 ’! ! 用 表示观测数据 的均值 用 表示常数 用 表示观测数据 (! ’! ’ ’ !’ ( !$!’ ( ! + ! $* 第 题的结论表 !! ! 的均值时 证明 明 数据同时扩大 $’ %+’ ’ !$( %+’ ( !$!$( %+’ ( ! % ! ! 倍 均值也扩大 倍 " ! " $*%+’!! 61 书书书 书书书 书书书 书书书第 12 章 统计学初步 ··············································· 对于数据 !! "# "$ #% "$ #! "$ "& "! ’$ #% "# "" "’ #" "! "! ## #’ "( ") #" "" "# #’ 用 分别表示第 第 第 行的平均值 用 表示全体 个数的 !) ! !& ! !! )! &! ! ! ! &* 平均值 ! 计算 和 ")# !) ! !& ! !! ! $ 是否有 " !"" !) #!& #!! #%!& !! ) 1 & 2 + . ) 1 + . & 2!样 样 本 本 与 与 样 样 本 本 均 均 值 值 要了解一盘菜炒得好吃不好吃 你品尝一下就可以下结论了 没 ! ! 有必要等到把菜吃完再做结论 你品尝的菜就是样本 你的品尝就是 ! ! 把样本进行平均 然后你用样本的平均推断总体的平均 ! ! 考察 中学高一年级 个同学某时间的平均身高 要得到这 $ #$$ !! 个同学的平均身高不是一件很困难的事情 只要了解了每个同学 #$$ ! 的身高就可以利用公式 这 个同学身高之和 #$$ !" #$$ 计算得到 ! 同一天对每个同学进行一次身高测量可以得到均值 的准确值 ! ! 但是要花费老师和同学们较多的时间和精力 统计上解决这类问题的 ! 最好方法是进行抽样调查 例如在 个同学中只具体测量 个同 ! #$$ #$ 学的身高 用这 个同学的平均身高作为总体平均身高 的近似 ! #$ ! ! 这时我们称这 个同学的身高为总体的一个样本 称 为样本量 #$ ! #$ ! 从总体中抽取一部分个体 称这些个体为样本 ! ",-./01#! 样本也叫作观测数据 "23,145166-7-#! 称构成样本的个体数目为样本容量 简称为样本量 ! ",-./01 ,891#! 称从总体抽取样本的工作为抽样 ",-./08:;#! 62 书书书第 12 章 统计学初步 ················································ 按照上面的定义 总体也是一个样本 称为全样本 但是样本一 ! ! ! 般不是总体 ! 在考虑身高问题时 对于前述被选中的 个同学 用 ! !" ! "!"! # $ 分别表示第 第 第 个同学在调查日的身高 则 "!" #! $!"! !" ! !" 这 个同学的身高 !" "!"!"!" # $ !" 是样本 用 表示样本量 则 ! # ! #$!"! 样本均值是样本的平均值 用 表示 ! "! ! 总体均值是总体的指标 是一个固定的量 但是样本均值依赖于 !!!"#$%!! ! ! ! !" !"!!" !&’!"( 样本的选择 从不同的样本会计算出不同的样本均值 所以我们说样 )#$*+# ! ! 本均值带有随机性 ! 和总体均值 做比较后知道 只要抽样合理 对于较大的样本量 ! ! ! 样本均值 会接近 于是 是总体均值 的近似 所以称为 #! "! !! !"! ! ! ! 的估计 #%&’()*’+,$! 问题 在考察 中学高一年级 个同学的平均身高时 决定 " % !"" ! 调查 个同学 用这 个同学的平均身高作为全年级平均身高的估 !" ! !" 计 有 名女同学主动承担了这次调查任务 她们每人负责选择了 ! ! ! 个同学 在 月的第一周测量出了所选择的 个同学的身高如下 #" ! - !" 单位 # %.)$% #!/ #// #/! #!0 #/" #/1 #/$ #!2 #!2 #/1 #!! #/! #/! #0$ #/! #!2 #/1 #!! #/# #/# #/$ #/" #/2 #!" #/1 #/0 #// #/! #/$ #// #/! #/" #!- #/" #!3 #/" #/$ #/3 #0" #!- #/! #// #/0 #!/ #/3 #/3 #!! #!0 #/2 #/# 其中 分别是第 第 "$#!/!"$#//!"$#/!!"!" $#/# #! $! # $ 3 !" 第 个被选中的同学的身高 样本量 "! !" ! #$!"! 对上述 个测量数据进行平均后得到 !" "&"&"&" "!$ # $ #$#/#42/ #.)$! # 于是 对全年级平均身高 的估计是 ! ! #/#42/.)! 上述 调 查 结 果 公 布 后 引 起 了 同 学 们 的 议 论 普 遍 认 为 ! ! 63 书书书 书书书第 12 章 统计学初步 ··············································· 偏小了 问题出在哪里呢 我们在学习抽样调查方法时再 !"!#$"%& ! ! 解答这个问题 ! 练 习 用 表示观测数据 的均值 用 表示常数 用 表示观测 "! " ! "" ’ "#"" # " $"% ! ’& 数据 的均值时 证明 ’! ($" ! )%"’’ ($" ’ )%"#"’# ($" # )% " ’&($"!)%! 习题 " ! 简述样本均值和总体均值的关系 !! ! 当样本 中有 个 个 个 时 验证 ’! " ! "" ’ "#"" # # ! ’! "# ’ ’’ "#"# * ’* " $ "!( # !’! )# ’’’ )#)# *’*! # 将某调查公司得到的 个数据从小到大排列后得到如下数据 (! ’) $ "$) "$) "$) "$) "$* "$* "$* "$* "$* "+) "+) "+) "+) "+) "+) "+" "+" "+" ,)) ,)) 计算样本均值 "!! 将一个总体中的 个个体平均分成 份 每份 个个体 先计算每份的均值 -! *# # " * ! " 得到 个均值 这 个均值的平均值是否等于总体均值 证明你的结论 # ! # ! ! "" !1’2#.!1#.(3"方方差差和和标标准准差差 拔河比赛是一项有益于身体健康和增进团结的体育活动 某居民 " 区的 号楼和 号楼决定进行拔河比赛 号楼组成 号队 号楼组 ’ " !’ ’ "" 64 书书书第 12 章 统计学初步 ················································ 成 号队 每队 人 参加比赛时 号队的年龄 单位 岁 组成是 ! ! "# ! !$ " # $ %!%!&!&!&!"’!"’!"’! "’!"$!#(!!"!!$!!#!!#! 号队的年龄 单位 岁 组成是 ! " # $ $!!$!!$!!$!!$!!$(!$(!$(! $(!$(!$%!$%!$%!$%!$%! 这两个队的平均年龄都是 岁 但是各队一出场 大家就基本能够 $( ! ! 判断出比赛的结果了 号队的年龄相差悬殊 是老爷爷带小朋友 !$ ! % 号队的年龄整齐 都是中青年 看来只靠平均年龄无法判定拔河队 ! ! ! 的实力 还需要有一个能衡量年龄的整齐程度的量 这个量就是要学 ! ! 习的方差 ! 总体方差 !! ! 当 是总体的全部个体 是总体均值时 称 " " !" $ !&!" # ! ! ! 音 读 !!! !"#$%!!& 作 方 "$$ "" " %! $$&"" $ %! $$&&&"" # %! $$ !"#$% ’ # 可以计算 号拔河 是总体的平均平方误差 简称为总体方差或方差 !! ! ! ")*+,*-./$! 队年龄的方差是 !!" 总体方差 描述了总体中的个体向总体均值 的集中程度 方差 ! "$ ! # "#"$% 号拔河队年龄的 越小 表示个体与 的距离越近 个体向 集中得越好 " ! ! ! ! ! 方差是 相差 !!"&$’! 总体方差 也描述了总体中个体的整齐程度或波动幅度 方差越 太悬殊了" "$ ! ! 小 表示个体越整齐 波动越小 ! ! ! 例 同一年级的甲班有 个同学 乙班有 个同学 期中考 !! 0# ! 0( ! 试后 数学的平均成绩分别是 分和 分 方差分别是 和 ! (&12 %$1( ! !%1! 如何就这次考试的结果评价这两个班的数学课的学习情况 "2%1%! ’ 解 从平均分上看 乙班的数学平均成绩好于甲班 但是从成绩的 ! ! ! 整齐程度方面看 甲班好于乙班 甲班的分数比乙班的分数更集中 ! ! ! 下面是这两个班数学考试成绩从低到高的排列结果 # 甲班成绩 !’ !# !# !! (’ (" (" ($ ($ (# (! (% (& (& %’ %’ %" %" %" %$ %$ %0 %0 %0 %2 %2 %# %# %# %# %! %( &" &% 65 书书书 书书书 书书书第 12 章 统计学初步 ··············································· 乙班成绩 !" !# #$ #% #% #% #& %’ %$ %$ %% %% () (" (’ (’ (’ (’ (! (! (# (% (( (( (( (( (& &) &) &" &% &( && && *))*))*)) 从中看出 甲班没有同学不及格 也没有同学得满分 乙班有同学得 ! ! " 满分 但是也有同学不及格 甲班的数学成绩更整齐 ! ! ! 样本方差 !! ! !!!"#$%&’! 给定 个观测数据 用 表示这 个数据的均 " # !#!#!#! #! " * " " ()*+,-./0 值 称 12!! ! * $"% $%#!&"’%#!&"’#’%#!&"’ " * " " 为这 个数据的样本方差 也简称为方差 " ! ! 样本方差 是描述观测数据关于样本均值 发散程度的指标 也 $" #! ! 是描述数据的发散程度或波动幅度的指标 ! 样本方差依赖于样本的选取 也带有随机性 样本方差是总体方 ! ! 差的估计 ! 例 一箱内有 个苹果 净重 则苹果的平均质量是 !" !) ! *)+,! *)))) %")) %,&! !) 要了解这箱苹果的整齐程度 就需要估计这箱苹果质量的方差 ! !"! 解 从中抽出 个 测得这 个苹果的质量 单位 是 " *) ! *) % (,& ")*!"*(!*(%!*&"!*&’!*&(!")"!*&$!*%#!"&*! 样本均值是 ")*-"*(-#-"&* #!% %")!." %,&! *) 样本方差是 * $"% $%")*/")!."&"’%"*(/")!."&"’#’%"&*/")!."&"’ *) %&"’.%# %,"&! 我们可以用样本方差 作为总体方差 的估计 $"%&"’.%# %,"& !" ! 66 书书书 书书书第 12 章 统计学初步 ················································ 方差也可以通过下列公式来计算 !! ! " "!# !%!&%!&"&%!#’%"!! $ " ! $ 将方差定义中的每个 展开 再利用 !%’%"#! $ ( %&%&"&%#$%"$ " ! $ 得到 " !!"!# %!%’%"#!&!%’%"#!&"&!%’%"#!& $ " ! $ " # %!%!&%!&"&%!#’!!%&%&"&%#%"&$%"!& $ " ! $ " ! $ " # %!%!&%!&"&%!#’!$%"%"&$%"!& $ " ! $ " # %!%!&%!&"&%!#’$%"!& $ " ! $ " # !%!&%!&"&%!#’%"!! $ " ! $ 标准差 !! ! 在例 中 数据的单位是 样本方差 的单位是 和数据的 ! $ #$ "! #!$ 单位不一致 为了使描述数据的波动幅度的量和数据的单位一致 我 ! $ 们再引入标准差 ! 标准差 是方差的算术平方根 !$%&’(&)((*+,&%,-’# ’ 如果 是样本方差 就称 槡 是样本标准差 "! $ "# "! ’ 如果 是总体方差 就称 槡 是总体标准差 !! $ !# !! ! 在例 中 个苹果质量的标准差是 槡 ! $". "# /!0123#0.10/ !##! 其单位和数据的单位一致 ! 当数据带有单位时 标准差的单位是和数据的单位一致的 标准 $ ! 差也是描述数据发散程度或波动幅度的指标 样本标准差是总体标准 ! 差的估计 ! 给定数据 和均值 由方差计算公式知道 标准 %$%$"$% %"! $ " ! $ 差 可以由下面的公式之一计算 " ! 槡 " !!!!!!"# %!%’%"#!&!%’%"#!&"&!%’%"#!&$ $ " ! $ 67 书书书第 12 章 统计学初步 ··············································· 槡 ! !!!!!" !$"%$"%"%$"#&$""’ # ! " # 例 比赛中 甲乙两位射击运动员分别进行了 次射击 成 !! $ !# $ 绩 单位 环 分别如下 ! % # % 甲 %$%&!$%$!$%$!$%$!$%’!$%(!$%&!$%)!$%*!$%* 乙 %$%+!$%)!$%&!$%#!$%!!$%’!$%(!$%&!$%)!$%+ 问 哪个运动员平均水平高 哪个运动员水平更稳定 % & & 解 用 和 分别表示甲和乙成绩的均值和标准差 经 ! $"$! )($! ’ $ ) 过计算得到 $""$%*($!!"#%!$&"$!)("$%+$!!"#%")"+’ $ ) 因此 甲的平均水平和稳定性都比乙好 $ ’ 练 习 !!!"#$%&’! ()*+,-./0, 用 表示 的方差 用 表示常数 用 表示 的 ! $ " $ ! $$ " $"$$ # $ * $ ! ) " )! $)" $"$)# #1*234567 方差 当 时 验证 8"9:;78! ’ )! "$ ! %*$)" "$ " %*$"$)# "$ # %* $ ! ) ""! $ "’ 习题 ! ! 下面的数据是 年奥林匹克男子跳高比赛金牌获得者的跳跃高度 !’ !$##’!$)* 单位 计算均值 方差和标准差 精确到小数点后两位 ! %,-#’ ( ! #’ 年 份 高 度 年 份 高 度 ! ! ! ! !$## !$#%# !$#+ !$#%) !$#’ !$#%& !$!" !$)%# !$"# !$)%& !$"+ !$’%! !$"’ !$+%! !$)" !$(%! !$)* "#"%$ 68 书书书 书书书第 12 章 统计学初步 ················································ 某连锁超市销售部收到甲乙两厂家送来的质地相同的白糖各 包 测量后得 !! "# ! 到甲乙两厂家白糖的质量 单位 分别是 " #$$ # 甲厂 %#" %## &’’ %## %#! %## %## %#" &’’ &’( 乙厂 &’) %#" %## %#! &’’ %#" %#* %## %## &’) 销售部应当销售哪家的白糖 % 某公司希望能为飞机制造公司提供零部件 在向飞机制造公司推荐自己的生产 *! ! 能力时 应当重点明确以下哪些内容 ! "!!$ 所生产部件的平均规格符合标准 "+$ 所生产部件的规格的方差不小于某个数 ",$ 所生产部件的规格的方差不大于某个数 "-$ 能够按时供货 ".$ 对一本书进行校稿前 抽查了其中的 页 将排版时输入错误的情况总结如下 &! ! !" ! # 输入错误数 " ) & # "" / ! 出现总页数 * / * ! ! " & 计算每页的平均输入错误数 ""$ & 计算样本方差 精确到 "!$ " #0#"$& 计算样本标准差 精确到 "*$ " #0#"$! 当观测数据 的样本方差 时 证明所有的 相同 %! "!"!’!" $!%# ! " ! " ! # & 当数据 同时增加到原来的 倍时 证明方差增加到原来的 倍 /! "!"!’!" ’ ! ’! ! " ! # 当数据 同时增加到原来的 倍时 证明标准差增加到原来的 倍 )! "!"!’!" ’ ! "’" ! " ! # 69 书书书第 12 章 统计学初步 ··············································· !! 抽样调查方法 !! 1!2".#2"! 抽样调查方法 在日常生活中人们总是自觉或不自觉地应用抽样方法 例如在市 !! ! 场上买花生或瓜子时总要先抓几颗看看是否饱满 干燥 在厨房做饭 ! ! 的过程中经常要取一点尝尝咸淡 ! 在考察锅里汤的味道时 没有必要把汤喝完 只要把汤搅拌均 ! ! 匀 从中品尝一勺就可以了 注意无论这锅汤有多少 只要一勺就够 ! ! ! 了 这就是窥一斑而知全豹 ! ! 记住上面的例子是大有好处的 因为它提供了抽样调查方法的最 ! !!!"#$%&’( 重要信息 )%*+,-!./0 ! 第一 把汤搅拌均匀 是说明抽样的随机性 没有抽样的随机 ) * 1 2 3 % 4 5 !" # ! 67! 性 样本就不能很好地反映总体的情况 ! ! 第二 品尝一勺 指出了选取的样本量不能太少 也不必太大 !" # ! ! 太少了不足以品出味道 品尝一大碗也没有必要 !!!"#$%&’( ! ! 第三 无论这锅汤有多少 只要一勺就够了 这里体现出抽样 )$*+,!-./% !" ! #! 0123456,78 调查的如下基本性质 总体个数增大时 样本量不必跟着增大 !9":;<=>!? $ ! ! 抽样调查的必要性 @A":,BCDEF 12,BC! 在评价 台同型号的微波炉的平均工作寿命 时 预备从中 !$$$ ! ! 抽取 台进行工作寿命的测量试验 用这 台微波炉的平均工作寿命 " ! " 估计总体的平均工作寿命 !! 这里 总体是 台微波炉的工作寿命 样本量是 被选中 ! !$$$ ! "! 的微波炉的工作寿命构成样本 样本平均 是总体均值 的估计 ! #" ! ! 在正确抽样的前提下 样本量越大 越接近总体均值 但 !!!"#$%&’! ! !#" !! ()*+,-./01 是 较大的样本量造成的损失很大 因为这 台微波炉做完寿命试验 ! ! " 2%3456! 后就报废了 在本问题中要想得到真正的总体均值 是不可能的 除非 ! ! ! 把这 台微波炉都拿来做工作寿命试验 报废掉这 台微波炉 !$$$ ! !$$$ ! 在很多实际问题中 采用抽样的方法来确定总体性质不仅是必要 ! !!!"#$%&’! 的 也是必须的 ! ! 70 书书书 书书书 书书书 书书书 书书书 书书书第 12 章 统计学初步 ················································ !! ! 1 " 2 # . " 2 # . ! 1 ! 随随机机抽抽样样 在 节的问题中 通过选取和测量 个同学的身高 得到 !"#!#" ! $% ! 了总体平均身高 的估计 结果公布后 同学们普 ! !""!&!#’& "()## ! 遍反映估计值偏低 其原因是什么呢 # $ !!!"#$%&’( 原因在于女同学在选择调查对象时更倾向于 或更方便选择到女 ! )*+,-./0$1 同学 所以 个同学的样本中女生身高占了绝大多数 这样就解释 23! ! $% # 了估计值偏低的原因 # 如何设计抽样方案才能得到满意的估计值呢 $ 在对总体的情况不清楚的时候 最好的抽样方案应当将总体中的 ! !!!"#!$%&’ 个体一视同仁 每个个体被抽中的机会相同 ()*+,!-./0 " # 123456789 如果总体中的每个个体都有相同的机会被抽中 就称这样的抽样 ! "! 方法为随机抽样方法 # 人们经常用 任取 随机抽取 或 等可能抽取 等来表示随 % &!% & % & 机抽样 # 例 口袋中有质地相同的小球 个 分 种颜色 从中无放回 ! !% ! * # 地随机抽取 个 共抽取 个 这种抽样的方法被称为无放 ! ! $"#!%# ! 回地随机抽样 从袋中每次随机抽取一球记录颜色后放回 共抽取 # ! $ 次 这样的抽样方法被称为有放回地随机抽样 这两种随机抽样有什 ! # 么区别吗 $ 解 无放回随机抽样下 同一个小球不会被抽中两次 而有放回 ! ! # 地随机抽样下 同一个小球可能被抽中多次 当样本量 采用 ! # $"!%! 无放回随机抽样就可以完全了解袋中小球的颜色分布情况 采用有放 ! 回地随机抽样还不能对袋中小球的颜色分布作出准确判断 # 随机抽样又分为无放回地随机抽样和有放回地随机抽样 无放回 # 地随机抽样指在总体中抽出一个个体后 下次在余下的个体中再进行 ! 随机抽样 有放回地随机抽样指抽出一个个体 记录下抽到的结果后 # ! 放回 摇匀后再进行下一次随机抽样 ! # 一般地 设一个总体含有 个个体 从中逐个不放回地抽取 ! % ! $ 71 书书书 书书书 书书书第 12 章 统计学初步 ··············································· 个个体为样本 如果每次抽取时总体内的各个个体被抽到的 !!!"" # 机会都相等 则把这样的抽样方法称为简单随机抽样 # # 简单随机样本指简单随机抽样得到的样本 # 在没有特殊声明时 所有的随机抽样都是指简单随机抽样 # # 试验和理论都证明 在随机抽样下 样本均值 是总体均值 很 $ # $" ! 好的估计 样本标准差 是总体标准差 很好的估计 在样本量不大 !!!"#$%&’( # % " # "#$)*+,!-. 时 增加样本量可以比较好地提高估计的精确度 # # /01)23$456 在 节的问题中 实现简单随机抽样的方法是先将 个 789$/01)23 !"#!#" # $%% $45:;!<=>% 同学从 到 进行编号 然后将 张由 到 编号的小纸片放 ! $%% # $%% ! $%% &$?+@A!)*+ 入一个大纸箱充分地摇匀 最后从纸箱中无放回地抽取 张纸片 "B%&$?+C@D # $% # E!FGH1)IJ2 纸片上的号码就是被选中的同学的号码 纸片上的这 个数被称为 # $% 3$45="K$! 随机数 !&’()*+(,+-.&"# 随机数可以利用计算机产生 下面是用计算机在 至 中随机 # ! $%% 抽取的 个随机数 $% # 个随机数 $% !!!"#!$%&’ /01 !!1 2%/ "/2 //1 23" ""4 !0 /!! ""2 !"()*+,-.% /&!"(01234 2%3 241 /1! 20% 34 "%2 /13 /$4 "%1 //0 50"63789:0 "4 !00 /%0 $ 4$ 0% !%" !%4 2%" !20 ;=! !%% 3 20/ ""/ /11 "22 "!% /"/ "12 !%1 220 /"% !% 2/! !4% /!1 "$" 2$$ "!$ !$2 现在我们继续解决 节中的问题 将 中学高一年级的 ## !"#!#" # & 个同学从 到 进行编号 按照上述随机数表中的号码选取出 $%% ! $%% # 个同学 在 月的某一天测量他们的身高 单位 如下 $% # 4 ! $5+" $ !1$ !1$ !14 !1" !1$ !12 !1$ !00 !1" !$1 !14 !$4 !11 !1! !0% !0% !1/ !$! !10 !00 !02 !$$ !1$ !1! !$4 !$0 !13 !12 !11 !12 !12 !13 !0! !3! !$1 !$4 !02 !12 !$1 !13 !00 !0! !3% !14 !04 !12 !$3 !1/ !0/ !$3 用这 个观测数据计算出的样本均值是 $% $"’!1$#13 !5+"# 于是 高一年级同学平均身高的估计是 # !1$#135+# 72 书书书 书书书 书书书第 12 章 统计学初步 ················································ 由于这次抽样是通过随机抽样完成的 因而避免了有偏的结果 ! ! 这次抽样调查的结果得到了同学们的认可 ! 关于历史上采取不正确的抽样方案而导致调查结论严重失真的教 训 可参阅本小节的 阅读与思考 ! " #! 练 习 调查 支日光灯管的平均使用寿命时 随机抽样方法是有放回地随机抽 !! !""" ! 样吗 $ 调查某市出租车司机的月平均收入时 在街面上进行随机抽样调查 得到的样 #! ! ! 本是简单随机样本吗 $ 习题 ! ! 简述什么是简单随机抽样 !! ! 简述什么是有放回地随机抽样 #! ! 举例说明随机抽样方法中 随机 的必要性 $! " # ! 在某一个海域对海豚的体重进行抽样调查时 应采用有放回地还是无放回地捕 %! ! 获抽样 $ 在调查某个城市的家庭年平均收入时 能否只在该市的娱乐场所 如电影院 &! ! % & 歌剧院 游乐场 健身馆等 进行随机抽样 原因是什么 能否只在该市的公 & & ’ $ $ 共汽车站进行随机抽样 原因是什么 $ $ 73 书书书第 12 章 统计学初步 ··············································· 阅读与思考 !!! 文学摘要 的破产 《!文学摘要"》的破产 年是美国总统选举年 这年罗斯福 任美国 !"#$ ! !%&&’()(*+" 总统期满 参加第二届的连任竞选 对手是堪萨斯州州长兰登 # # 当时美国刚从经济大萧条中恢复过来 失业人数仍高 !,-./&."0 # 达 多万 人们的经济收入下降了 后开始逐步回升 当时 "11 # !$# ! # 观察家们普遍认为罗斯福会当选 而美国的 文学摘要 杂志的调 ! % & 查却预测兰登会以 对 的压倒性优势获胜 文学摘要 的 234 5#4 !% & 预测是基于对 万选民的民意调查得出的 自 年以来 在 651 ! !"!$ # 历届美国总统的选举中 文学摘要 都作了正确的预测 文学摘 % & !% 要 的威信有力地支持着它的这次预测 & ! 但是选举的结果却是罗斯福以 对 的压倒性优势获胜 $64 #74 ! 此后不久 文学摘要 杂志就破产了 % & ! 要了解 文学摘要 预测失败的原因就必须检查他们的抽样调 % & !!!"#$!"#%& 查方案 文学摘要 是将问卷寄给了 万选民 这些选民的 !% & !111 # ’(! 地址是在诸如电话簿 俱乐部会员名单等上面查到的 ’ ! 分析 年只有大约 的家庭安装了电话 由于有钱人 !!"#$ !$5 ! 才更有可能安装家庭电话和参加俱乐部 所以 文学摘要 的调查 # % & 方案漏掉了那些不属于俱乐部的穷人和没有安装电话的穷人 这就 # 导致了调查结果有排除穷人的偏向 ! 在 年 由于经济开始好转 穷人普遍有赞同罗斯福当选 !"#$ # # 的倾向 富人有赞同兰登当选的倾向 文学摘要 的调查结果更 # !% & 多地代表了富人的意愿 导致了预测的失败 # ! 评论 抽样的方案应当公平地对待每一位选民和每一个群体 ! # 以便得到选民的真实情况 将哪一个群体排除在外的抽样方案都会 ! 74 书书书 书书书第 12 章 统计学初步 ················································ 导致有偏的样本 从而导致错误的结论 ! ! 同一年 刚刚成立的盖洛普调查公司正确地预测了罗斯福获 ! 胜 以后 盖洛普公司做过多次美国总统大选的民意调查 由于采 ! ! ! 取了正确的抽样设计方案 在调查人数不是很多的情况下 预测的 ! ! 结果都是成功的 ! 75 书书书第 12 章 统计学初步 ··············································· !! !1"2#."2#."2!调 调 查 查 问 问 卷 卷 的 的 设 设 计 计 例 敏感问题调查 某一个住宅区有 个家庭 调查人员 ! ! " "$%$ ! !!!"#$%&’( 已经拿到了所有住户的门牌号码 在调查本住宅区存在家庭暴力的家 )!*+$%,-&. ! 庭比例时 因为经费的原因 只能调查 个家庭 现在已经用随机 /012345,-& ! ! "$$ ! 67! 抽样的方式抽出了 个门牌号码 问 以下哪种调查方案较好 "$$ ! " # 派调查员用询问记录的方式登门调查这 个家庭 $&% "$$ ! 登门调查这 个家庭前先准备 张问卷和若干支笔 只 $’% "$$ "$$ ! 需被调查者在下面的匿名问卷上打勾 然后请被调查者自己将问卷放 ! 入调查员的书包 ! 问卷 请选择 有家庭暴力 无家庭暴力 !! " & ’! & ’ 我们承诺没有人知道你的回答是什么 ! 采用和 相同的调查方案 但是告诉被调查者要调查 $(% $’% ! "$$ 个家庭 而且让他们将答卷折叠后投入随身携带的封闭投票箱 全部 ! ! 调查完毕后再开箱统计 ! 将 中的 张问卷投入抽中的 个家庭的信箱 请他 $)% $’% "$$ "$$ ! 们在规定的时间内将答卷放入指定的投票箱 ! 解 由于家庭暴力是不光彩的家庭隐私 所以调查时应当让被调 ! ! 查者知道他的回答是得到严格保密的 只有这样 调查才有可能获得 ! ! 事实真相 按照这个原则 方案 是其中较好的方案 ! ! $(% ! 方案 忽略了被调查者的感受 容易得到有偏的结果 $&% ! ! 方案 记得带笔方便了调查 但是忽略了被调查者因不信任而 $’% ! 不回答事实真相 ! 方案 的缺点是只能收回少量的问卷 $)% ! 在抽样调查中 调查的方式方法也是非常重要的 无论是当面调 ! ! 查还是问卷调查都应当做到以下两点 " 提问的内容要简单明确 提问太长 会给回答带来困难和引 $!% ! ! 76 书书书 书书书第 12 章 统计学初步 ················································ 起被调查者的反感 不利于得到正确的回答 ! ! 用词要确切 通俗易懂 有礼貌和不用引导词语 "!# ! ! ! 例如 $ 您用什么牌子的牙膏 时间范围不明确 应改为 您现在用什 % &’ ! % 么牌子的牙膏 &’ 很多人都要买汽车 您呢 带有引导性 应改为 您最近打算 % ! &’ ! % 买汽车吗 &’ 练 习 某校高中一年级有 个班 每班有 个同学 其中一个班是特长班 该年级的 " ! #$ ! ! 全体同学已经将各自的学号写在规格相同的小纸条上 放入一个大纸箱中摇 ! 匀 现在校长要通过抽样的方法调查该年级学生参加课外体育锻炼的情况 规 ! ! 定只对 个同学进行详细了解 以下抽样方法正确的是 $" ! "!!# 从纸箱中无放回地随机取出 个学号 选取这 个学号的同学 "%# $" ! $" 各班的班主任在自己的班上点出 个同学 " " 从纸箱中有放回地随机抽取 个学号 选取这 个学号的同学 "’# $" ! $" 从特长班中用随机抽样的方法选取 个同学 "(# $" 习题 ! ! 用随机抽样的方法 在你的语文书中抽查 页 回答以下问题 )! ! )* ! $ 你的抽样是如何进行的 采用的是简单随机抽样还是有放回地随机抽样 ")# ! & 这 页中 平均每页有多少个句号 "!# )* ! & 你对语文书平均每页句号个数的估计是多少 "$# & 如果另外的同学抽查了 页 你认为谁的估计更准确 "## !* ! & 77 书书书第 12 章 统计学初步 ··············································· 数学实践 在抽样调查本校同学的手机个人拥有率 家庭汽车拥有率和每天 !!! " # 完成作业所用的时间时 规定样本量为 请同学们设计一个合理的调查 $ "#"##! 方案和一份调查问卷 参考 例题中的问卷 并具体实施一次抽样调查 ! $%&’ "$ 工作 ! !! " 1 ! 2 % . ! 2 % . ( 3 ! 分分层层抽抽样样和和系系统统抽抽样样 分层抽样 要了解一盘菜炒得好吃不好吃 一般只要随机品尝几口就可以下 $ 结论了 没有必要等到把菜吃完再作出结论 $ ! 但是如果品尝的是西红柿炒鸡蛋 你进行随机抽样品尝就容易只 $ 品尝到西红柿或只品尝到鸡蛋 这对于你作出正确的判断是不利的 $ ! 你应当随机品尝一下西红柿 再随机品尝一下鸡蛋 然后进行综合评 $ $ 价 这种品尝方法就是分层抽样方法 ! ! 例 某市进行家庭年收入调查时 分别对城镇家庭和农村家庭 !! $ 进行调查 在全部城镇的 户中无放回地随机抽取了 户 ! )*’&+ (*# $ 在全部农村的 户中无放回地随机抽取了 户 调查结果 !&*’+! (’# ! 为 城镇家庭年平均收入是 元 农村家庭年平均收入是 % (*’"! $ *’!( 元 试计算该市家庭年平均收入 ! ! 解 这里遇到了两个分总体 和 第一个分总体 是所有城 ! $ $$ $ " ! " 镇家庭的年收入 第二个分总体 是所有农村家庭的年收入 用 $ $ ! $ ! 表示该市所有家庭的年收入时 总体 是两个分总体 和 的并 $ $ $ $ ! " ! 用 表示来自总体 的样本均值 用 表示来自总体 的样本 %" $ $ %" $ " " ! ! 均值 则 $ !!%"#(*’"!$!!%"#*’!(! " ! 在 中所占的比例是 $ $ " )*’&+ & # ##%!(&"! " )*’&+,!&*’+! 在 中所占的比例是 $ $ ! !&*’+! & # ##%&’!+! ! )*’&+,!&*’+! 78 书书书第 12 章 统计学初步 ················································ 的总体均值 的估计是 ! ! !!!!!""#$%#&$%# ! ! " " ##$"%&!’%()!"*#$&)"+’()"% 元 $!"&%% ! "’ 于是该市平均年家庭收入的估计是 元 !"&%% ’ 把总体 分成 个互不相交的子总体 ! ( # !#!&!&$&! % ! " ( 称这些子总体为层 称 为第 层 然后按照一定的比例 对各层独 % ! ) ’ % ) 立地进行简单随机抽样 然后将各层抽样出来的个体合在一起作为样 % 本 这种抽样方法称为分层抽样 ’ ’ 用 表示总体 的个体总数 用 表示第 层的个体总数时 有 * ! % * ) % ) *#* &* &$&* ’ ! " ( 我们称 * $ # ) !)#!%"%$%(" ) * 为第 层的层权 ) !,-./01"’ 用 表示 的总体均值 对 用 表示从第 ! ! ’ )#!%"%$%(% %# ) ) 层抽出样本的样本均值 我们称 ’ ""#$%#&$%#&$&$%# ! ! " " ( ( 是总体均值 的简单估计 ! ’ 分层抽样是一种常用的抽样方法 有如下的特点 % # 分层抽样在获得总体均值估计的同时 也得到各层的均值估 !!" % 计 在例 中 不但得到了 的均值估计 还得到了 和 的均值 ’ ! % ! % ! ! ! " 估计 ’ 将差别不大的个体分在同一层 使得分层抽样得到的样本更 !"" % 具有代表性 从而提高估计的准确度 % ’ 抽样调查的实施更加方便 调查数据的收集 处理也更加方便 !%" % & ’ 系统抽样方法 例 在调查某居民住宅区的 户住户对住宅区的环境满意程 !! +++ 度时 是按照 的比例进行抽样调查 试计算样本均值 % !2!3 % ’ 79 书书书第 12 章 统计学初步 ··············································· 解 先将这 户按门牌号码的顺序依次编号 每个号对应一户 ! !!! ! 的门牌号码 ! " # $ % & ’ ( " "$ "% "& "’ "( ") "! #* #" " #( #) #! $* $" $# $$ $% $& " %" %# " " " " " " " " " " !)" !)# !)$ !)% !)& !)’ !)( " !!$ !!% !!& !!’ !!( !!) !!! 在 中随机抽取一个数字 如果抽到 就调查排在第 列的所 "!"% ! (! ( 有家庭 请这些家庭对小区环境的满意程度打分 分数分为 ! ! "!#! 级 第 列有 户 所以样本量 这 户的平均分 $!%!& ! ( (" ! "#("! (" 是样本均值 用样本均值作为全体住户对小区环境的平均分的估计 ! ! 用 表示这 户中第 户的打分 样本均值是 $ (" % ! % $&$&"&$ $"# " # ("! (" 我们称上面的抽样方法为系统抽样法 ! 如果总体中的个体按一定的方式排列 在规定的范围内随机抽取 ! 一个个体 然后按照制定好的规则确定其他个体的抽样方法称为系统 ! 抽样方法 #+,+-./0-12+0/34156/.-789$! 最简单的系统抽样方法是取得一个个体后 按相同的间隔抽取其 ! 他个体 ! 系统抽样方法的主要优点是实施简单 只需先随机抽取第一个个 ! 体 以后按规定抽取就可以了 系统抽样方法不像随机抽样方法 随 ! ! ! 机抽样方法每次都要随机抽取个体 ! 练 习 中学高一年级的 名同学中有 名女生 在调查全年级同学的平均身高 ’ &** #") ! 时 预备抽样调查 个同学 请你做以下工作 并回答以下问题 ! &* ! ! ! 80 书书书第 12 章 统计学初步 ················································ 设计一个合理的分层抽样方案 !!" ! 你的设计中 第 和第 层分别是什么 !"" # ! " $ 分层抽样是否在得到全年级同学平均身高的估计时 还分别得到了男生和 !#" # 女生的平均身高的估计 $ 习题 ! ! 调查你使用的语文书每页平均有多少个 调查的比例是全书页数的 !! %&’# !(!$! 设计一个系统抽样方法 !!" ) 具体实施你的系统抽样方法 写出调查的样本 样本量 !"" # # ) 计算样本均值 !#" ) 你估计全书每页平均有多少个 !%" %&’$ 把你的结果和其他同学的结果进行比较 对比较的结果给出简单的分析 !&" # ! 调查全班 个同学的平均身高时 决定采用系统抽样方法抽取 个样本作平 "! %’ # !% 均 请 个同学按高矮顺序排列 身高 单位 情况如下 ! %’ # ! *()" * !&$!!!!&&!!&&!!&&!!&*!!&* !&+!!&+!!&,!!&,!!&,!!&’!!&’ !*$!!*$!!*$!!*$!!*$!!*!!!*! !*!!!*"!!*"!!*"!!*"!!*#!!*# !*#!!*%!!*%!!*%!!*%!!*&!!*& !*&!!*&!!*&!!*&!!**!!**!!** !**!!*+!!*+!!*,!!*,!!+$!!+" 应当怎样抽样 才能避免抽样偏差 # !!!" 前两行的样本平均 !-" 后两行的样本平均 !." 前两列的样本平均 !/" 两个对角线上数据的样本平均 !0" 计算问题 中的总体平均和你所选用方法的样本平均 精确到小数点后 位 #! " ! ! "! 81 书书书第 12 章 统计学初步 ··············································· 用样本分布估计总体分布 !!!"#$%&’( !! !1"2#.$3!用样本分布估计总体分布 )*+,-.#/0! 12"34,56#7 无论是从抽样调查 还是从科学实验 工农业生产中得到的数 89:;<"=>?@ !! ! ! AB-+,CD#E 据 在统计学中都被称为观测数据或样本 观测数据也简称为数据 ! ! ! F"B-GHIJ! 数据的个数被称为样本量 ! !!!"#$%&’( 在实际问题中 样本量往往是比较大的 这时数据中的主要信息 )*+,-./012 ! ! /345!./678 隐藏在背后 要从数据中得到这些信息 必须对观测数据进行整理 ! ! ! ’9:;%& 下面是几种常用的数据整理方法 6’?@9:ABCD ! EF./G!./HI +JKL!+M.N+ O/PQRSSTUV W’/X! !! ! 1 " 2 # . $ 3 # . ! 1 ! 频频率率分分布布表表 当样本量是 的观测数据中有 个 时 我们称 " " $ ! # # " %& # # " 是 出现的频率 简称为 的频率 例如数据 $ "%&’()’*+,#! $ ! # # "!"!"!"!$!$!$!-!-!- 中 的频率是 的频率是 的频率是 !" .$!/0/#.!$ $$!/0/#$!- $$!/ 频率也可以用百分数表示 在上面的例子中 的频率是 0/#$! ! !" 的频率是 的频率是 ./1!$ $/1!- $/1! 案例 自 年至 年的 年间 比较重要的战争 简 ! !-// !2$! "&.$" ! " 称为战争 在全世界共发生了 次 以每年为一个时间段的记录如下 # "22 ! % 表 !!!!!! !"#! 爆发的战争数 爆发 次战争的年数 频率 # # " %&"$" # # # / ""$ -!#31 ! !." $"#21 " .4 !!#!1 $ !- $#-1 .5 . /#21 总 计 ! .$" !//1 82 书书书 书书书 书书书第 12 章 统计学初步 ················································ 其中第一行的 表示在 年中有 年发生战争的次 !!""#!$%&’( )#" ""# 数是 发生的频率是 !! ""# !" !$%&’(" % )#" 第二行的 表示在 年中有 年发生战争的次 %!%)"!#"&*( )#" %)" 数是 发生的频率是 %! %)" !" !#"&*(" " )#" ## 第五行表示在 年中有 年发生战争的次数是大于等于 次 )#" ) ) 的 发生的频率是 ! ) !" !!&*(# $ )#" 我们称表 是观测数据的频率分布表 %"&% $+,-./-0123456,47/6480 它简化了 年中有关战争爆发的 个观测数据 帮助我 697:-%# )#" )#" ! 们更清楚地看到战争爆发的特征和规律 # 制作频率分布表时 先将数据从小到大排列 然后将排列后的数 ! ! 据进行分段 相等的数据分在同一段内 每段中的数据被称为一组数 ! # 据 所以我们又把分段称为分组 一般来讲 当样本量是 可以参 ! # ! $! 照下面的经验公式将数据分成大约 %"%;):<$ 段 但是这里的经验公式只对分段起参考作用 实际应用时 应当根 # # ! 据样本量的大小和数据的特点以及分析的要求灵活确定 # 让我们通过例子学习频率表的制作方法 # 例 下面是某城市公共图书馆在一年中通过随机抽样调查得到的 " 天的读者借书数 数据已经从小到大排列 请制作频率分布表 ’! ! ! # "%#""#!""#*""=*""*%"#!%"#!="#%!"#%%"#%" #%="#%="##>"#)#"#))"#)="#)*"#$%"#’!"#’" #’="#>""#>)"#>*"#=#"#=$"#*!"#*#"#*’"#** )!!")!)")!’")"$")"*")#!")#’")#="))!"))% )))"))’")$!")$#")$’")$=")>%")>#")>$")=# 83 书书书第 12 章 统计学初步 ··············································· !"!!!#$!!#"!!#"!$%&!$%!!$!#!$$’!$’"!$"! 解 数据中的最小值是 最大值是 这 个数据就散布 ! %&(! $"!! ’) 在闭区间 中 取一个略大的区间 它的端 "%&(!$"!# ! "%))!’))#! 点都是整数 用经验公式计算出 ! "#&*!+,$#&*!+,’)""! 将 八等分 排在表的第一列 计算出数据落入各段的个 "%))!’))# ! ! 数 填入第二列 计算出数据落入各段的频率 $! ! % ( % ( #$-! "(.(-!$! #$-! & ’) % ’) " ’) 依次填入第三列 最后将各列之和填入最后一行 得到频率分布表 ! ! &%.%! 表 !!!! !"#" 借出书数 发生次数 发生频率 % $ % % "%))!%$)# ( $- !!!"#$%&’( %%$)!())# % (.(- )*+,-#$./! %&01234!5 %())!($)# &% %)- 67! %($)!!))# &! %(.(- %!))!!$)# &% %)- %!$)!$))# && &".(- %$))!$$)# ( $- %$$)!’))# ( $- 总 计 !! ’) ##.#- 从上述频率分布表可以方便地分析出以下结果 !! & 有 的工作日借出的图书少于等于 册 ".(- ()) ’ 有 的工作日借出图书的数量在 至 册之间 ’(.(- ()& !$) ’ 有 的工作日借出的图书在 册以上 !".(- !)) ’ 只有 的工作日借出的图书多于 册 &)- $)) ! 当总体是全年每个工作日的借书数量时 上述结果可以作为对总 ! 体的推测 ! 从上例可以总结出制作频率分布表的一般步骤如下 & 第一步 将数据从小到大排列 将排列后的数据进行分段 相等 ! ! ! 的数据必须分在同一段内 每段中的数据被称为一组数据 所以我们 ! ! 84 书书书 书书书第 12 章 统计学初步 ················································ 又把分段称为分组 ! 分段的多少应当适中 分段过多 数据过于分散 不利于看出数 ! ! ! 据的特征和规律 分段过少也不利于看到数据的特征和规律 当样本 " ! 槡 !!!"#$!" # 量是 可以参照经验公式将数据分成大约 段 "! #$!"#$%" ! %&’()$ 第二步 决定各段的长短 在许多情况下 为了方便 除去第一 ! ! ! ! 和最后的两段 可以把其他各段的长度取作相同 还应当把各段的端 ! ! 点确定在便于记忆的数值上 为了达到以上目的 第一段的左端点可 ! ! 以比数据的最小值小一些 最后一段的右端点可以比数据的最大值大 ! 一些 ! 第三步 绘制频率分布表的第一列 参考上例 ! # $! 第四部 计算每段内数据的个数 填入表格的第二列 ! "! ! % 第五步 计算数据落在第一段内的频率 填入表格的第三列 ! &! ! % 第六步 将第二 第三列之和填入最后一行 ! % ! 说明 由于频率分布表的制作没有统一的数据分段方法 所以对 ! ! 相同的数据 同学们可以作出不同的频率分布表 但是好的频率分布 ! ! 表应当是简单明了的 ! 练 习 制作习题 第 题中 个同学身高的频率分布表 & ’ #( ! 习题 ! ! 用随机抽样方法调查了某城市 辆公交车的营业额 单位 元 数据已从小 )* # & $! 到大排列 ! 85 书书书 书书书第 12 章 统计学初步 ··············································· !!!"#!!#$!!#"!!#%!&’’!&’’!&’’!&’(!&’(!&’! !!&’&!&’)!&’*!&’#!&((!&($!&("!&("!&!(!&!& !!&!%!&!*!&&(!&&$!&&)!&!&!&!&$%!&$* !!&"’!&"’!&"!!&""!&"#!&"#!&)(!&)&!&%’!&%) !!&%%!&*&!&**!&*#!’!)!$’$!$(’!$(’!$(( 制作频率分布表 !(" # 对频率分布表进行简单的分析 参考 的例题分析 !!" ! +,*$ "! !! (1!2,.&3,.!2!频频率率分分布布直直方方图图 数据的频率分布图初步展示了数据分布的一些规律 如果用图形 ! !!!"#$%&’! 来表示频率分布就会更加形象和直观 显示数据频率分布的图形有频 ()*+!"#$,-. ! 率分布直方图和茎叶图 /0123456!" ! # "%&’()*+#789 有了数据的频率分布图 很容易作出频率分布的直方图 :!;<=>()*0 $ ! ?@ABC!D+EF 将观测数据按照制作频率分布表的方法进行分段 计算出数据落 $ GH6IJKL0MN 入各段的频率 将各段的端点画在直角坐标系中的横坐标上 用 O!PQR!""$,S "$ $ # !"",,1TUVWX 组距作为纵坐标的高 就得到了由相连接长方形构成的图形 我 "% $ ! YZ0[\BC8() # 们把所得到的图形称为数据的频率分布直方图 简称为直方图 *! $ !-./012 3456"! 例 绘制 例题中图书馆借出图书数据的频率分布直方图 ! +,*& ! 解 在横坐标上标出所有的数据分段的端点 ! $ !’’$!"’$&$""’$)’’! 在区间 上绘制以 为高的矩形 ’!’’$!"’( ’,’"%"’7’,’’( # 在区间 上绘制以频率 为高的矩形 ’!"’$&’’( ’,’’’)) # && 在区间 上绘制以频率 为高的矩形 ’""’$)’’( ’,’’( ! 就得到了需要的频率分布直方图 如图 ! (! (! 从频率分布直方图可以更直观地看到图书馆每日借出图书册数的 分布情况 ! 86 书书书 书书书第 12 章 统计学初步 ················································ 图 频率表 的分布直方图 !" !! !"#" 练 习 制作习题 第 题中 个同学身高的频率分布直方图 $ " %& ! 习题 ! ! 下面是 年至 年广州的月降水量 单位 数据摘自 中国气象年 !&&’ "((( ! "))# $ 鉴 请绘制频率分布直方图 % ! 年 !""# !$$!!($ !$( !!&’!!$$!%$&!"%* !"*"!"(%!!%+!!(!%& 年 !""$ !’+ !!" %! "%, +($ +’( ""+ !"! !$, %* "" !( 年 !""" !+% ( $" !!’ !," !," !’$ %&$ "’+ %( "$ ,% 年 %&&& !!! +( "* %!& "(+ !&’ "**#& !*, ,’ +(% +% %+ 87 书书书第 12 章 统计学初步 ··············································· !! !1"2#.$3#.$3!频频率率折折线线图图 用 分别表示频率分布直方图中各矩形上边的中 !!!!"!! ! " " 点 在直方图的左边延长出一个分段 分段的中点用 表示 在直 ! ! ! # % 方图的右边也延长出一个分段 分段的中点用 表示 ! ! # "$! 用直线连接 就得到了一条折线 这条折线叫作 !!!!"!! ! % ! "$! 频率折线图 频率折线图也反映出数据频率分布的规律 # # 图 是 的例题中图书馆借出图书数目的频率折线图 !" " ’$ # 图 频率表 的频率折线图 !" "! !"#" 案例 选择性繁殖问题 为了研究老鼠的智力能否遗传 伯克 ! ! " ! 利 大学教授做了以下的试验 分别让 只老鼠走相同 #()*+),)-$ # !." 的迷宫 每只老鼠走 次 老鼠犯错误的次数就是走不出迷宫的次 ! !/ # 数 我们把犯错误少的老鼠称为伶俐老鼠 记录每只老鼠犯错误的次 # # 数 得到 个数据 这 个数据的频率折线图如图 ! !." # !." !" $# 图 !" $ 试验后把伶俐的老鼠放在一起 让它们进行繁殖 把不伶俐的老 ! ! 鼠放在一起进行繁殖 繁殖 代之后 得到伶俐组的后代 只 非 # 0 ! ’1 ! 88 书书书第 12 章 统计学初步 ················································ 伶俐组的后代 只 让这两组老鼠再走相同的迷宫 每只走 次 !" ! ! #$ ! 得到各组老鼠犯错误的次数后 为两组数据作出的频率折线图如图 ! #% &! 图 #% & 左面的折线图是伶俐组后代的频率折线图 右面的折线图是非伶 ! 俐组后代的频率折线图 这两条折线图有明显的差异 伶俐组的后代 ! ! 犯错误的次数明显地少 说明老鼠走迷宫的能力是具有遗传性的 ! ! 练 习 制作习题 第 题中 个同学身高的频率折线图 ! % &$ ! 习题 ! ! 根据习题 中 年至 年的广州月降水量数据 绘制频率折线图 " #$$’ %((( ! ! !! #1%2).*3).&4!数 数 据 据 茎 茎 叶 叶 图 图 直方图主要用于展示分段数据的频率分布 对于没有分段的观测 ! 89 书书书第 12 章 统计学初步 ··············································· 数据还可以用数据的茎叶图展示它的特性 ! 数据的茎叶图 由 茎 和 叶 两部分组成 在制 !!"#$%&’"" # $ # $ % 作茎叶图的时候要先确定数据的 茎 和 叶 从数据的茎叶图可 # $ # $! 以看出数据的分布形状及数据是否对称 是否集中等分布特性 % ! 我们通过举例说明茎叶图的制作方法 ! 例 下面是上海市 年 月 日至 年 月 日空气中 !! ())* + ,, ())* - , 可吸入颗粒物的监测数据 请为这批数据制作茎叶图 ! ! -.!-.!//!+,!/(!.(!..!.0!.(!/(!.0 +)!-)!0/!0+!0*!/(!.,!.+!/+!0/!01 解 将数据从小到大排列得到 ! & .,!.(!.(!..!.+!.0!.0!/(!/(!/(!// /+!+)!+,!-)!-.!-.!01!0*!0/!0/!0+ 数据的十位上的数是 把它们叫作 茎 排列 .%/%+%-%0% # $% 在下面茎叶图的第一列 ’ 茎 后面的个位数分别是 把它们叫作茎 . ,%(%(%.%+%0%0% 的 叶 排在茎 的后面 . # $% . ’ 按相同的方法把茎 的叶 排在茎 的右边 / (%(%(%/%+ / ’ (( 把茎 的叶 排在茎 的右边 0 1%*%/%/%+ 0 ! 如此就得到了如图 所示的茎叶图 ,( . ! 树茎 树叶 . !,!(!(!.!+!0!0 / !(!(!(!/!+ + !)!, - !)!.!. 0 !1!*!/!/!+ !!!!"#$%&’ 图 ,( . (!!"!! 从茎叶图中看出 尽管这 天中可吸入颗粒物都是处于良的水 )!"#$%&’ !! % (( ("#!#!!! 平 但是有较多的时间接近于优 也有较多的时间接近于轻微污染 % % ! *+,-!"#$ 在同一个茎叶图中还可以表现两组数据的分布情况 这样做有利 %&’(#!#!#"!! % 于对这两组数据进行比较 我们称表示两组数据的茎叶图为双茎 ! 90 书书书 书书书第 12 章 统计学初步 ················································ 叶图 ! 例 下面是上海市 年 月 日至 年 月 日空气中 !! !""# $ %% !""# & % 二氧化硫和二氧化氮的监测数据 请为这两组数据制作一个双茎叶 ! 图 并进行比较 ! ! 二氧化硫数据 "’’!(!!’#!$%!("!’%!’’!’(!’%!’&! (%!(!!()!$*!$!!()!’&!#!!#!!(’! $$!$*! 二氧化氮数据 "*&!*$!*"!*)!*%!%)!!!!!!!%&!!(! !’!*%!*&!##!#!!*’!!!!%)!!!!*$! ’"!*&! 解 先将两组数据分别从小到大排列 得到 ! ! " 二氧化硫数据 "#!!#!!’%!’%!’#!’’!’’!’(!’&!’&! ("!(%!(!!(!!(’!()!()!$%!$!!$*! $*!$$! 二氧化氮数据 "%&!%)!%)!!!!!!!!!!!!!!’!!(!*"! *%!*%!*’!*$!*$!*&!*&!*&!*)!#!! ##!’"! 这两组数据都是十位数 选用十位上的数作 茎 排在双茎叶 ! # $! 图的中间一列 它们是 ! %!!!%!$! 然后将二氧化硫的各位数作为 叶 依次排在相应的茎的左边 # $! ! 例如 从数据 得到茎 的叶 排在 的左边 ! #!!#! # !!!! # & 从数据 得到茎 的叶 ’%!’%!’#!’’!’’!’(!’&!’& ’ %!%! 将它们从大到小排在 的左边得到 #!’!’!(!&!&! ’ &!&!(!’! ’!#!%!%& %% 把茎 的叶 从大到小排在 的左边 $ %!!!*!*!$ $ & 再按照例 的方法把二氧化氮数据排在 茎 的右边 % # $ ! 这样就得到了两组数据的双茎叶图 图 ’ %! ((" 91 书书书第 12 章 统计学初步 ··············································· 二氧化硫 二氧化氮 树叶 树茎 树叶 ! "!#!# $ $!$!$!$!%!& ’ (!!!!!%!)!)!"!"!"!# $!$ * $!* "!"!&!%!%!*!!!! % ( #!#!%!$!$!!!( & )!’!’!$!! ) 图 !$ & 从上述茎叶图可以看出 二氧化硫的空气质量指标比二氧化氮的 !! ! 空气质量指标要差很多 二氧化硫的空气质量指标基本都处在良好的 ! 水平 而二氧化氮的空气质量指标都处在优的水平 ! ! 数据茎叶图的优点是显示了数据的每个信息 从茎叶图中可以直 ! 观地看到数据的分布情况 但是数据量很大时 茎叶图的效果就不好 ! ! 了 因为这时的茎叶图会很长或很宽 ! ! 数据的茎叶图 茎叶图的茎也可以是两位或三位数 ! 例 制作以下两组数据的双茎叶图 ! ! 数据 !!!!$"!!’"!!%"!$’"!$&"!$)"!’$"!’)"!’""!’#" !*$"!*’"!%&"!%""!%#"!&!"!&*"!&%"!&%! 数据 $!!$’"!$*"!$&"!’*"!’%"!’%"!’)"!*$"!*’"!*&" !*)"!*#"!%$"!%""!%#"!&$"!&’"!&*! 解 数据都是三位数 我们以前两位数作为茎 它们分别是 ! " " !!" 按照例 的方法可以作出双茎叶图如图 !$"!’"!*"!%"!&! $ !$ )! 92 书书书第 12 章 统计学初步 ················································ 数据 数据 ! " 树叶 树茎 树叶 #!$!" !! %!&!$ !" $!’!& (!)!%!" !$ ’!#!#!% $!" !’ "!$!&!%!( (!)!& !# "!)!( #!#!’!! !& "!$!’ 图 !" % 练 习 请分别制作下面的习题中数学 物理 语文考试成绩的茎叶图 ! ! ! 习题 !! !" 甲班的期中考试成绩排列如下 " 数学 "##&%#&)#%*#%!#%##%%%#%(#)*#)"#)$#)$#)$#)’# )’#)##)))%#))#))#))#(!#($#($#($#($#($#(’#(## (%#((#((#((#!**#!**#!**#!**! 物理 "#%#&*#&"#&’#&%#&%#%*#%"#%$#%’#%’#%’#%%#%%#%)#%)# %(#)*#)*#)!#)!#)!#)"#)"#)’#)’#)’#)’#))%#))#($# (##((()#((#((#!**#!**! 语文 "&"#&%#&%#%*#%*#%*#%!#%"#%"#%$#%’#%##%##%%%%# %)#%)#%)#%)#%(#%(#)*#)*#)*#)*#)!#)"#)"#)"#)$#)$# )’#)’#)))#)(#(*#($#(#! 请分别对数学和物理 物理和语文 数学和语文制作双茎叶图 并通过对茎 ! ! # 叶图的观察回答以下问题 " 哪科平均成绩最好 $!% & 哪科成绩分布最集中 $"% & 93 书书书第 12 章 统计学初步 ··············································· 数据的相关性 !1"2#.$4!数据的相关性 !! 在实际问题中 我们经常遇到有相关关系的变量 比如讲身高与 !! ! ! 体重的关系时 虽然身高不能确定体重 但总的来讲 身高者 体 ! ! ! ! 也重 ! 在考虑某一个特定地区居民的身高和体重的关系时 用 表示 ! " 人的身高 用 表示体重 总体来讲 随着 的增大一般也会增 ! # ! !# " 大 这时我们称 和 有相关关系 ! " # ! 在某地区的 岁居民中随机抽取了 个样本 用 和 !"!#$ !$ ! " # $ $ 分别表示第 个人的身高和体重 得到的数据如下 $ ! " 身高 #%& !’# !() !(* !+" !)( !+! !++ !)! !)’ !)$ 体重 #,- ’! ’* )! +* ). )* +’ )* ). (’ 数据 和 是成对出现的 所以用 表示第 个人的身高 " # ! $"!#% $ $ $ $ $ 和体重 这时称数据对 ! $"!#%!$%!!"!&!!$ $ $ 为样本或观测数据 样本是平面直角坐标系中的 个点 将这 个 ! !$ ! !$ 点画在坐标系上得到的图称为观测数据的散点图 $/%01123450-30&%6 见图 !" .! 图 例中数据的散点图 !" .! 从上面来看 用 泛指总体中某个体的身高和体重时 ! $"!#% ! 我们把身高和体重的关系说成是 和 的关系 " # ! 94 书书书第 12 章 统计学初步 ················································ !! !1"2#.$4#.!1!相相关关性性 无论是从抽样调查中得到的成对数据 还是从科学实验 工农业 ! " 生产中得到的成对数据 在统计学中也都称为观测数据或样本 称数 ! ! 据对的个数为样本量 ! 样本量是 的成对观测数据是用 " ##!$$!##!$$!%!##!$$ ! ! " " " " 表示的 这里 对固定的 和 或是来自相同的个体 或是同一 ! ! %!# $ ! % % 次试验的观测数据 对 和 或是来自不同的个体 ! %"&!##!$$ ##!$$ ! % % & & 或是不同试验的观测数据 ! 在图 中 随着身高 的增加 体重 有明显的增加趋势 !" % ! # ! $ ! 这时称 和 是正相关的 当数据 # $ ! ## ! !$! $!## " !$" $!%!## " !$" $ 十分明显地集中在一条上升的直线附近时 我们称 和 是高度正 ! # $ 相关的 ! 图 !" & 95 书书书第 12 章 统计学初步 ··············································· 图 的 和 展示的数据是高度正相关的 当上述数据也 !" # !!" !"" ! 分布在一条上升的直线附近 但集中的程度不十分明显时 我们称 # # " 和 是中度正相关的 图 中 和 展示的数据是中度正相 # ! !" # !$" !%" 关的 ! 当数据 十分明显地集中 !" ! ##! "# !" " ##" "#$# !" $ ##$ " 在一条下降的直线附近时 我们称 和 是高度负相关的 图 # " # ! !" 中 和 展示的数据是高度负相关的 和 展示的数据是 !& !!" !"" #!$" !%" 中度负相关的 ! 图 !" !& 我们把有高度相关性或中度相关性的数据统称为有相关性的数 据 图 和图 中展示的数据都是具有相关性的数据 这 ! !" # !" !& # 时也称 和 是相关的 " # ! 练 习 请绘制以下数据的散点图 ! 96 书书书第 12 章 统计学初步 ················································ 年份 ! !"#$ !"#% !"## !"#& !"#" 比萨斜塔倾斜量 " %’( %’’ %$% %%# %#) 习题 !! !! 年的 月至 月北京和广州的月平均气温 单位 记录如下 (*** ) !* ! "+# # 月份 ) ’ $ % # & " !* 北京 & !$ (* (# )* (% (( !) 广州 !" () (% (& (" (& (# ($ 请分别绘制北京和广州月平均气温的散点图 并判断气温平均值与月份的相关性 $ # !! ! 1 ( 2 , . ’ 4 , . ( 2 !回回归归直直线线 当 和 相关时 如果根据数据 %!& %"& $ $ $ !!$"#$!!$"#$’$!!$"# ! ! ( ( % % 描出的散点图中的点大致分布在一条直线的附近 我们将这条直线称 $ 为回归直线 下面就寻找这条直线 # # 在平面直角坐标系中 两个点 可以决定一条 $ !!$"#$!!$"# ! ! ( ( 直线 # 当 时 "(" !"! $&""’ ( !!!(!#)"$ ( ! !(! ! ! ( ! 这时 两个点都在直线上 所以这两个点与直线 的距离平均最近 $ $ & # 给定三对观测数据 97 书书书第 12 章 统计学初步 ··············································· !!""#"!!""#"!!""#" ! ! " " # # 当 不全相同 我们也求一条直线 使得以上三个点与直 !"!"! " #" ! " # 线 的距离平均最近 # $ 用 !!!!!!!!#$"%&!’( 表示要求的直线 在平行于 轴的方向 作以上三点到直线 的连 " " " # 线 交点 的坐标见图 " )"*"+ !" !!$ 图 !" !! )$!!"&!’(#"*$!!"&!’(#"+$!!"&!’(#$ ! ! " " # # 三对观测数据和它们与直线 交点的距离分别是 # "",!&!’(#"""",!&!’(#"""",!&!’(#"$ ! ! " " # # 我们用这三个距离的平方和 !",&!,(#"’!",&!,(#"’!",&!,(#" ! ! " " # # 衡量这三个观测数据远离直线 的程度 如果 使得 # $ ("& -!("%!",&!,(#"’!",&!,(#"’!",&!,(#" ! ! " " # # 达到最小 就称直线 是回归直线 " #$".%&!’( $ !!!""!! "!#$ ! % 一般地 要为样本量是 的观测数据 &""%"!" "!#$ " %&"" " / 其中的 不全相同 %#%"!’ "!#$ ’ %&"" !!""#"!!""#"%"!!""#!! ! # ! ! " " / / 0 #$%&’()!* 建立一条直线 使之与观测数据平均最近时 也采用相 +,( #$".%&!’(" " 同的方法 沿平行于 轴的方向 点 到它与 的交点的距 $ " " !!""# # 0 0 离是 "",!&!’(#""0%!"""%"/$ 0 0 我们用这些距离的平方和 98 书书书 书书书第 12 章 统计学初步 ················································ !!""##$!%’&"#"(!%’&"#"($(!%’&"#" ! ! " " ) ) 衡量观测数据远离直线 的程度 如果常数 使得 达到最 * + ""# !!""## 小 就称直线 " *%%,$#’(" 是 与 的回归直线 &’’ &%’ + - - 得到了回归直线后 只要 与 高度正相关或高度负相关 " &’’ &%’ " - - 对于新的 就可以用回归直线上的点 作为 的预测值 ’" %,$#’(" % + 用 和 分别表示 和 的样本均值 用 表示 的方 ’! %" &’’ &%’ " ." &’’ - - ’ - 差 引入符号 + ’%(’%($(’% . $ ! ! " " ) )&’!%"+ ’% ) 可以证明 只要 不全相同 回归直线中的 " ’"’"$"’ " ! " ) . #$ ’%""$%"’!+ ." ’ 例 下面是某冷饮部 天中出售的冷饮杯数和当天最高气温的 !# # 记录数据 + 最高气温 ($ "% "& !’ "( (% () * (" 杯数 (% (’ "& (’ *" )& !& )’ 请建立坐标系 绘制上述数据的散点图 并建立回归直线方程 " " " 且在同一个坐标系中绘制数据的回归直线 并预测最高气温是 + (+$ 的一天大约能出售多少杯冷饮 + 解 用 表示最高气温 用 表示杯数 由题意可得数据的散 # ’ " % " 点图如图 所示 !" !" + 从数据的散点图看出卖出的冷饮杯数 和最高气温 是高度 &’’ &%’ - - 正相关的 + 先计算出 再计算出 ’!$"*,"*"%"$(#,"*" . $&*,))".$&,*&+ ’% ’ 最后得到 . &*,)) #$ ’%$ $!,+)) ." &,*&" ’ "$%"’!$(#,"*-!,+)."*,"*$!"+ 99 书书书第 12 章 统计学初步 ··············································· 于是 回归直线是 ! "!#!"#$$%!%& 因而 和 的回归直线如图 中直线所示 "$# ""# !% !% & ’ ’ 图 !% !% 当 时 对 的预测值是 $#’ ! " "!#!"#$()!%*$&"%& 故最高气温是 时 大约可以出售 杯冷饮 ’ ! $& & 例 在测量一根新弹簧的劲度系数时 测得了如下的结果 !! ! & 所挂重量 $+ !"## %"## &"## ,"## -"## ."## 弹簧长度 $/0 !#"!1 !!"%! !!"1, !&"#! !$"%. !,"#& 建立坐标系 绘制数据的散点图 %!& ! ’ 建立回归直线方程 并在同一个坐标系中绘制数据的回归直线 %%& ! & 解 用 表示所挂重量 用 表示弹簧长度 由题意可得 ! %!& $ ! " ! 数据的散点图如图 所示 !% !& & 图 !% !& 100 书书书第 12 章 统计学初步 ················································ 从数据的散点图 可以看出 和 是高度正相关的 !!" "! "# #!$ ##$ $ " " 按例 中的方法可以计算出 " !!%$%&’%#"%"!%&(&%& #$%)$%!%*"$ !# ! 因此 & $%)$ ’% !#% #’%+% &! !%*"! ! (%#")’!!#"!%&(&,’%+-$%(%($ 于是 回归直线是 % *+%’%+!,(%($ 因而所求回归直线图如图 中直线所示 "! "# $ 我们知道弹簧的拉伸长度和所挂重量之间的关系服从胡克 !.//01" 定律 & #%’!,($ ’ ’ 其中 是弹簧所挂重物的重量 是弹簧拉伸后的长度 这里 ! !2"%# $ 的 和 是未知的 所以 和 分别是 和 的估计 ( ’ % ’%’%+ (%(%( ’ ( $ ’ ’ ’ ’ 由于 是弹簧本身固有的量 把它们称为参数 由 (%’ % !345461715"$ ’ ’ 于 是通过求平方和 的最小值得到的 所以我们称回归直 (%’ -!(%’" % 线中的 分别是参数 的最小二乘估计 这里最小是求最小 (%’ (%’ $ ’ ’ 值的意思 二乘是平方和的意思 % $ 练 习 请建立 与 的回归直线 $$ #!" $ ##" $ & 年份 ! "(*$ "(*& "(*+ "(*) 比萨斜塔倾斜量 # )") )!& )$! )&) 101 书书书第 12 章 统计学初步 ··············································· 习题 !! !" 当 不全相同时 证明 总在回归直线上 !! " ! !" " !"!" # ! #""!$#$ ! 以下数据来自对 个职工的随机抽样调查 表示月平均收入 表示用于购 "! # !" !$ 书和买报纸的月平均支出 单位 元 !# % $ 职工 ! " $ % # " !"&& !%&& !’&& !(&& "!&& $ !" !! !% !( "! 建立坐标系 绘制数据的散点图 #!$ ! & 请建立回归直线方程 并分别对月收入为 元和 元的职工预测他 #"$ ! !(#& !#&& 们每月平均用于购书和买报纸的支出 结果保留整数 # $& 在同一个坐标系中绘制数据的回归直线 #$$ ! 以下是 个同学每天平均完成作业的时间和每天平均看电视的时间的调查结 $! % 果 调查在同一个班内用简单随机抽样方法完成 单位 ! !# %)$ 同学 !!!! ! " $ % 做作业的时间 " " "*# $*" $ 看电视的时间 $ !*# &*+ &*! &*$ 建立坐标系 绘制数据的散点图 #!$ ! & 请建立回归直线方程 并分别对平均每天用 和 完成作业的 #"$ ! !*,!"*( $*") 同学预测他们平均每天看电视的时间 结果保留两位小数 # $& 在同一个坐标系中绘制数据的回归直线 #$$ ! 使用计算机或计算器做统计计算 是一个应用广泛的计算机软件 功能强大 使用方便 -./0.1 ! ! ! 102 书书书第 12 章 统计学初步 ················································ 易学易懂 的各种版本大同小异 低版本的命令可以在高版 !"#$%#& ! 本上应用 本书的统计部分使用 进行计算 ! "#$%#& ! 通过下面的例子可以初步学会使用 !"#$"%& 计算 均值时 用下面的两个语句 每个 ’! ’()!’)(!"!’)’ ! !# 语句后面敲换行 括弧中的内容是语句的解释 不输入 后 $*+$,-%! ! ! 同 !& ./#’()’’)(’"’’)’&’ 计算 的均值 "/0,#+$.%!$ " %! 将数据 从小到大排序时 用下面的语句 1! ’()!’)(!"!’)’ ! ( ./#’()’’)(’"’’)’&’ 23-$$.% 计算 个数据 的方差时 用下面的 4! #$(5 )5!)(!)(!"!67 ! 语句 ( +$(5’ 8$#)5’)(’)(’"’67&’ 计算 的方差 是样本量 21/9$:$8%"1#$+%’%)+!$ & !# %! 计算 个数据 的标准差时 用下面 ;! #/(5 )5!)(!)(!"!67 ! 的语句 ( +/(5’ 8$#)5’)(’)(’"’67&’ 计算 的标准差 2’/9$:$8%#2<-$$$+%’%)+%!$ & %! 计算回归直线中的最小二乘估计 时 用下面的语句 (! ’!( ! ! ./#’’1’4’"’=’6&’ 8$#’5>’7’’’>1’’"’’(>54&’ 计算 和 输出的第一个数是 第二个 $?3@8AB$$.!8!’%!$ ( ’! (! 数是 ’% &!# 得到的结果 5>(67)!6>65’1!$ %! 通过下面的例子学会使用计算器做统计计算 ! 计算 的样本均值 样本标准 ’! 4!(!7!’1!’6!1’>(!41>4 * 103 书书书第 12 章 统计学初步 ··············································· 差和样本方差 ! 进入计算模式 !"#$ % !! ! " 清空统计存储器 &’()* &+, - !! ! " . #* / #* 0 #* 1% #* 12 #* %13/ #* .%3. #* 计算的样本均值 &’()* "4 " 1535!! ! " 计算的样本标 &’()* 4!6 " 237001.8987!! ! 准差 " 计算的样本方差 4% " 2.307!! ! " 计算回归直线中的参数 对 预测 %! ##$# %"12 &! % 19 1/ %9 %/ .9 ./ & 19. 19/ 119 11/ 1%9 1%5 进入回归模式 !! !"#$ . 1 !! ! " 清空统计存储器 &’()* &+, " !! ! " 19#19. #* 1/#19/ #* %9#119 #* %/# 11/ #* .9#1%9 #* ./#1%5 #* 计算的 &’()* : " 2%32958712!! ! #" 计算的 &’()* ; " 9300/815%0/!! ! $" 对 预测的 12 &’()* <= 19238......! ! %"12 &" 104 书书书第 12 章 统计学初步 ················································ 数学实验 !! !! 用计算机画回归直线和做统计计算 打开用 超级画板 制作的课件 回归直线 屏幕 !!"! " ! #$%$"# 画面如图 &’ &($ 图 &’ &( 图上显示出有 个数据点的散点图和对应的回归直线 这些 &) * 数据点可以上下拖动 回归直线随之变化 左边显示出每个点的坐 # # 标 即数据对 右边显示出为画出回归直线而必须做的统计计算 # % 结果 *! 鼠标单击右下方 显示或隐藏操作说明 按钮 仔细阅读出现 ! " # 的文本内容 根据操作说明 输入本章 节例 中的数据 % # &’#(#’ ’ # 并把点的个数调整为 就得到书中图 所示的回归直线 +# &’ &, * 单击上方的 下一页 图标 屏幕上出现课件的第二页 ! " # # 105 书书书第 12 章 统计学初步 ··············································· 如图 即本章 节例 的回归直线图 对照一下 和 !" !#! !"$%$" " & ! 你作的是否相同 如果不同 检查自己的操作是否有误 " ! & 图 !" !# 拖动横坐标轴上的红点 注意淡蓝色小框中数字的变化 想一 ! ! 想 这些数字的意义是什么 能利用这些数字预测弹簧所挂重量为 ! " 时的长度吗 %$#’( " 类似地 可作出本章 节例 的图 并在图上预测最高 ! !"$%$" ! ! 气温为 时出售冷饮的数量 )*+ & 课件中设置了自动计算统计量的功能 为了熟悉统计量的计 & 算 也可以应用前一章学到的算法知识 自己写程序计算统计量 ! ! $ 下面举例说明如何在 超级画板 的程序工作区计算统 #,-, $ 计量 & 最直接的办法是把数据和公式直接输入 如 节的例 & !"$!$) )! 要计算 个数据 !* .$#!.$.!.$.!.$.!.$/!.$0!.$#!.$)!.$1!.$1 的均值并用 表示 就在程序工作区键入 !" ! % !"#!$%&’$%$’$%$’$%$’$%(’$%)’$%&’$%*’ $%+’$%+"#,-$ 按 键执行 下同 得到 2345-67384 & ’ 106 书书书第 12 章 统计学初步 ················································ !!"!!"#"#!$%%"! 如果想要用小数表示 可执行 $ !!!"#$%!&"% 返回 & 计算结果显示浮点数 !!" ! 再键入 !!’(% 执行得 !!"!!"#"#!$%%"&!’"#! 要计算这组数据的方差 可键入 !($ )*+, !-./*+0-.-*+0-.-*+0-.-*+0-.1*+0-.2*+0-./*+0-.3*+0 -.4*+0-.4*+"#&56’(*+$ 执行得到 !!"!)*$"#!$%%%%"&%’%)*$! 计算标准差则再键入 & !!)(,)+*5./$ 执行即得到 !!"!!)*$"+!$#(""#!$%%"&%’$!,$!(! 用这种方法计算的好处 在于能在计算过程中多次复习这些统 $ 计量的意义和公式 用了计算机 计算统计量的主要工作就是输入 - $ 数据 为了避免多次输入 号和平方运算符号 的重复性 - ’.( ’+(( 工作 可以做一个 模板 也就是先打一行符号 如 $ ’ ($ $ !++0*+0*+0*+0*+0*+0*+0*+0*+0*+0*+0*+0*+0*+0*+0*+" 复制一下 用时随时粘贴 再在符号 前面依次键入数据就是了 $ $ ’+( - 107 书书书第 12 章 统计学初步 ··············································· !! 小结与复习 一 总体和个体 ! !! 样本 是从总体中抽取的一部分个体 也称为观测数据 !! ! " ! 总体均值 总体的平均 常用 表示 "! ! " ! ! 样本均值 样本的平均 常用 表示 样本平均是总体均 #! ! " "" ! 值的估计 ! 均值的性质 $! ! 如果每个数据增加 均值也增加 #!$ #" #% 如果每个数据增加到原来的 倍 均值也增加到原来的 倍 #"$ $ " $ ! 总体方差 当 是总体的全部个体 是总 %! ! % ! "% " "&"% & " ! 体均值时 总体方差 " ""’ #% ! (! $")#% " (! $")&)#% & (! $" ! & 样本方差 用 表示样本 的均值时 样本 &! ! "" " """&"" " ! " * 方差 #"(""$")#"(""$")&)#"("""$ +"’ ! " * ! * 样本方差是总体方差的估计 ! 方差的性质 ’! ! 方差描述数据向均值的集中程度 方差越小 个体向均值 #!$ ! " 集中得越好 方差也描述数据的整齐程度或波动幅度 方差越小 ! ! " 数据就越整齐 ! ! #"$+"’ #"")"")&)""$("""! * ! " * 标准差 标准差是方差的算术平方根 数据带有单位时 (! ! ! " 标准差的单位和数据的单位是一致的 ! 108 书书书第 12 章 统计学初步 ················································ 二 抽样调查方法 ! !! 抽样调查的必要性 在很多实际问题中 采用抽样的方法 !! ! " 来确定总体性质不仅是必要的 也是必须的 " ! 随机抽样 指总体中的每个个体都有相同的机会被抽中 "! ! ! 简单随机抽样 无放回随机抽样 #! ! ! 随机抽样的重要性 不进行随机抽样 就可能得到有偏的 $! ! " 样本 利用有偏的样本很容易得到错误的结论 ! ! 随机数 是从 至 个号码中用简单抽样方法抽到的 %! ! ! " # 个号码 随机数可以在计算机上产生 ##""$ ! ! 分层抽样 将总体分成若干层 子总体 然后在每层中独 &! ! # $" 立地进行简单随机抽样 ! 分层抽样的特点 ’! ! 分层抽样在获得总体均值估计的同时 也得到各层的均值 #!$ " 估计 % 将差别不大的个体分在同一层 使得分层抽样得到的样本 #"$ " 更具有代表性 从而提高估计的准确度 " % 抽样调查的实施更加方便 调查数据的收集 处理也更加 ##$ " & 方便 ! 系统抽样 当总体中的个体按一定的方式排列 在规定的 (! ! " 范围内随机抽取一个个体 然后按照制定好的规则确定其他个体的 " 抽样方法 ! 系统抽样的特点 实施简单 如果了解总体中个体排列的 )! ! " 规律 设计合适的系统抽样规则可以增加估计的精度 " ! 三 用样本分布估计总体分布 ! !! 频率分布表 频率分布直方图 频率折线图和数据的茎叶 !! & & 图都是用来展示样本的分布性质的 这些分布性质是总体分布性质 " 的估计或近似 ! 绘制频率分布表时 数据分段个数 可以参考经验公式 "! " $ 109 书书书第 12 章 统计学初步 ··············································· !"!"#$%# 确定 但是经验公式只起参考作用 实际应用时 应当根据样本量 $ $ ! 的大小和数据的特点以及分析的要求灵活确定 $ 说明 由于频率分布表的制作没有统一的数据分段方法 所以 " ! 对相同的数据 可以作出不同的频率分布表 因而也可以作出不同 ! ! 的直方图和频率折线图 但是好的频率分布表 直方图和频率折线 $ # 图应当是简单明了的 $ 四 数据的相关性 ! !! 样本量是 的成对观测数据是用 # $%!&%!$%!&%!&!$%!&% ! ! & & # # 表示的 这里 对固定的 和 或是来自相同的个体 或是同 $ ! ’!% & ! ’ ’ 一次试验的观测数据 对 和 或是来自不同的 $ ’"(!$%!&% $%!&% ’ ’ ( ( 个体 或是不同次试验的观测数据 ! $ 当 十分明显地集中 !$ $%!&%!$%!&%!&! $%!&% ! ! & & # # 在一条上升的直线附近时 称 和 是高度正相关的 当它们分布 ! % & ’ 在一条上升的直线附近时称 和 是中度正相关的 高度正相关 % & $ 和中度正相关统称为正相关 $ 当 十分明显地集中 &$ $%!&%!$%!&%!&! $%!&% ! ! & & # # 在一条下降的直线附近时 称 是高度负相关的 当它们分布 ! %!& ’ 在一条下降的直线附近时 称 和 是中度负相关的 高度负相关 ! % & $ 和中度负相关统称为负相关 $ 当 和 正相关或负相关时 称 和 是相关的 ’$ % & ! % & $ 回归直线 当 和 有相关性时 可以用一条直线描述 #$ " (%) (&) ! ’ ’ 数据 和 的关系 这条直线就是回归直线 用 (%) (&) ! $ ’ ’ )"&*"+%,- 表示这条回归直线时 其中的 可以用下面的公式进行计算 ! -!+ " . +" %&!-"/+%$$ .& % 用回归直线进行预测 得到了回归直线后 只要 与 ($ " ! (%) ’ 110 书书书第 12 章 统计学初步 ················································ 高度相关 对于新的 就可以用回归直线上的点 !!" # ## !$%’( " 作为 的预测值 ! ) 复习题十二 在调查某城市的居民对自来水调价的意见时 能否只在该市的娱乐场所进行随 !) # 机抽样 原因是什么 能否只在该市的公共汽车站进行随机抽样 原因是 $ $ $ 什么 $ !! 以下是对某个公交车站候车的乘客候车时间的调查数据 单位 ") % $%’) "! ! "" !& & "’ !( !& ( " ) !’ * "+ "* !, - !- !& ( ! "! !- " !* !- ) " ( ’ * !& ( !* !’ "+ !, & ) "" !+ & & "’ !! ! !, "! 请计算样本均值和样本标准差 ) 甲 乙两篮球运动员上赛季每场比赛的得分如下 试通过画茎叶图比较这两名 ’) ( # 运动员的得分水平 ) 甲 !!"#!(#"*#"(#’!#’!#’-#’)#’**#*(+) 乙 !,#!’#!*#!-#"’#"-#",#’’#’,#’(!) 要在全年级 名同学中随机选取 人参加暑假的夏令营时 需完成以下工作 *) *(+ *( # & 设计一个随机抽样方案 %!’ ) 设计一个系统抽样方案 %"’ ) 设计一个分层抽样方案 使得选取出男生 名 女生 名 %’’ # "’ # "" ) 如果全年级有 个班 设计一个分层抽样方案 使得各班随机选取 人 %*’ & # # ( ) 从某个渔场通过简单随机抽样方法检查了 条鱼的质量 单位 如下 () ’+ % &.’ & 111 书书书第 12 章 统计学初步 ··············································· !"# !$% &!’ &!" ( &"# &)! &)( &)$ &(! &($ &%’ &%! &%) &$* &$( &$( #** #*! #*$ #!! #&" #&% ##& ##( #"! #%’ "’) "!# "&$ 制作频率分布表 !*" # 制作频率直方图 !!" # 制作频率折线图 !&" # 制作茎叶图 !#" # 计算样本均值 !"" # 计算样本方差 !)" ! 按以下要求分别设计随机抽样调查方案 调查本年级的近视率 )! $ ! 要求随机调查 个同学 !*" "’ # 要求调查男女同学各 人 !!" !" # 要求调查每班 个同学 !&" *’ # 要求调查每班的男女生各 人 !#" " ! 年的 月北京和广州的月平均气温 单位 记录如下 (!!’’’ &%*’ ! &+" & 月份 & # " ) ( % $ *’ 北京 " % *" !’ !( &’ !) !! *& 广州 # *$ !& !) !% !$ !% !( !" 请为北京和广州月平均气温建立回归直线 ! 下面是世界上 个地区的人均收入 百元 和受教育比例的数据 %! *’ ! " & 人均收入 " )* *)" *!" )#" &$% !’% !%$ &** !#) %) 受教育比例 # ) #& "’ %( %’ (* &’ (( $) (( 建立坐标系 绘制数据的散点图 !*" $ # 请建立回归直线方程 并在同一个坐标系中绘制数据的回归直线 !!" $ # 对 分别预测 的值 !&" "$)’$(’$!’’ # # 对于 预测 的值 !#" #$%" " ! 下面是某种合成纤维的拉伸强度 和拉伸倍数 之间的测量数据 $! # " ! 112 书书书第 12 章 统计学初步 ················································ 编号 ! " # $ % & ’ ( ) !* !! !" 拉伸倍 数 !+) "+* "+! "+% "+’ "+’ #+% #+% $+* $+* $+% $+& ! 强度 " !+$ !+# !+( "+% "+( "+% #+* "+’ $+* #+% $+" #+% !,-." 编号 !# !$ !% !& !’ !( !) "* "! "" "# "$ 拉伸倍 数 %+* %+" &+* &+# &+% ’+! (+* (+* (+) )+* )+% !* ! 强度 " %+% %+* %+% &+$ &+* %+# &+% ’+* (+% (+* (+! (+! !,-." 建立坐标系 绘制数据的散点图 !!" # $ 请建立回归直线方程 并在同一个坐标系中绘制数据的回归直线 精确到 !"" # ! 小数点后两位 "$ 对 分别预测 的值 精确到小数点后两位 !#" !#%+*#%+" " ! "$ 对于 预测 的值 精确到小数点后两位 !$" "#$+% ! ! "$ 113 书书书13 第 章 概 率 沙场百胜古来稀 !!! 九密一疏已足奇 !!! 祸福偶然存概率 !!! 风云变幻识玄机 !!! 在考虑一个未来事件是否会发生的时候 人 ! 们常关心该事件发生的可能性的大小 概率就是 ! 用来衡量一个未来事件发生的可能性大小的度量 ! 概率通过对简单随机事件的研究 将人们逐步引 ! 入复杂随机现象规律的研究 概率是研究复杂随 ! 机现象规律的有效方法和工具 ! 书书书第 13 章 概 率 ·················································· 投掷一枚均匀的硬币 出现正面朝上的机会是 在多次投 !! ! !"#! 掷这枚硬币后 正面朝上和反面朝上出现的次数大致相同 南非数学 ! ! 家凯瑞 是在非常困难的情况下发现这一点的 他的掷币 "$%&&’()# ! 试验是在德国人的集中营里进行的 二战爆发时他访问哥本哈根 德 ! ! 国人入侵丹麦时他被关进集中营 在那里度过了漫长的岁月 为了消 ! ! 磨时间 他一次次地掷硬币 并记录了下面的结果 ! ! $ 掷币 正面朝上 频率 掷币 正面朝上 频率 次数 次数 次数 次数 " # $%#%" " # $%#%" *" + ",+"" -"" .*/ ",!/" /" *" ",!"" 0"" .-1 ",!/- ." *0 ",!-0 1"" +*. ",!*- +" /* ",!/! 2"" +!1 ",!"2 !" /! ",!"" *""" !"/ ",!"/ -" /2 ",+1. /""" *"*. ",!"0 0" ./ ",+!0 .""" *!*" ",!". 1" .! ",+.1 +""" /"/2 ",!"0 2" +" ",+++ !""" /!.. ",!"0 *"" ++ ",++" -""" .""2 ",!"/ /"" 21 ",+2" 0""" .!*- ",!"/ ."" *+- ",+10 1""" +".+ ",!"+ +"" *22 ",+21 2""" +!.1 ",!"+ !"" /!! ",!*" *"""" !"-0 ",!"0 从上述掷币结果看出 随着掷币次数的增加 正面朝上的频率稳定在 ! ! 附近 我们将这个性质称为频率的稳定性 ",! ! ! 由学习过的概率知识知道 投掷一枚硬币 出现正面朝上的概率 ! ! 是 在多次重复试验中 正面朝上的频率稳定在正面朝上的概率 ",!! ! 附近 ! 115 书书书第 13 章 概 率 ·················································· 试验与事件 !1"3#.!1!试验与事件 !! !! !1"3#.!1#.!1!事事件件 投掷一枚硬币 用 表示硬币正面朝上 用 表示硬币反面朝 ! ! ! " 上 则试验有两个可能的结果 和 我们把 和 叫作试验的 ! "! "# ! " 元素 把集合 叫作试验的全集 ! #!!"$ # 投掷一枚骰子 用 表示掷出点数 用 表示掷出点数 ! ! !! $ $!%! 用 表示掷出点数 则试验的可能结果是 我们 % %! !!$!"!&!’!%# 称这 个数是试验的元素 称 % # #$"$%!!$!%!%$ 为试验的全集 # 对于一个试验 我们将该试验的可能结果称为元素 称所有元素 ! ! !!!!!!"#$%! 构成的集合为试验的全集 "#"!!!"#$%" ! $!%&’! 以后总用 表示试验的全集 用 表示 的元素 ! ! " ! ! 例 同时投掷一枚 角的硬币和一枚 元的硬币 写出试验的 !! ! ! ! 元素和全集 # 解 试验一共有 个元素 它们是 ! & ! 角硬币正面朝上 元硬币正面朝上 !!"! !! & 角硬币正面朝上 元硬币反面朝上 !""! !! & 角硬币反面朝上 元硬币正面朝上 "!"! !! & 角硬币反面朝上 元硬币反面朝上 """! !! # 全集是 !%#!!!!"!"!!""$# 在上面的例子中 和 是不同的元素 !!" "! # 例 投掷两枚硬币 写出试验的元素和全集 "! ! # 解 将一个硬币视为硬币 另一个硬币视为硬币 试验有 ! !! $# & 个元素 它们是 ! 硬币 正面朝上 硬币 正面朝上 !!" ! ! $ & 116 书书书 书书书第 13 章 概 率 ·················································· 硬币 正面朝上 硬币 反面朝上 !"! ! " " # 硬币 反面朝上 硬币 正面朝上 "!! ! " " # 硬币 反面朝上 硬币 反面朝上 ""! ! " " # 全集是 !$$!!"!"""!"""%# 和例 中的情况相同 这里 和 也是不同的元素 ! " !" "! # 投掷一枚骰子的全集是 !$$%!%$!"""&"#%# 用 表示掷出 点 是 的子集 我们称 是随机事件 &$$$% $ "& ! # & 简称为事件 掷出 点 就称事件 发生 否则称 ’%&’()*+,+’-(" # $ " & " 事件 不发生 & # 用 表示掷出偶数点 是 的子集 我们也称 是 ’$$""."#% "’ ! " ’ 随机事件 简称为事件 当掷出偶数点 称事件 发生 否则称事 " # " ’ " 件 不发生 事件 发生和掷出偶数点是等价的 ’ # ’ # 当 是试验的全集 我们称 的子集 是 的事件 简称为事 ! ! ! ! ! ! !!!"#$%!"& 件 当试验结果 即试验的元素 属于 时 就称事件 "!"!#$#" " #" ! ! ! ’(! 发生 否则称 不发生 ! ! " 对于全集 是事件和 等价 元素 和事件 发生 !"& &"! # "#& & !!!"#$%&’( 等价 )*+!,-./01 # 空集 也是 的子集 所以空集 是事件 空集 中没有元素 23$%&’!"# $ ! " $ # $ " "!"#$%&’()*’# 永远不会发生 所以我们称 是不可能事件 5678+ " $ # 也是 的子集 并且包括了所有的元素 所以必然发生 我 ! ! " " # !!!"#$%!& 们称全集 是必然事件 ’()*+,-.!" ! # #$ !!"#$%&!$"’&"( 练 习 叙述什么是试验的元素和全集 !# # 简述事件和全集的关系 "# # 简述事件和元素的关系 $# # 117 书书书 书书书 书书书 书书书第 13 章 概 率 ·················································· 习题 !! ! 口袋中有标号 的球各 个 为以下的试验写出全集 !! !!" ! ! ! 从中任取 个 !!" ! # 从中一次随机地取出 个 !#" # ! 投掷一枚骰子和一枚硬币 写出全集 #! $ ! 同时投掷一枚骰子和一枚硬币 写出以下事件 "! $ ! 硬币是正面 骰子的点数是奇数 !!" $ # 硬币是正面 骰子的点数是偶数 !#" $ # 硬币是正面 !"" # 骰子的点数是 !$" %! !! !1"3&.!1&.#2!事事件件的的运运算算 由于事件就是集合 所以对事件可以进行并 交和补的运算 $ % ! 例 投掷两枚骰子 一枚是红色 一枚是蓝色 写出全集和以 !! $ $ ! 下事件 ! 红骰子的点数是 !!""# & #’# 蓝骰子的点数是 !#"$# & "’# !""""$# !$""#$! 解 用 表示红色骰子的点数是 蓝色的点数是 试验的 ! !%$&" %$ &! 全集是 !!!#(!!$!"$!!$#"$!!$""$!!$$"$!!$%"$!!$’"$ !#$!"$!#$#"$!#$""$!#$$"$!#$%"$!#$’"$ 118 书书书第 13 章 概 率 ·················································· !!""#"!!"##"!!"!#"!!"$#"!!"%#"!!"" !$""#"!$"##"!$"!#"!$"$#"!$"%#"!$"" !%""#"!%"##"!%"!#"!%"$#"!%"%#"!%"" !&""#"!&"##"!&"!#"!&"$#"!&"%#"!&"$! 根据事件的定义 得到 " !"#"#%!#""#"!#"##"!#"!#"!#"$#"!#"%#"!#"$& !##$#%!""!#"!#"!#"!!"!#"!$"!#"!%"!#"!&"!#$& 红骰子是 点 蓝骰子是 点 !!#"!$#%!#"!#$# ’ # " ! (& !$#""$#%!#""#"!#"##"!#"!#"!#"$#"!#"%#"!#" "!""!#"!!"!#"!$"!#"!%"!#"!&"!#$ !"#$%!"& 红骰子是 点或蓝骰子是 点 # ’ # ! (! !’()$*"+,- 用 表示 的补集 ./012!!"34 !#" " ! !5" &67#89 在例 中 表示红骰子的点数不是 " "!#" #! :;!!"# $#"## 对于试验的全集 和事件 由于 和 有且只能有一个 !<#$"%$ ! "" " !#" 发生 所以我们称 是 的对立事件 " !#" " ! !!"#$%&’ 例 铅笔盒中有圆珠笔 支 钢笔 支 从中无放回地任取 ()*+!,%-./ !$ ! " # ! ! 支 用集合 表示下面 中的事件 0123!" " ""$"% !"#"!##"!!# ! !4!!!53" 支都是圆珠笔 !"#! & #$%" 恰有 支圆珠笔 !## # & 恰有 支圆珠笔 !!# " & 用 表示 !$# ""$"% !& 解释事件 的含义 !%# ""$""!$""#$"!#" ! 解 将 支圆珠笔标号 将 支钢笔编号 用 和 $ ! ""#"!" # ""#! & ’ 分别表示取出的有第 支圆珠笔和第 支钢笔 用 表示取 ( ’ ) ! &&& ) " # ! 出的是 号 号和 号圆珠笔 表示取出的是 号 号圆 " "# ! "&&( " "# " # " 珠笔和 号钢笔 按照事件的定义 得到 " )) " !"#"#%&&&$! " # ! !##$#%&&("&&("&&("&&("&&("&&($! " # " " # # " ! " " ! # # ! " # ! # !!#%#%&(("&(("&(($! " " # # " # ! " # 因为必有事件 之一发生 所以全集 !$# ""$"% " !#""$"%! 119 书书书 书书书 书书书第 13 章 概 率 ·················································· 至少有 支圆珠笔 !!"!!"# # " $% 不可能事件 !""### # $% 支都是圆珠笔 !$"#!# ## $% 至少有 支钢笔 !$!# # $ $$ !"#$%&!’ 在例 中 事件 的交集是空集 所以 发生 就不能发 " & !&" & ! &" ()*+," 生 发生 就不能发生 %" &! $ 当 我们称 互斥 !""##& !&" $ 练 习 投掷 枚硬币 观察结果 写出全集 分别用集合 表示以下 # & $ & !&"&% !$"& 中的事件 !""&!#" $ 恰好 个正面 !$" " % 至少 个正面 !"" $ % 都是反面 !#" % 计算 并解释它们的含义 !%" "$!&"$%&!$!& $ 习题 %% ! 投掷 枚硬币 观察结果 不写出全集 直接用集合 表示以下 $$ % & $ & !&"&% !$"& 中的事件 !""&!#" $ 至少 个反面朝上 !$" $ % 至少 个反面朝上 !"" " % 恰好 个反面朝上 !#" " % 计算 并解释含义 !%" !&!"%&!$!& $ 盒子中有标号 的白球各 个 标号 的黑球各 个 从中倒出 个 "$ $!# $ & $!" $ $ # & 120 书书书 书书书第 13 章 概 率 ·················································· 观察结果 写出全集 用集合 表示下面 中的事件 ! ! "!#!$ "!#!""#!"## ! 个都是白球 "!## $ 至少 个白球 ""# " $ 至少 个白球 "## ! $ 计算 并解释它们的含义 "$# "!#!""#!"##!$##! ! 概率及其计算 !1#3%."2$概率及其计算 $$ $$ !1#%3."%2.!1$古古典典概概率率模模型型 概率的定义 !! ! 投掷一枚均匀的硬币 全集 中有两个元素 事件 ! !%%&!’& ! "% 各有一个元素 根据已有的概率知识 得 %&&!#%%’& ! ! 中元素数 中元素数 (""#% ! % "中元素数!$$$("##% ! % #中元素数 ! !"#$%&’( " ! " ! )*+,-.! 投掷一枚均匀的骰子 则全集是 ! !%%)%)%!!"!’!&&! 若 表示掷出的点数是 表示掷出偶数点 于是全 "%%#& #!#%%"!$!&& ! 集 中元素的个数是 中元素的个数是 中元素的个数是 根 ! &!" !!# #! !!!!"""!#"" 据已有的概率知识 有 ! !$"##"$!%$%& 中元素数 中元素数 ’(& (""#% "中元素数 % ! !$$("##% #中元素数 % ! ! ! & ! " 由以上的例子引出概率的如下定义 ! 定义 设试验的全集 有 个元素 且每个元素发生的 $$ $ ! * ! 可能性相同 当 的事件 包含了 个元素时 称 ! ! " + ! + (""#% * 为事件 发生的概率 简称为 的概率 " ! " "’()*+*,-,./#! 我们把上述定义描述的概率模型称为古典概率模型 简称为古典 ! 121 书书书 书书书 书书书第 13 章 概 率 ·················································· 概型 ! 因此古典概型具有以下特点 ! 试验中所有可能出现的元素只有有限个 "!# $ 每个元素出现的可能性相等 ""# ! 对于古典概型 事件 的概率计算公式为 % " ! 中包含的元素个数 #""#$ "全集中的元素个数 ! 例 同时投掷 枚硬币 计算以下事件的概率 !! # ! ! 至少 个反面朝上 "!# ! $ 至少 个反面朝上 ""# " $ 恰好 个反面朝上 "## " ! 解 试验的全集为 ! ! !$&%%%%%%&%%&%%&%%%%&&%&%&%&&%%&&&’! 用 表示至少有一个反面朝上 则 中的元素至少含 个 "!# " % " ! &! ’"$&%%&%%&%%&%%%%&&%&%&%&&%%&&&’! 含有 个元素 于是 $ ’" $ % #""#$ ! % 用 表示至少 个反面 则 ""# ( " % ($&%&&%&&%%&%&%&&&’! 含有 个元素 于是 & ! ’( & % #"(#$ $ ! % " 用 表示恰好 个反面朝上 则 "## ) " % )$&%&&%&&%%&%&’! 含有 个元素 于是 # ’) # % #")#$ ! % 事件作为集合经过并 交 差和补的运算后得到的结果还是事 ( ( 件 于是可以计算经过集合运算后的事件的概率 % ! 例 在例 中 计算事件 发生的 "! ! % ""(%"#)%($)%!$) 概率 ! 解 全集 有 个元素 含有 个元素 ! ! % !""($"% $ % 含有 个元素 含有 个元素 "#)$)% # %($)$&&&&’% ! % 122 书书书第 13 章 概 率 ·················································· 含有 个元素 所以有 !!!"!###"##$"#$#"$##"$$$#" ! % " $ % ! &$’"(%" "&$’#!%" "&$(!!%" "&$!!!%" % # # # # 概率的性质 !% % 概率有如下的简单性质 & 概率总是 中的数 $%%&$&$’%$% $ ’&"%( %) 必然事件的概率是 $’%&$!%"% $ %%) !!!"#$%&’( 不可能事件的概率是零 $$%&$%%"& $ %% )*"! 在一副扑克的 张牌中随机抽取 张 用 表示得到的是草 !( % % ’ 花 用 表示得到的是黑桃 则 互斥 全集 有 个元素 " ( " ’"( % ! !( " 和 分别有 个元素 不用写出具体的全集 和事件 也 ’ ( %$ % ! ’"(" 可以直接计算出 %$ %$ &$’%" "&&$(%" % !( !( 由于 也是事件 含有 个元素 所以 ’"( " ’) " ’) %$ %$ &$’"(%" " ) "&$’%)&$(%% !( !( !( 概率的加法公式 如果 的事件 互斥 则 && ! ! ’"( " &$’"(%"&$’%)&$(%% 我们把概率的加法公式称为概率的可加性 可加的前题是两个事 % 件互斥 % 证 设 有 个元素 有 个元素 有 且 & ! * "’ + $+$*% "( ,$,$*" 个元素 则 由于 互斥 所以 +),$*% % &$’%"+**"&$(%",**% ’"( " 中元素个数 中元素个数 中元素个数 ’"( "’ )( "+),% 于是得到 +), + , &$’"(%" " ) "&$’%)&$(%% * * * 对立事件的概率公式 如果 是全集 的事件 则 ! ’ ! " &$!!’%"%*&$’%% 123 书书书 书书书第 13 章 概 率 ·················································· 证 和 互斥 并且 由概率的加法公式得到 !!"! ! ! !""!"!##!# $"!#"$"!"!#%$"!## 再利用 得到 于是 $"!#"! !"$"!"!#%$"!#! $"!"!#"!#$"!## 例 在一副扑克的 张牌中随机抽取 张 !! $% ! # 计算抽到是草花或黑桃的概率 "!# $ 计算抽到的不是草花的概率 " $ 计算抽到的不是草花也不是黑桃的概率 "’# # 解 用 表示抽到的是草花 用 表示抽到的是黑桃 则 ! "!# ! ! & ! 表示抽到的是草花或黑桃 并且 互斥 !#& ! !!& # 因此由题意可得 所以 !’ !’ !$"!#" !$"" ! $% $% !’ !’ !’ $"!#"$"!#%$"" % " # $% $% &( 表示抽到的不是草花 是 的对立事件 所以 "!"! ! ! ! !’ %! $"!"!#"!#$"!#"!# " # $% $% 表示抽到的是草花或黑桃 表示抽到的不是 "’#’"!#& !!"’ 草花也不是黑桃 # !’ !% $"!"’#"!#$"’#"!#$"!#"!# " # &( &( 例 袋中有红球和白球各 个 每次抽 个 有放回地随机抽 "! ! ! ! ! 取 次 计算 ’ # % 至少有 个红球 的概率 "!#!" & ! ’ $ 至少有 个白球 的概率 "&" & ! ’ $ 有红球或有白球的概率 "’# # 解 用 表示第 第 和第 次分别取到白 红 白 ! "!# &(& !( & ’ ( ( 球等 全集是 # !!")&&&!&&(!&(&!(&&!&((!((&!(&(!(((*! !!")&&(!&(&!(&&!&((!((&!(&(!(((*! 因此 ( !!!$"!#" "*+)($# ) 由于红球和白球处于对称的地位 所以 " ! $""$"!#"*+)($# 124 书书书第 13 章 概 率 ·················································· 表示有红球或有白球 这是必然事件 所以 !!"!!" # # #!!!""$"% 例 彩票的中奖率是 每次抽 张 有放回地随机抽取 次 " !" # " # ! % # 计算 $ 至少抽中 次 的概率 !""!$ % " & ’ 次也没抽中的概率 !#"" % 解 由于彩票的中奖率是 因此可将中奖的彩票视为红球 不 " " # # # 中奖的彩票视为白球 于是 等价于至少抽中 个红球 # ! " % 由例 的结论知道 !"" $ #!!"$%&’()% 由于 是 次也没抽中的概率 因此 !#" !#! " # #!!#!"$"*%&’()+%&"#)% 例 有 万张彩票 中奖率是 每次抽 张 无放回地随 "" "% # "(#% " # 机抽取 次 计算至少抽中 次的概率 ! # " % 解 由于彩票数量很大 抽取一两张基本不会影响彩票的中奖比 " # 例 所以无放回抽奖的中奖概率和有放回抽奖的中奖概率基本是一样 # 的 因此 由例 可知 至少抽中 次的概率仍然是 % # )!"" # " %&’()% 有人认为既然每次抽中的概率是 抽 次必然抽中 这是不 "(## # # 对的 上面的例 例 告诉我们 抽奖 次时 至少抽中 次的概 % $) ) # ! # " 率只有 %&’()% 完全相同的道理 当彩票的中奖率是 时 你购买 张彩 # "("%% # "%% 票中奖的概率是严格小于 的 实际上只有 " ! %&,!$"% 练 习 投掷两枚骰子 一枚是红色 一枚是蓝色 计算以下事件的概率 # # % % 两枚骰子的点数相同 !""!$ % &’ 红色骰子的点数小于蓝色骰子的点数 !#""$ % &’ 两枚骰子的点数之和是 !!"&$ % ,&’ !$"!!"#!!"% 125 书书书第 13 章 概 率 ·················································· 习题 !! ! 假设每个人的生日在一年的 天中是等可能的 在全校随机挑选一名同学 !! "#$ ! ! 计算以下事件的概率 ! 该同学的生日在 月份 "!# $ $ 该同学的生日在 月或 月份 "%# $ & $ 该同学的生日是 日 ""# ! $ 该同学的生日是 日或 日 "’# ! % ! 一批产品有 个 其中含有 个次品 从中随机抽取 个 计算 %! !(( ! !( ! ! ! % 这件产品是次品的概率 "!# $ 这件产品是正品的概率 "%# $ 这件产品是次品或是正品的概率 ""# ! 某电视台要招聘两名播音员 现在有三名符合条件的女士和两名符合条件的男 "! ! 士前来应聘 如果每个应聘人员被录用的概率相同 计算以下概率 ! ! ! 一名男士和一名女士被录用的概率 "!# $ 两名男士被录用的概率 "%# $ 两名女士被录用的概率 ""# ! 投掷两枚骰子 不用写出全集 计算以下概率 ’! ! ! ! 两枚骰子的点数相同 "!# $ 两枚骰子的点数之和是 "%# #$ 两枚骰子的点数之和不是 ""# #$ 至少一枚骰子的点数是 "’# "! 一个口袋内装有大小 质地均相同的 只球 其中 只为白球 只为黑球 $! & $ ! " !% ! 从中一次摸出 只球 求 % ! % 一共可能出现多少种不同的结果 "!# $ 摸出的 只球均是白球的概率 "%# % $ 摸出的 只球是 只白球与 只黑球的概率 ""# % ! ! ! 如果全集 的事件 两两互斥 用 表示事件 中至 #! ! "!#!$ ! ""#"$ "!#!$ 126 书书书第 13 章 概 率 ·················································· 少有一个发生 证明 ! ! ""#!$!%#&""##’""$#’""%#! 彩票的中奖率是 每次抽 张 有放回地随机抽取 张 计算至少抽中 !! "$#% " % # ! " 张的概率 ! "" "1#$3.%$2.%2"几几何何概概率率 例 在区间 中随机投掷一个质点 分别求质点落在区间 !" &&%## % 和 中的概率 &&%"# &"%%# ! 解 用 表示质点落在 中 用 表示质点落 " #&&&%"# &&%"# % $&&"%%# !!!"#$%&’! 在 中 用 表示质点落在 中 把 看作试验的 ()* "+,#-./ &"%%# % %&&%%## &%%## ! #%$%% "012#! 元素时 试验的全集 发生的可能性相 % !!$!%&&&%##!#%$%% 同 所以 % 的长度 ""##& " & #的长度 ! # ! 的长度 ""$#& " & $的长度 ! # ! 几何概率定义 设试验的全集 是长度为正数的 "" !" ! 区间 是 的子区间 如果试验的结果随机地落在 %# ! ! ! 中 则称 % 的长度 ""##& #的长度 ! 为事件 发生的概率 简称为 的概率 # % # ! 在几何概率定义 中 并不指定所述的 和 是开区间 闭区 " % ! # ’ 间 还是半开半闭的区间 这是因为区间 % ! "(%)#%&(%)#%"(%)(% 有相同的长度 &(%)( ! 例 公共汽车在 内随机地到达车站 "" &!’()* ! 求汽车第 到达车站的概率 ""# #()* ) 求汽车在 到达车站的概率 "%# "!#()* ! 127 书书书 书书书第 13 章 概 率 ·················································· 解 试验的全集是 集合 表示汽车在第 ! !!!!""#" "!!#"## 时到达 表示汽车在 到达 根据几何概 #$%& "’(!)"## )!#$%& # 率定义 $ ! * $%"&! !!"!$%%&! # " " 在例 中也可以用 表示全集 用 表示汽 * !!%!""& " %!%)"#& 车在 到达 计算的 是一样的 )!#$%& # $%%& # 下面把几何概率的定义推广到平面上 我们把平面上的矩形 # ’ 圆 椭圆等统一称为区域 ’ # 几何概率定义 设试验的全集 是面积为正数的 !! !! ! 区域 是 的子区域 如果试验的结果随机地落在 "" ! " ! 中 则称 " 的面积 $%"&! "的面积 ! 为事件 发生的概率 简称为 的概率 " " " # 几何概率也有如下的基本性质 # 概率总是 中的数 %)&!"$%"&")!% !!")# &( 必然事件的概率是 %*&$%!&!)!% )&( 不可能事件的概率是零 %#&$%#&!!!% &( 如果 互斥 则 %+& ""% " $%"$%&!$%"&&$%%&( 对立事件概率之和等于 %"&$%"&&$%!%"&!)!% ) 例 设雨点等可能地落在半径是 的圆 中 是半径为 "! )$ ! "" 的圆 如图 !,"$ % )# ) 计算雨点落在小圆内的概率 %)& ( 计算雨点落在小圆外的概率 %*& # 解 大圆的面积是 雨点等可能地落入大圆 小圆的 ! %)& "$*" - 面积是 雨点落入小圆的概率是 ")!,"*$*" 的面积 $%"&! "的面积 ! ")!,"* !!,*"# ! " 根据几何概率的性质 雨点落入小圆外的概率是 %*& "" 128 书书书第 13 章 概 率 ·················································· !!!!""#!#$%&’($%)’$ 例 陨石等可能地掉落在方圆为 !" &$$*+& 的区域内 该区域内有面积为 的湖泊 # ,$*+& $ 求陨石溅落在湖泊中的概率 $ 解 全集 的面积是 湖泊 的 " ! &$$*+ " 面积是 元素等可能地落在 中 由几 ,$*+&$ ! # 图 !" ! 何概率的定义得到 的面积 !!""# "的面积 # ,$ #$%-$ ! &$$ 陨石溅落在湖泊中的概率是 $%-$ 练 习 每天的整点 如 时 时 时等 北京站都有列车发往天津 一名乘客 ! . #!$ #!! " $ 在 时至 时之间随机到达北京站 计算 . !$ $ $ 他候车多于 的概率 !!" &$+/0 % 他候车恰好 的概率 !&" !’+/0 % 他候车少于 的概率 !"" "$+/0 % 他候车时间在 的概率 !-" &’!-’+/0 $ 习题 "" ! 一只麻雀随机地落在面积是 的广场上觅食 广场内有一个长 宽 !$ -$$+& $ &$+& 的草坪 还有一个半径是 的圆形花坛 计算 ’+ # ’+ $ $ 麻雀落在草坪中的概率 !!" % 麻雀落在花坛内的概率 !&" % 129 书书书第 13 章 概 率 ·················································· 麻雀落在草坪或花坛内的概率 !!" # 麻雀落在草坪或花坛外的概率 !"" ! 在长方形 中随机投掷一个质点 图 计算 #! !"#!$!%!& ! $! #"! $ !$"’!#"# # $ !#"’!#!$"# """""""""""" % & 图 !!"’!#!%!&"# $! # 证明 !"" ’!!#!$"#!#!%"""’!#!$"%’!#!%"! 在区间 中随机地投掷一点 计算该点落在 中的概率 !! &%’$( ’ &%’%&!( ! 在区间 中随机地取两点 用 表示它们的平方和小于 "! &%’$( ’ # $! 写出试验的全集 !$" !# 用集合表示出事件 !#" ## 计算 !!" ’!#"! 在区间 中随机地投掷两个点 用 表示它们的差的绝对值小于 ’! &$’#( ’ $ $)!! 写出试验的全集 !$" !# 用集合表示出事件 !#" $# 计算 !!" ’!$"! 两人在某天的 时至 时间各自独立随机到达某地会面 先到者等候 后 (! $ # ’ #%)*+ 离去 ! 写出试验的全集 !$" !# 用集合表示出事件 两人相遇 !#" $" * +# 计算这两人能相遇的概率 !!" ! 频率与概率 $1!3&.!3"频率与概率 "" 设 是某个试验的全集 是 的事件 在相同的条件下将该 "" ! ’# ! ! 试验独立地重复 次 我们称 ( ’ 次试验中 发生的次数 ( # ) " ( ( 是 次独立重复试验中 事件 发生的频率 !!!"#$%&’( ( ’ # ! )*+,-./01! 理论和事实都证明 在相同的条件下 将一试验独立重复 次 $ ’ ( ’ 130 书书书 书书书第 13 章 概 率 ·················································· 用 表示事件 在这 次试验中发生的频率 当 增加时 将 ! # " $ " !! " " 在一个固定的数值 附近波动 这个数值 就是事件 的概率 % ! % # 于是 是 的估计 &"##$ !! &"## $ " 历史上许多著名的统计学家对概率和频率的关系进行过验证 他 $ 们的试验结果总结在表 中 !"#! $ 表 !! !"#! 试验者 掷币次数 正面朝上次数 频率 " ! " 德 摩根 $ $%&’ !%(! %#)!’! 蒲丰 &%&% $%&’ %#)%(* 凯瑞 +%%% ")!( %#)%$$ 凯瑞 *%%% &)"’ %#)%&$ 费勒 !%%%% &*+* %#&*+* 皮尔逊 !$%%% (%!* %#)%!( 皮尔逊 $&%%% !$%!$ %#)%%) 罗曼诺夫斯基 ’%(&% &%!+" %#&*’$ 现在的随机试验工作可以在计算机上方便地进行 $ 例 表 是用计算机进行的投掷一枚均匀的骰子的试验总 !! !"#$ 结 其中 是试验的次数 表中的百分数是频率 例如表中第 行 $ " ! $ " 第 列的 表示试验次数 时 点数 出现的频率是 $ !)#%%,! "’!%$ ! $ !)#%%,$ 表 ! ! ! !"#$ 点数 "’!%$ "’!%" "’)%%% "’!%& "’!%) "’!%( ! !+#%%, !(#)%, !(#$’, !(#(!, !(#+$, !(#(*, $ !)#%%, !)#)%, !+#!$, !(#($, !(#&&, !(#($, " !’#%%, !+#!%, !(#+’, !(#*&, !(#’&, !(#(*, & !’#%%, !(#%%, !(#(’, !(#*+, !(#+(, !(#(&, ) !"#%%, !(#(%, !)#)%, !)#*&, !(#(*, !(#(&, ( !*#%%, !’#"%, !+#(&, !(#*$, !(#)), !(#+$, 从表 可以看出 当试验的次数逐步增加时 每个点数出现 !"#$ ! ! 的频率都向概率 靠近 !%("!(#(+, $ 例 中的计算机试验称为计算机模拟试验 计算机模拟试验还可 ! $ 以解决很多其他的计算问题 $ 例 利用几何概率估算圆周率 在平面上作一个边长是 $!! !" !%-. 131 书书书第 13 章 概 率 ·················································· 的正方形 在正方形内作一个半径等于 的圆 见图 ! !"# ! $% %! 图 在 内随机投掷的 个质点 $% %! ! $&&& 在该正方形内随机投掷 个质点 计算质点落入圆 的 "$# $ ! " 概率 $ 利用计算机模拟的方法估计 的值 "’# ! ! 解 试验的全集是正方形 ! "$# !#%"$!%#"$#$&!%#$&&! 事件 "#%"$!%#"$’&%’#’!& 是 的子集 根据圆面积的计算公式和几何概率定义 得到 ! ! ’ 的面积 ’""## "的面积 # ’!! # ! ! ! $&& ( 如果 是未知的 可以用如下的方法进行模拟计算 "’# ! ! ! 独立重复地在 中投掷 个质点 对于较大的 质点落入圆 ! ( ! (! 的频率 " 落入 的质点数 " ) # ! ( ( 由频率和概率的关系知道 是 的近似 所以对较大的 ) ’""# ! (! ( ! ) $ ! ( ( 是可以计算的 于是 ) ! ( )!#() ( 是 的估计 ! ! 132 书书书第 13 章 概 率 ·················································· 利用计算机在 中随机投掷 个质点 ! !"!"#!!"$!!"%!!"& ! 见图 把依次得到的 列入表 从表 可以看出 对 !$ $! ’! !$($# !$($ ! 于较大的 对 的近似是不错的 !!’! ! # 表 !!!!!!!!! !"#" ! !"# !"$ !"% !"& ’! $(")" $(!%) $(!*" $(!%+ 为了看清计算机模拟结果的随机性 再次进行模拟计算时 得到 !! ! ! 的结果如表 所示 !$(% # 表 !!!!!!! !"#$ ! !"# !"$ !"% !"& ’! $(!*$ $(##! $(!#! $(!%% 例 是平面上的不规则区域 作一个长 宽 的矩形 !! "!$ ! !#," ), 使得 图 利用计算机在 中随机投掷了 万个质 !! $"! # !$ %$# ! # 点后 发现有 万个质点落入区域 中 估算 的面积 ! !(!# $ ! $ # 图 估算 的面积 !$ %! $ 解 质点落入 的频率是 ! $ !(!# % " ""(&*# ! # 根据频率和概率的关系知道 的面积 $的面积 % # # ! ! 所以 ! 的面积 的面积 $ #% &! ""(&*-!#-).&$(/* #,#$# ! 133 书书书第 13 章 概 率 ·················································· 练 习 是平面上的不规则区域 作一个半径为 的圆 使得 在 中随 ! ! !"#$ !! !!!" ! 机投掷了 个质点后 发现有 个质点落入区域 中 估算 的面积 %&&& ! !’’& ! ! ! 结果精确到小数点后两位 " #" 习题 "" ! 某老师在某大学连续 年主讲高等数学这门课 年来学生学习这门课的成绩 !" % !% 汇总如下 $ 成 绩 人 数 " " 分以上 (& )& 分 *&!*( !*& 分 +&!+( ",& 分 ,&!,( (& 分以下 ,& ,& 学生甲下学期将学习该老师的高等数学课 用已有的信息估计他得以下分数的 ! 概率 $ 分以上 分 分以上 "!#(& %" ""#,&!,( %" "%#,& " 某人捡到不规则形状的五面体石块 他将每个面分别标上 后 "" ! !!"!%!’!) ! 投掷了 次 并且记录了每个面落在桌面上的次数 如下表 如果再投掷 !&& ! " #" 一次 请估计标记为 的这一面落在桌面上的概率是多少 ! ’ " 石块的面 ! " % ’ ) 频 数 " %" !* !) !% "" 134 书书书数学文化 ··················································· 数学文化 !!! 概概率率简简史史 概率的概念形成于 世纪 与用投掷骰子的方法进行赌博有 !" ! 密切的关系 ! 重复投掷一枚硬币 万次 你会得到什么结果呢 如果硬币是 ! ! " 均匀的 你会判断正面出现的频率大约是 吗 初看起来这是一 ! !## " 个简单的问题 数学上首先证明这个结论的人是伯努利 ! $$%&’()*+ 尽管他说 哪怕最笨的人 不通过别人的教诲也能理解频率大 *,%! & ! 约是 但是要在数学上证明它却不容易 !##! ! 伯努利 年出生于瑞士的巴赛尔 在他的家族成员中 程度 !"-. ! ! 不同地对数学的许多方面作出过贡献 其中至少有 人在概率论方 ! - 面作出过贡献 他的父亲希望他成为神职人员 但是伯努利自己更 ! ! 喜欢数学 他和同时代的牛顿等人保持密切的通信联系 现在国际 ! ! 上的伯努利统计期刊和伯努利统计学会就是以他的名字命名的 ! 学习数学的人对费马 是不陌生的 因 $/%&012!!"3!4!""-% ! 为 费马大定理 在前些年得到证明 费马的名声早已传播到数学 ’ ( ! 的领域之外 但是费马和概率论的关系并不为很多人所了解 ! ! 费马和笛卡儿 同享发明解析几何 $5%671&2%6!!-8"4!"-3% 的荣誉 但是费马最重要的研究工作是在数论方面 费马不写论文 ! ! 发表 只是通过书信的形式和朋友们交流数学研究的思想和成果 ! ! 他和帕斯卡 的通信是建立概率论的数学基 $91671*!!"#:4!""#% 础的起点 ! 帕斯卡出身于贵族家庭 岁时就发表了圆锥曲线方面的数 !!" 学论文 为了帮助他父亲管理账目 他还发明了一个早期的计算 ! ! 机 帕斯卡对于概率论的贡献体现在他和费马的通信中 ! ! 135 书书书数学文化 ··················································· 促使帕斯卡和费马通信的人是 德梅尔 他向帕斯卡请教几个有关 ! 赌博的问题 年 月 日帕 !!"#$ % &’ 斯卡首先给费马写信 转达了德梅 ! 尔的以下问题 投掷两个骰子 " &$ 次 至少掷出一对 的概率小于 ! " 这 个 概 率 实 际 上 近 似 等 于 !#&! ()$’!$!! 概率论的数学理论基础是由著 名的苏联数学家 柯尔莫哥罗 夫 在 年建立的 $*+,-+.+/+0!!’(12!’3%% !’11 ! 在我国 许宝马录教授是概率论和统计学研究的先驱 有很大的 ! ! 学术成就 在国际上享有盛誉 对概率论和统计学作出了杰出的贡 ! ! 献 年 世界著名的统计期刊 数理统计年鉴 !!’%’ ! & ’$"#$%&&’() 邀请了一些著名学者撰文介绍他的生平 高度评价 *+,-’-.)-./)% ! 了他在概率论和统计学两方面的研究工作 ! 136 书书书第 13 章 概 率 ·················································· 使用计算机模拟随机试验 利用计算机和 进行计算机模拟时 可以仿照下面程序 !"#$"% ! 进行 & 用计算机进行投掷 次硬币试验 计算正面出现的频率时 ’! ’() ! ! 直接输入下面的语句 括弧的内容是语句的解释 不输入 ! ! ! !!*"’(")" 产生 个取值 或 的随机 !!+,-+./0+/ #1!’!*$2’ # ’() ( ’ 数 相当于投掷 次硬币 ! ’() $" 计算正面朝上的次数 !!3,4-5 #+$# $" 计算正面出现的频率 !!!,56"+ #+$# $! 用计算机进行独立重复投掷一枚均匀的骰子的试验时 用下 1! ! 面的语句 ! 产生 个 中的随机数 !!+,-+./0+/ #7!’!’(")$# ’() ’!7 $" 计算出现的次数和频率 !!#"%-8"#6#+$# $& 利用计算机和几何概率估算圆周率 时 直接输入以下语句 )! " ! % 在 中投掷 !!9,0"+/ #1!’(")$#’("# &(!’(’: &(!’(’ 个质点 ’() $ !!+,;60<4#’!’(")$" !!=<0>,’?’(") !!.=!#9#’!>$#@$1$#A#’!>$#@$1$1@ !!+ #>$,’" !!6+/ !!6+/ 计算 !!!,56"+ #+$#B # C"$& 137 书书书第 13 章 概 率 ·················································· 数学实验 !!! ! 用计算机模拟随机试验 打开用 超级画板 制作的课件 圆中投豆 屏幕 !!"! " ! #$%$"# 画面如图 &’ ($ 图 &’ ( 鼠标单击右下方 显示或隐藏说明 按钮 仔细阅读出现的文 ! " # 本内容 根据操作说明 单击灰色按钮上的副钮使还原 待变量尺 % # % 指向 再单击蓝色按钮两次使数据置零 单击灰色按钮上的主钮 )# % 做预备 待变量尺指向 单击绿色按钮开始试验 % * 图 是试验若干次后的画面 &’ + * 138 书书书第 13 章 概 率 ·················································· 图 !" # 利用几何概率求圆周率的另一个著名的试验是投针试验 在纸 $ 上画一些等距离的平行直线 使相邻直线距离为 将一枚长度为 ! !% 的针随机地投到纸上 可以算出针和直线相交的概率为 """!!# ! !# !" !$ 想一想 若在 次投针中和直线相交 次 当 较大时相交频 ! # $ ! # 率与 有何关系 ! $ 打开用 超级画板 制作的课件 投针试验 屏幕 %&’& & % %()(&! 画面如图 !" *’ 139 书书书第 13 章 概 率 ·················································· 图 !" # 单击 显示或隐藏说明 按钮 仔细阅读出现的说明 依法操 ! " # # 作 模拟投针若干次后的效果类似图 # !" $$ 图 !" $ 下面举例说明 如何在 超级画板 的程序工作区直接 # !%&% " 计算模拟随机试验 ’ 根据学过的算法知识 不难理解下面的几个程序 注意其中使 # ’ 140 书书书第 13 章 概 率 ·················································· 用的函数 可以每次随机地产生 之间的一个具有 !"#$!!""#" !"" 指定的有效数字的实数 # 模拟投掷硬币输出正面向上的频率的函数 其中 !!" "#!!"# ! 是投掷次数 " 键入程序 $ !!"#!$"$%&$%’&(% !)*+,-!%"(" !! $%&%.!% !!!’&’/0+1’ !23’4 !(#!"#(56"%& !!’’$%& 执行 用 键 下同 后返回 ! %&!’()#&*! " # $ !!#+,!-#! 如希望将频率表示成小数 可键入 " !!7,839!.#% 返回 $ 计算结果显示浮点数 !!# ! 要模拟试验 次 可键入 ./// " !!"# !!(((#% 执行后返回 $ !!#!0/1#&!.///#2/30/1! 模拟掷骰子 次 输出 点向上的频率的函数 !:" ! # # 0;!!"( !!0;!$#4"$%&$%’&(% !!)*+,-!%"(" !!!$%&%.!% +((#:"% 141 书书书第 13 章 概 率 ·················································· 执行后返回 ! !!""!"#$"#$$#%$&’()))"! 模拟投豆试验用几何概率求圆周率的近似值的程序 !!" " #$%!&"# ’(&$)(*$ +,-.$!’#*" #’(’/0$ -1!!23)4!*%0*"/5"678!23)4!*%5"/5"67$75"#)()80$&& 9%)’&$& 键入程序执行后返回 ! !!"*+,"-#! 要模拟投豆 次的试验 只要输入 ’$$$ % !!#$%!0***"$ 执行后返回 ! !!""#..#$"’/(#%#&’$!! 当然 你在计算机上运行的结果和这里可能不同 % 0 有了这些程序 你可以在不长的时间做大量的有关随机数的试 % 验了 0 142 书书书第 13 章 概 率 ·················································· !!!! 小结与复习 元素 是试验的可能结果 也称为样本点或基本事件 !! ! " ! 全集 是试验的元素的集合 常用 表示 也称为样本空间 "! ! " ! ! ! 事件 是全集的子集 #! ! ! 古典概型 设全集 中有 个元素 事件 包含了 个元素 $! ! ! " " # $ ! 如果 的每个元素发生的可能性相同 就称 ! " $ %##$& " 是事件 的概率 称这个模型是古典概型 # " ! 几何概率 设试验的全集 是长度为正数的区间 是 的 %! !! ! "# ! 子区间 如果试验的结果随机地落在 中 则称 ! ! " 的长度 %##$& #的长度 ! 为事件 的概率 # ! 几何概率 设试验的全集 是面积为正数的区域 是 的 &! "! ! "# ! 子区域 如果元素随机地落在 中 则称 ! ! " 的面积 %##$& #的面积 ! 为事件 的概率 # ! 概率的性质 ’! ! #!$("%##$"!% #"$%#!$&!% ##$%##$&(% 如果 互斥 则 #$$ #"’ " %##$’$&%##$(%#’$% #%$%##$(%#!%#$&!! 概率和频率 在相同的条件下 将一试验独立重复 次 用 表 )! ! " ) " * ) 143 书书书第 13 章 概 率 ·················································· 示事件 在这 次试验中发生的频率 当 增加时 将在一 ! " # " !$ " 个固定的数值 附近波动 这个 就是事件 的概率 % ! % ! &"!##$ " 是 的估计 &"!# # 复习题十三 口袋中有标号 的球各 个 为以下的试验写出全集 !# !!" ! # # 从中任取 个 "!# ! $ 从中一次任取出 个 "## # # 投掷一枚骰子和两枚硬币 写出全集 ## ! # 同时投掷一枚骰子和一枚硬币 计算概率 $# ! # 硬币是正面 骰子的点数是 "!# ! $$ 硬币是正面 骰子的点数是 或 "## ! # %# 豌豆的高矮性状的遗传由其一对基因决定 其中决定高的基因记为 决定矮 %# ! &! 的基因记为 则杂交所得第一子代的一对基因为 若第二子代的 基 ’! &’( &!’ 因的遗传是等可能的 求第二子代为高茎的概率 只要有基因 则其就是高 ! " & 茎 只有两个基因全是 时 才显现矮茎 ! ’ ! #( 将一枚骰子先后抛掷 次 观察向上的点数 问 "# # ! ! % 共有多少种不同的可能结果 "!# & 点数之和是 的倍数的可能结果有多少种 "## $ & 点数之和是 的倍数的概率是多少 "$# $ & 投掷两枚骰子 计算以下事件的概率 )# ! # 两枚骰子的点数之和是 "!#!’ ’ #($ 两枚骰子的点数之和是 "##(’ ’ %($ 两枚骰子的点数之和是 "$#)’ ’ )($ 144 书书书第 13 章 概 率 ·················································· 以上三个事件中 哪个概率最大 为什么 !!" # # $ 一批产品有 个 其中含有 个次品 从中随机抽取 个 计算 "! #$ # # # % ! % 这个产品是次品的概率 !%" & 这个产品是正品的概率 !&" ! 黄色人种种群中各种血型的人所占的比如下表所示 ’! % 血 型 ! ( ) () * 该血型的人所占比 ’+ &’ &, ’ #- 已知同种血型的人可以输血 型血可以输给任一种血型的人 任何人的血都 #* # 可以输给 型血的人 其他不同血型的人不能互相输血 小明是 型血 若 () # . ) # 小明因病需要输血 问 # % 任找一个人 其血可以输给小明的概率是多少 !%" # $ 任找一个人 其血不能输给小明的概率是多少 !&" # $ 某射击手在同一条件下进行射击 结果如下 ,! # % 射击次数 !"" %$ &$ -$ %$$ &$$ -$$ 击中靶心次数 !#" ’ %, !! ,& %"’ !-- 击中靶心频率!#" " 计算表中击中靶心的各个概率 !%" & 这个射手射击一次 击中靶心的概率约是多少 !&" # $ 如果全集 的事件 两两互斥 用 表示事件 %$! ! $#%#’ # $"%"&"’ $#%# 中至少有一个发生 证明 ’ ! % (!$"%"&"’")(!$"*(!%"*(!&"*(!’"! 设 是长 宽 的长方形 是以长方形对角线交点为圆心 以 %%! ! &/0( #/0 #$ # &/0 长为直径的圆 如果质点等可能地落在 中 ! ! # 计算质点落在 内的概率 !%" $ & 计算质点落在 外的概率 !&" $ ! 在区间 中随机地投掷两个质点 计算这两个质点都落在 中 %&! )%##* # )%#&* 的概率 ! 145 书书书第 13 章 概 率 ·················································· 两人在某天的 时至 时间相互独立随机到达某地会面 先到者等候 !"! # $ ! "%&’( 后离去 ! 写出试验的全集 "!# !$ 用集合表示出事件 两人相遇 ")# "# % &$ 计算这两人能相遇的概率 ""# ! 智者千虑! 必有一失" 一金融公司的主要工作是进行投资 尽管每次投资前都有缜密的投资分析 !*! ! ! 但是投资失败的概率仍保留在 利用频率和概率的关系 说明该公司一次 #+! ! 次相互独立的投资一定有失败的时候 ! 某射击运动员脱靶的概率是 如果他独立重复射击下去 必有一次脱 !#! %,%!+! ! 靶发生 利用频率和概率的关系说明 !" !# 愚者千虑! 必有一得" 张三和好友李四下棋时 赢李四的概率只有 张三不服输 不断约李四 !-! ! !%+! ! 下棋 试说明张三总有赢棋的时候 ! ! !!!"#$%&’( 是赌徒就要破产" )*!"#!+,!" #$’-./0!1% &’()234/0! 一个赌徒手中有 元本金 赌博时每次赌注是 元 输赢的概率都是 !$! !%%% ! ! ! !’)! 在赌博期间 一旦输光则宣告破产 现在该赌徒决心赢到手中有 万元后再 ! ! ) 停止赌博 你认为他的目的可以达到吗 对掷硬币的试验再次理解后给出 ! ( " 答案 !#!! 146 书书书 书书书附 录 ·················································· 附 录 ! 数学词汇中英文对照表 按词汇所在页码的先后排序 ! " 中文名 英 文 名 页 码 ! ! ! ! 算法 ! !"#$%&’() * 顺序结构 ! +,-.,/0,+’%.0’.%, 1 条件结构 ! 0$/2&’&$/!"+’%.0’.%, 34 循环结构 ! 050",+’%.0’.%, 36 输入语句 ! &/7.’+’!’,),/’ *3 输出语句 ! $.’7.’+’!’,),/’ *3 赋值语句 ! !++/),/’+’!’,),/’ ** 条件语句 ! 0$/2&’&$/!"+’!’,),/’ *6 循环语句 ! 050",+’!’,),/’ 84 总体 ! 7$7."!’&$/ 94 个体 ! &/2&:&2.!" 94 均值 ! ),!/ 93 样本 ! +!)7", 9* 观测数据 ! $;+,%:,22!’! 9* 样本量 ! +!)7",+&<, 9* 抽样 ! +!)7"&/# 9* 估计 ! ,+’&)!’$% 98 方差 ! :!%&!/0, 9= 标准差 ! +’!/2!%22,:&!’&$/ 91 随机数 ! %!/2$)/.);,% 1* 层权 ! >,(’ 1? 系统抽样方法 ! +5+’,)!’&0+!)7"&/#),’($2 @4 频率 ! A%,-.,/05 @* 频率分布表 ! A%,-.,/052&+’%&;.’&$/’!;", @8 147 书书书附 录 ·················································· 直方图 ! !"#$%&’() *+ 茎叶图 ! #$,)-.%$ /0 散点图 ! #1($$,’2"(&’() /3 参数 ! -(’(),$,’ 404 随机事件 ! ’(52%),6,5$ 447 事件 ! ,6,5$ 447 样本点 ! #()-.,%8$1%), 447 样本空间 ! #()-.,#-(1, 447 概率 ! -’%9(9"."$: 4;4 数理统计年鉴 ! !"#$%%&’()*+,&,-(,-.( 4<+ 148 书书书!!" !"#$%&’( !)*#+,-./01 "23#$456718%9 !:;<=>?,- @A "BC#$DEFG3HI%JKL)*#+ ,-#MNLOPQRS!""#TUV;W! !%XBCW-=%YZ[\]>?L&> ?,-NL^_R9‘ab#c4]def 7gh%ijklj4mnopqrst4uv! wx%ijy1z{uv|}~#+$?^(cid:127)(cid:128) (cid:129)(cid:130)(cid:131)&|}~(cid:132)(cid:133)=?(cid:134)(cid:135)(cid:136)(cid:131)&(cid:137)(cid:130)(cid:138)&(cid:139) (cid:140)(cid:141)&(cid:142)(cid:143)(cid:144)&(cid:145)(cid:146)(cid:147)%+(cid:148)=?(cid:134)(cid:149)(cid:150)(cid:151)(cid:152)(cid:153) c%ljD!%4(cid:154)(cid:155)(cid:156)p[(cid:157)(cid:158)4(cid:159)(cid:160)%X¡% ija¢qrst4v(cid:159)! #M£⁄&a¥ƒ§4¤'%ij“«‹› fi\]#c&?flX(cid:176)–!†#$%4W-=(cid:156) p(cid:157)(cid:158)(cid:159)(cid:160)%¢‡·(cid:181)(cid:159)(cid:160)7£¶‘x•‚„i j!”ij»…‰(cid:145)%(cid:190)w¿(cid:192))*#+#M£ ⁄·a`´4(cid:176)ˆ’ !"#$%&’ 书书书