1 / 16
文档名称:

人教版高中数学第1讲 随机抽样、用样本估计总体.doc

格式:doc   大小:1,025KB   页数:16页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

人教版高中数学第1讲 随机抽样、用样本估计总体.doc

上传人:1905133**** 2025/4/17 文件大小:1 MB

下载得到文件列表

人教版高中数学第1讲 随机抽样、用样本估计总体.doc

相关文档

文档介绍

文档介绍:该【人教版高中数学第1讲 随机抽样、用样本估计总体 】是由【1905133****】上传分享,文档一共【16】页,该文档可以免费在线阅读,需要了解更多关于【人教版高中数学第1讲 随机抽样、用样本估计总体 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。第1讲 随机抽样、用样本估计总体
一、知识梳理
1.随机抽样
(1)简单随机抽样
①定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),且每次抽取时总体内的各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.
②常用方法:抽签法和随机数法.
(2)分层抽样
①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
②适用范围:适用于总体由差异比较明显的几个部分组成时.
2.统计图表
(1)频率分布直方图的画法步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
(2)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;
②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是
s= ,
s2=[(x1-)2+(x2-)2+…+(xn-)2].
常用结论
1.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.
2.会用三个关系
频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3.巧用四个有关的结论
(1)若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a;
(2)数据x1,x2,…,xn与数据x′1=x1+a,x′2=x2+a,…,x′n=xn+a 的方差相等,即数据经过平移后方差不变;
(3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2;
(4)s2= (xi-)2=x-2,即各数平方的平均数减去平均数的平方.
二、教材衍化
1.某校为了解学生学习的情况,采用分层抽样的方法从高一2 400人、高二2 000人、高三n人中,抽取90人进行问卷调查.已知高一被抽取的人数为36,那么高三被抽取的人数为________.
解析:由分层抽样可得×90=36,则n=1 600,所以高三被抽取的人数为×90=24.
答案:24
2.已知一组数据6,7,8,8,9,10,则该组数据的方差是________.
答案:
3.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在第________组.
解析:由题图可得,前四组的频率为( 5+ 5++)×2=,则其频数为40×=22,且第四组的频数为40××2=8,故中位数落在第4组.
答案:4
一、思考辨析
判断正误(正确的打“√”,错误的打“×”)
(1)简单随机抽样是一种不放回抽样.(  )
(2)在抽签法中,先抽的人抽中的可能性大.(  )
(3)一组数据的方差越大,说明这组数据的波动越大.(  )
(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.(  )
(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.(  )
(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.(  )
答案:(1)√ (2)× (3)√ (4)√ (5)√ (6)√
二、易错纠偏
(1)随机数表法的规则不熟出错;
(2)频率分布直方图识图不清;
1.假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随机数法从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001,…,499进行编号,若从随机数表第7行第8列的数开始向右读,则抽取的第3支疫苗的编号为________.(下面摘取了随机数表的第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67
21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75
12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38
15 51 00 13 42 99 66 02 79 54
解析:由题意得,从随机数表第7行第8列的数开始向右读,符合条件的前三个编号依次是331,455,068,故抽取的第3支疫苗的编号是068.
答案:068
2.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.
解析:依题意得,成绩低于60分的相应的频率等于(+)×20=,所以该班的学生人数是15÷=50.
答案:50
考点一 随机抽样(基础型)

2.学会用简单随机抽样的方法从总体中抽取样本.
3.通过对实例的分析,了解分层抽样的方法.
核心素养:数据分析
1.(2020·重庆中山外国语学校模拟)如饼图,某学校共有教师120人,从中选出一个30人的样本,其中被选出的青年女教师的人数为(  )
A.12   B.6  
C.4   D.3
解析:选D.青年教师的人数为120×30%=36,
所以青年女教师为12人,故青年女教师被选出的人数为12×=.
2.(2020·武汉市武昌区调研考试)已知某射击运动员每次射击击中目标的概率都为80%.现采用随机模拟的方法估计该运动员4次射击至少3次击中目标的概率:先由计算器产生0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标;再以每4个随机数为一组,代表4次射击的结果.经随机模拟产生了如下20组随机数:
7527 0293 7140 9857 0347 4373 8636 6947 1417 4698 0371 6233 2616 8045 6011 3661 9597 7424 7610 4281
据此估计,该射击运动员4次射击至少3次击中目标的概率为________.
解析:4次射击中有1次或2次击中目标的有:0371,6011,7610,1417,7140,所以所求概率P=1-==.
答案:
3.一支田径队有男运动员56人,女运动员m人,用分层抽样抽出一个容量为n的样本,在这个样本中随机取一个当队长的概率为,且样本中的男队员比女队员多4人,则m=________.
解析:由题意知n=28,设其中有男队员x人,女队员有y人.
则解得x=16,y=12,m=42.
答案:42
(1)抽签法与随机数法的适用情况
①抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
②一个抽样试验能否用抽签法,关键看两点:
一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
(2)分层抽样问题类型及解题思路
①求某层应抽个体数量,根据该层所占总体的比例计算.
②已知某层个体数量,求总体容量,根据分层抽样即按比例抽样,列比例式进行计算.
③确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况. 
考点二 样本的数字特征(应用型)
,学会计算数据的标准差.
2.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
核心素养:数据分析、数学运算
(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,,所剩数据的平均数与方差分别为(  )
A.92,        B.92,2
C.93,2 D.93,
(2)(2020·盐城模拟)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为________.
【解析】 (1)由题意得所剩数据:90,90,93,94,93.
所以平均数==92.
方差s2=[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=.
(2)由s2=(xi-)2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为2.
【答案】 (1)A (2)2
【迁移探究】 (变条件)本例(2)增加条件“x1,x2,x3,x4,x5的平均数为2”,求数据2x1+3,2x2+3,2x3+3,2x4+3,2x5+3的平均数和方差.
解:数据2x1+3,2x2+3,2x3+3,2x4+3,2x5+3的平均数为2×2+3=7,方差为22×2=8.
众数、中位数、平均数、方差的意义及常用结论
(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(2)方差的简化计算公式:s2=[(x+x+…+x)-n2],或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方. 
1.(2020·昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地.这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是(  )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
解析:选B.平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小
,同时也反映这组数据的稳定程度.故选B.
2.(2020·甘肃、青海、宁夏联考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下:
身高
(100,110]
(110,120]
(120,130]
(130,140]
(140,150]
频数
5
35
30
20
10
由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)(  )
A. B.
C. D.
解析:选C.由题意知身高在(100,110],(110,120],(120,130],,,,组距为10,设中位数为x,则(x-120)×=,解得x≈.
3.一组数据1,10,5,2,x,2,且2<x<5,若该数据的众数是中位数的倍,则该数据的方差为________.
解析:根据题意知,该组数据的众数是2,则中位数是2÷=3,把这组数据从小到大排列为1,2,2,x,5,10,
则=3,解得x=4,所以这组数据的平均数为
=×(1+2+2+4+5+10)=4,
方差为s2=×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.
答案:9
考点三 频率分布直方图(应用型)
,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图,体会它们各自的特点.
2.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性.
核心素养:直观想象、数据分析
角度一 求样本的频率、频数
(2020·福建五校第二次联考)某服装店对过去100天其实体店和网店的销售量(单位:件)进行了统计,制成频率分布直方图如下:
(1)若将上述频率视为概率,已知该服装店过去100天的销售中,,求过去100天的销售中,实体店和网店至少有一边销售量不低于50的天数;
(2)若将上述频率视为概率,已知该服装店实体店每天的人工成本为500元,门市成本为1 200元,每售出一件利润为50元,求该实体店一天获利不低于800元的概率.
【解】 (1)由题意知,网店销售量不低于50共有(+++)×5×100=66(天),实体店销售量不低于50共有(++×2)×5×100=38(天),实体店和网店销售量都不低于50的天数为100×=24,
故实体店和网店至少有一边销售量不低于50的天数为66+38-24=80.
(2)由题意,设该实体店一天售出x件,则获利为(50x-1 700)元,50x-1 700≥800⇒x≥50.
记该实体店一天获利不低于800元为事件A,则
P(A)=P(x≥50)=(+++)×5=.
.
角度二 求样本的数字特征
(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“”,根据直方图得到P(C).
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【解】 (1)=a++,故
a=.
b=1---=.
(2)甲离子残留百分比的平均值的估计值为
2×+3×+4×+5×+6×+7×=.
乙离子残留百分比的平均值的估计值为
3×+4×+5×+6×+7×+8×=.
(1)频率、频数、样本容量的计算方法
①×组距=频率;
②=频率,=样本容量,
样本容量×频率=频数.
(2)频率分布直方图中数字特征的计算
①最高的小长方形底边中点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 
1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的,且样本容量为140,则中间一组的频数为(  )
A.28 B.40
C.56 D.60
解析:选B.设中间一组的频数为x,因为中间一个小长方形的面积等于其他8个长方形的面积和的
,所以其他8组的频数和为x,由x+x=140,解得x=40.
2.(2020·武昌区调研考试)对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.
(1)根据直方图完成以下表格;
成绩
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
(2)求参赛选手初赛成绩的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩?
解:(1)填表如下:
成绩
[50,60)
[60,70)
[70,80)
[80,90)
[90,100)
频数
50
150
350
350
100
(2)平均数为55×+65×+75×+85×+95×=78,
方差s2=(-23)2×+(-13)2×+(-3)2×+72×+172×=101.
(3)进入复赛选手的成绩为80+×10=82(分),所以初赛成绩为82分及其以上的选手均可进入复赛.
(说明:回答82分以上,或82分及其以上均可)
[基础题组练]
1.某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座号是(  )
49 54 43 54 82 17 37 93 23 78 87 35
20 96 43 84 26 34 91 64 57 24 55 06
88 77 04 74 47 67 21 76 33 50 25 83
92 12 06
A.23    B.09   
C.02    D.16
解析:选D.从随机数表第一行的第6列数字3开始,由左到右依次选取两个数字,不超过34的依次为21