1 / 44
文档名称:

抽样技术第四版习题答案.doc

格式:doc   大小:2,219KB   页数:44页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

抽样技术第四版习题答案.doc

上传人:知识徜徉土豆 2025/5/21 文件大小:2.17 MB

下载得到文件列表

抽样技术第四版习题答案.doc

相关文档

文档介绍

文档介绍:该【抽样技术第四版习题答案 】是由【知识徜徉土豆】上传分享,文档一共【44】页,该文档可以免费在线阅读,需要了解更多关于【抽样技术第四版习题答案 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。第2章
解: 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是。
这种抽样方法不是等概率的。运用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是,而尚未被抽中的编号为36~63的每个单元的入样概率都是。
这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是,所以这种抽样是等概率的。
解:
项目
相同之处
不同之处
定义
都是根据从一个总体中抽样得到的样本,然后定义样本均值为。
抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会反复;而数理记录中的样本是从无限总体中运用有放回的抽样方法得到的,样本点有也许是反复的。
性质
样本均值的盼望都等于总体均值,也就是抽样理论和数理记录中的样本均值都是无偏估计。
不管总体本来是何种分布,在样本量足够大的条件下,样本均值近似服从正态分布。
抽样理论中,各个样本之间是不独立的;而数理记录中的各个样本之间是互相独立的。
抽样理论中的样本均值的方差为,其中。在数理记录中,,其中为总体的方差。
解:一方面估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大样本的条件下,近似服从标准正态分布, 的的置信区间为

而中总体的方差是未知的,用样本方差来代替,置信区间为。
由题意知道,,并且样本量为,代入可以求得
。将它们代入上面的式子可得该市居民日用电量的95%置信区间为。
下一步计算样本量。绝对误差限和相对误差限的关系为。
根据置信区间的求解方法可知
根据正态分布的分位数可以知道,所以。也就是。
把代入上式可得,。所以样本量至少为862。
解:总体中参与培训班的比例为,那么这次简朴随机抽样得到的的估计值的方差,运用中心极限定理可得在大样本的条件下近似服从标准正态分布。在本题中,样本量足够大,从而可得的的置信区间为

而这里的是未知的,我们使用它的估计值。所以总体比例的的置信区间可以写为,将代入可得置信区间为。
解:运用得到的样本,计算得到样本均值为,。总体均值的的置信区间为,用来估计样本均值的方差。
计算得到,则,,代入数值后计算可得总体均值的95%的置信区间为。
解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产量的估计值为(吨)。
总体总值估计值的方差为,总体总值的的置信区间为,把
代入,可得粮食总产量的的置信区间为。
解:一方面计算简朴随机抽样条件下所需要的样本量,把带入公式,最后可得。
假如考虑到有效回答率的问题,在有效回答率为70%时,样本量应当最终拟定为

解:去年的化肥总产量和今年的总产量之间存在较强的相关性,并且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为。运用去年的化肥总产量,今年的化肥总产量的估计值为吨。
解:本题中,简朴估计量的方差的估计值为=。
运用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为。文化支出属于总支出的一部分,这个重要变量与辅助变量之间存在较强的相关关系,并且它们之间的关系是比较稳定的,且所有家庭的总支出是已知的量。
文化支出的比率估计量为,通过计算得到,而,则,文化支出的比率估计量的值为(元)。
现在考虑比率估计量的方差,在样本量较大的条件下,,通过计算可以得到两个变量的样本方差为,之间的相关系数的估计值为,代入上面的公式,可以得到比率估计量的方差的估计值为。这个数值比简朴估计量的方差估计值要小很多。所有家庭的平均文化支出的的置信区间为,把具体的数值代入可得置信区间为。
接下来比较比估计和简朴估计的效率,,这是比估计的设计效应值,从这里可以看出比估计量比简朴估计量的效率更高。
解:运用简朴估计量可得,样本方差为,,样本均值的方差估计值为。
运用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是合理的,由于肉牛的原重量在很大限度上影响着肉牛的现在的重量,两者之间存在较强的相关性,相关系数的估计值为,并且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。
回归估计量的精度最高的回归系数的估计值为。现在可以得到肉牛现重量的回归估计量为,代入数值可以得到。
回归估计量的方差为,方差的估计值为,代入相应的数值, ,显然有。在本题中,由于存在肉牛原重量这个较好的辅助变量,所以回归估计量的精度要好于简朴估计量。
第3章
解:在分层随机抽样中,层标志的选择很重要。划分层的指标应当与抽样调查中最关心的调查变量存在较强的相关性,并且把总体划分为几个层之后,层应当满足:层内之间的差异尽也许小,层间差异尽也许大。这样才干使得最后获得的样本有很好的代表性。对几种分层方法的判断如下:
(1)选择性别作为分层变量,是不合适的。一方面,性别这个变量与研究最关心的变量(不同职务,职称的人对分派制度改革的态度)没有很大的相关性;另一方面,用性别作为分层变量后,层内之间的差异仍然很大,相反,层之间的差异不是很大,由于男性和女性各自内部的职务,职称也存在很大的差别;最后,选择性别作为分层变量后,需要一方面得到男性和女性的抽样框,这样会更加麻烦,也会使抽样会变得更加复杂。
(2)按照教师、行政管理人员和职工进行分层,是合适的。这种分层的指标与抽样调查研究中最关心的变量高度相关,并且按照这种方法分层后,可以看出层内对于分派制度改革的态度差异比较小,由于他们属于相同的阶层,而层之间的态度的差异是比较大的。这样选取出来的样本具有很好的代表性。
(3)按照职称(正高、副高、中级、初级和其他)分层,也是合理的。理由与(2)相同,这样进行分层的变量选择与调查最关心的变量是高度相关的,分层后的层满足分层的规定。所以,按照职称进行分层是合理的。
(4)按照部门进行分层,是合理的。由于学校有很多院、系或者所,直接进行简朴随机抽样,有也许样本不能很好地代表各个院系,最关心的变量与部门也存在一定的相关性。这样分层后,每个层的总体数目和抽取的样本量都较小,最终的样本的分布比较均匀,比简朴随机抽样更加方便实行。
解:设计的方案如下:
第一种方案:可以按照不同的专业进行分层,但是考虑到假如在每层都抽取,不能保证每个新生的入样概率相等,由于每个专业的人数比例未知,8个人的样本量无法在每个层之间进行分派。所以采用如下方法:对所有的新生按照专业的先后顺序进行编号,使得每个专业的人的编号在一起,然后随机选取出一个号码,然后选取出这个号码所在的专业,选取出这个专业,再在这个专业的所有新生中按照简朴随机抽样的方法选取出8个人。这样就可以保证每个人入选的概率是相等的。
第二种方案:也可以按照性别进行分类,对他们进行编号,为1~800,使得男生的编号都在一起,女生的编号也都在一起,然后随机选取出一个号码,然后看这个号码所相应的性别,然后从这个性别的所有人中按照简朴随机抽样的方法选取出8个新生。这样就可以保证所有的新生的入样概率是相同的。
第三种方案:随机地把所有的人提成8组,并且使得每组的人都是100个人,这样分组完毕后,每个组的新生进行编号为1~100,然后随机抽取出一个号码,再从所有的小组中抽取出号码所相应的新生,从而抽取出8个人。
解:(1) 一方面计算出每层的简朴估计量,分别为,其中,,则每个层的层权分别为;
则运用分层随机抽样得到该社区居民购买彩票的平均支出的估计量,代入数值可以得到。
购买彩票的平均支出的的估计值的方差为,此方差的估计值为,根据数据计算可以得到每层的样本方差分别为:
其中,代入数值可以求得方差的估计值为,则估计的标准差为。
(2)由区间估计可知相对误差限满足
所以,。
样本均值的方差为,从而可以得到在置信度为,相对误差限为条件下的样本量为。
①对于比例分派而言,有成立,那么,把相应的估计值和数值代入后可以计算得到样本量为,相应的在各层的样本量分别为。
②按照内曼分派时,样本量在各层的分派满足,这时样本量的计算公式变为,把相应的数值代入后可得,在各层中的分派情况如下:。
解:(1) 一方面计算得到每层中在家吃年夜饭的样本比例为,那么根据每一层的层权,计算得到该市居民在家吃年夜饭的样本比例为。
每一层中在家吃年夜饭的样本比例的方差为
,则该市居民在家吃年夜饭的比例的方差,在的条件下,
,而其中每层的吃年夜饭的样本比例的方差的估计值为,则样本比例的方差的估计值为,把相应的数值代入计算可得方差的估计值为,从而可以得到该估计值的标准差为。
(2)运用上题的结果,,这里的方差是,在的条件下,近似有。
①比例分派的条件下,有成立,那么,把相应的估计值和数值代入可以求得最终的样本量应当是,样本量在各层的分派是,,

②内曼分派条件下,,则,代入相应的估计值和数值可以计算得到样本量为,在各层中样本量的分派为。
解:总体总共分为10个层,每个层中的样本均值已经知道,层权也得到,从而可以计算得到该开发区居民购买冷冻食品的平均支出的估计值为

下一步计算平均支出的95%的置信区间,一方面计算购买冷冻食品的平均支出的估计值的方差,其中,但是每层的方差是未知,则样本平均支出的方差的估计值为,每个层的样本标准差已知,题目中已经注明各层的抽样比可以忽略,计算可以得到。则这个开发区的居民购买冷冻食品的平均支出置信区间为
代入数值后,可得最终的置信区间为。
解:一方面计算简朴随机抽样的方差,根据各层的层权和各层的总体比例可以得到总体的比例为,则样本量为100的简朴随机样本的样本比例的方差为
,不考虑有限总体校正系数,,其中,
在的条件下,通过简朴随机抽样得到的样本比例的方差为
通过度层抽样得到的样本比例的方差为,但是由于不考虑有
限总体校正系数,并且抽样方式是比例抽样,所以有成立,样本比例的方差近似为。对于每一层,分别有,在的条件下,近似的有成立,有