1 / 7
文档名称:

调查分析师调查概论知识点.docx

格式:docx   大小:27KB   页数:7页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

调查分析师调查概论知识点.docx

上传人:游园会 2023/2/6 文件大小:27 KB

下载得到文件列表

调查分析师调查概论知识点.docx

文档介绍

文档介绍:该【调查分析师调查概论知识点 】是由【游园会】上传分享,文档一共【7】页,该文档可以免费在线阅读,需要了解更多关于【调查分析师调查概论知识点 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。调查概论
名词解释
调查:调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的局部或全部单元收集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的全部活动。
名录框:定义为一份全部总体单元的实际的或者概念的名录清单。
多重抽样框:多重抽样框是两个或两个以上抽样框的组合。例如。它可能是名录框和区域框的组合或者两个及两个以上名录框的组合。
无答复:是指调查时未能从指定的被调查者处获得有效的答复。无答复有两种类型:一种是全部无答复,又称单元无答复,它是指被调查单元没有供给任何信息。另一种是局部无答复,又称工程无答复,它是指问卷中某些问题答复的空缺。
派员访问:是派调查员与被调查者面对面进展的一种调查方式。对某些目标总体来说,这是收集数据惟一可行的方法。例如:有些调查无法承受自填的方式;有些大规模调查对象要求调查员在现场确定被调查对象;很多被调查对象没有或者识字率很低。
直接观看法是由调查员在现场对被调查者的状况直接观看、记录以取得有关信息的一种调查方法。它不是直接向被调查者提出问题要求答复,而是凭调查人员的直观感觉或是利用有关器械,如照相机、录像机或其他器材,记录和考察被调查者的活动和现场事实,以获得必要的信息。
小组座谈法是承受小型座谈会的形式,从调查对象中选择一组有代表性的人,在主持人的组织下,就某个专题进展争论,从而获得对有关问题的深入了解。
问卷的有效性:有效性又称效度或准确性。它是指问卷能准确地反映客观事物特征或属性的程度。假设某之方法准确地反映了我们所要了解的现象或概念,就称该方法是有效的。:牢靠性又称信度,它是指问卷测量结果的全都性或稳定性。
焦点座谈:焦点座谈是由从所争论总体中选出的假设干对象对所选主题进展的非正式争论。通过焦点座谈这种形式,使被调查对象或数据用户以及调查员有时机把他们的观点纳入问卷数据过程。
引导性问题P60;引导性问题是指建议或指导被调查者选择某一特定答案时具有倾向性。换句话说,问题措辞方法对问题的答复产生了影响。引导性问题能误导调查答复并影响调查结果。
随机化答复方法P66对敏感性问题的一种特别的调查方法是实行随机化答复方法,这一方法是由美国统计学家沃纳提出来的。这种方法的设计原则是建立在不暴露被调查者对问题的直接答复的根底上。
李克特度量方法P74又称加分打分的度量方法,这种度量方法在问卷设计中应用格外广
泛。它是由一组反映态度的问题组成,依据被调查者态度反映的不同程度给定分数。
工程间比比赛表P76工程间比比赛表通常承受固定和方法,这种方法是对两个或两个以上的工程给出一个总分,要求被调查者在各工程之间进展划分。这个总分通常是100分,对于计算比例比较便利。
样本的抽样概率P81:一个是指在肯定的抽样方式下有多少不同的样本可以抽取,某个具
体样本被抽中的概率。另一个含义是指某个总体单元被选入样本的概率。
抽样比:是指样本的容量n与总体的容量N之间的比率
配额抽样:抽样是要从各个子总体中选取特定数量的样本单元,这种特定数量的比例关系就称作配额。故配额抽样本质上是一种满足每个特定子总体样本量的一种手段。
滚雪球抽样:假设我们想找到在总体中某种较为稀有的个体,而且我们已经知道其中某
些个体并有可能与其接触,那么就有可能通过询问这些个体,获得他们类似的个体。这样所得的样本就像一个从小山上滚下来的雪球那样渐渐增大。
PPS抽样:不等概率抽样,承受抽选的概率与单元规模大小成比例,用英语单词的第一个字母表示,简称PPS抽样
整群抽样:由假设干个有联系的根本单元所组成的集合称为群。抽样时以群为抽样单元的抽样方法就称为整群抽样。
抽样分布:估量量是一个随机变量,它的具体估量值是随着不同的样本单元而变化的,因而就有肯定的分布,这个分布就叫做抽样分布。
设计权数:设计权数其实就是样本单元的入样概率的倒数,通常假定每个单元的入样概
率是的,这样我们才能对总体进展估量。对于概率抽样来说,每个单元都有一个的入样概率。假设入样概率为1/50,那么每个入选样本代表总体中的50个单元,此时设计权数即为50。
自加权设计:假设全部样本单元的设计权数都一样,那么称这样的抽样设计为自加权设计。
无答复调整因子:无答复调整因子是原样本单元的权数之和与给出答复的单元的权数之和的比值。
事后分层:假设可能从其他方面获得分层信息,或者抽选样本后可以得到更、更牢靠的分层信息,那么在数据收集之后,可以利用数据收集的结果,选用其中适宜的变量对收集到的样本进展分层,从而对样本的权数进展调整,这就是通常所说的事后分层。
访问手册:访问手册是访问员〔调查人员〕主要的工作指南,调查人员依据访问手册开展工作。
编码:编码是给问题的每项答案赐予一个数值代码,以便于数据录入和作进一步处理的过程。
双机录入:双机录入是指将同一问卷上的内容在计算机中录入两次,两次使用不同的录
入人员。
插补:插补就是在审核过程中区分出来的数据缺失、无效与不全都等问题的过程。
均值插补:均值插补就是对缺失或不全都的值用插补类的均值代替。
31比率或回归插补:比率或回归插补是使用关心信息及其他记录中的有效答复建立一个比率或回归模型,该模型说明白两个或多个变量之间的关系。
热平台插补:热平台插补是使用同一插补类中的供着记录的信息来替代一个相像的受着记录中缺失的或不全都数据的插补方法。
冷平台插补:冷平台插补与热平台插补类似,不同之处在于热平台插补使用当前调查的供者,而冷平台插补则使用其他资料中的供者。;冷平台插补常常使用前期的或普查中的数据。:中位数是一组数据按数值大小排序〔例如从小到大〕后,位置在最中间的值。
35,。众数:众数是消灭频率最高的那个数值〔对样数据来说,它是消灭频率较高的加权数值〕。
36、极差:又称全距,是数据最大值与最小值之差〔对样本数据来说,是加权最大值与加权最小值之差〕,由于这个度量只用到了数据分布中的两个值,所以它只给出了数据离散趋势的一个大致的描述,并且很简洁受极端值的影响。
37、推断性数据分析就是实行概率抽样所收集的数据来推断总体的特征。所使用的分析方法有置信区间、假设检验、方差分析和线性回归。
38、线性模型是一种统计方法,它用于争论一个响应变量〔又称因变量〕和多个解释变量〔又称自变量〕之间的线性关系。
39、泄密掌握指那些为避开数据公布侵害被调查者的隐私而实行的措施。例如,汇总表中带标志的数格可能暴露被调查者的个人机密。有时候,泄密掌握会对数据的质量产生负面影响,由于有些数据得不到发表或必需进展修改〔通过舍入数据、合并类别、排解小数格等〕。泄密掌握是为了确保被调查者的个人隐私受到敬重,与此同时最大程度地保持数据的效用。,供给了关于某个特定子总体或特定组的信息,这些信息通常不应为人所知。由于普查〔全面调查〕的调查结果通常没有或然性,所以归属泄密常常发生在普查〔全面调查〕中。
简答论述多项选择
调查目标确实定:
调查指标和调查对象
抽样调查和全面调查之间做选择时,要考虑几个重要因素:〔范围〕
值得留意的是:全面调查和抽样调查部室完全对立的,依据具体调查的需要,可将这两种方法结合起来使用
一个抽样框包括的内容1识别资料2联系资料3关心资料
名路况的内容1生命统计登记2商业注册登陆3地址和邮政编码 1关联性2准确性3时效性4费用5抽样框所供给的信息应当使用标准的概念、定义跟方法,并使客户对这些都能理解
抽样框典型缺陷1不完全涵盖或称不完全掩盖2过涵盖也称过掩盖3重复4空
白单位5分类错误
自填式问卷优点1自填式问卷一般通过邮寄方式进展,通常承受匿名的方法2费用比较低3调查区域广泛
自填式问卷缺点1答复率通常低于访员帮助式方法2当问卷中包含很多有关问卷的调查概念、定义和指南的参考资料时通常就不如调查员在场的效果好3自填式方法对被调查者的答复负担较大
访问调查的优点1答复率较高2访问调查可以使用比较简单的问卷3访问调查的数据比较准确
访问调查缺点1面访调查的费用比较高2调查的时间比较长3某些群体的访问成功率比较低4实施质量掌握比较困难5对调查人员要求高
调查的优势1时效快2费用低3可能访问到不简洁接触到的对象4与邮
寄调查相比可以准时处理疑难问题5易于掌握实施的质量
网络调查的优点1本钱低、范围广、速度快2交互性好能够实现问卷多样化设计3
为各种调查供给了丰富的抽样框4有更好的质量掌握
各种数据的收集方法的比较 1从抽样框的状况来考虑2从目标总体的特征来考虑3
从调查问题的性质来考虑4从调查的经费与资源来考虑5从治理的难易程度来考虑6从数据质量要求来考虑
问卷测试的重要性好处跟方法 好处有,使问卷对被调查者和调查人员具有友好的界面;有利于收集到正确的数据时问卷的格式更有利于数据编码跟录入;削减数据收集和处理的费用准时间。 问卷调查的方法很多,主要有认知法和焦点座谈法。认知法是考察被调查者答复以下问题时的思考过程和方法,它有助于评估问题的有效性和识别计量误差的潜在来源;焦点座谈法是由从所争论总体中选出的假设干对象对所选主题进展的非正式争论,通过这种形式使被调查对象或数据用户以及调查员有时机把他们的观点纳入问卷数据过程
随机化答复方法 对于某个要调查的敏感性问题,列出正反两个问题,由被调查者从中随机抽取一个来答复。被调查者抽选到哪个问题来答复,并不告知调查人员,答复的内容是
把抽到的问题与被调查者的实际状况相比照,只答复“是”或“否”。这样,调查人员就不知道被调查人员在答复哪一个问题,从而为被调查者供给真实状况起到了保密的作用。


分层抽样能提高对总体估量值的精度,从而使抽样效率更高
能保证样本对被定义为层的那些子总体的代表性,从而得到有效的估量
操作与治理便利
能避开得到一个”“差的“样本
在不同的层中可以使用不同的抽样框和不同的抽样方法
那些设计师自加权的呢?简洁随机抽样是一种自加权设计,这是每个单元都有相等的入样概率。同样道理,系统抽样也是一种自加权设计。对于分层抽样,假设按各层的大小等比例安排样本,而且每层内都承受简洁随机抽样,那么它也是自加权设计。也就是说,假设各层的抽样比一样,总体中每个单元就具有一样的入样概率,这样的分层抽样设计就是自加权设计。
使用关心信息主要有两个缘由:首先,为使调查估量值与的总体总值,或者从另一调查所得的估量值相匹配。使用关心变量的其次个缘由是为了提高估量值的精度。
调查前的预备:编写手册职员和调查人员的聘请和培训编制名录和寻踪
访问手册内容:1一般信息2简介3问卷说明4问卷的审核与整理5单个样本单元的管
理6作业治理7问题与答案
你为什么选择我?
调查人员应当对随机抽样的方法进展说明,让被调查者明白他是被随机抽取的,他实际上代表了总体中的个体,所以他的答复对于整个调查时格外重要的。
常用的追问方法:
数据质量的监控方法:
严格治理调查人员;(或现场检查)已完成的问卷;;:更好的理解数据和数据处理过程;;;;;.
:
4.“净化”
选择性检查的优点有:,,加快进度,,减轻被调查者答题负担〔这对小单位特别重要,由于他们对回访特别敏感
选择性审查的缺点
从个体单位的水平看,对数据质量重视较少
对于较小的估量域,与对问卷全部审核时相比,非抽样误差可能会增大
可能会有来自数据处理人员和数据用户方面的阻力,数据用户可能认为数据缺乏可信度
数据中可能存在不全都性,从而给数据用户造成数据质量不佳的印象
插补的局限性:
虽然均值插补可能会得到较好的点估量〔对总量估量和均值估量等〕,但由于在插补类均值这一点形成一个人为的“峰值”,从而破坏了分布状态和变量之间的关系。因此,假设用常规的抽样方差公式进展计算,就会低估最终的方差。
插补准则
插补得到的记录应当和审核有问题的记录格外相像。
好的插补会为评估留下审查的线索,并保证插补的记录具有内部全都性。插补处理过程应当是自动的,客观的,可再现的和有效的。
插补得到的记录硬挨满足全部审核规章。
插补值应标明,插补方法所使用的资料也应当清楚的标明。记录中变量的插补和非插补的值都应当保存,以便对插补的程度和影响进展评估。
认真选择插补的方法,考虑每一种插补方法的优缺点以及要插补的数据类型。
插补方法应削减无答复偏差,并尽可能地保持不同变量之间的关系。
插补系统应事先考虑周全做出规定并编程和调试。
插补系统应当能处理各种却是和不全都的工程。
对于供者插补方法,插补得到的记录应尽可能与选中的供者相像。这有利于保证插补记录中插补值与非插补值的组合不仅满足审核规章而且具有多样性。
调查报告写作的根本要求
1实事求是2要生疏调查领域的业务。3观点和数据要结合运用。
定义敏感数格的准则:
第一,切除规章其次,〔n,k〕规章第三,P百分数规章
几种处理敏感数格的方法:
限制法第一,合并数格其次,隐蔽数格
扰乱法第一,系统舍入其次,随机舍入第三,有掌握的随机舍入第四,对微型数据文件的泄密掌握法
削减敏感性问题的方法:
认真的措辞在肯定程度上也能帮助削减敏感问题的影响。有以下一些方法:

如何抽取PPS样本

计算
-132
-144 -158续p163-164
其他重点内容
评估插补工作,最关心的指标就是对调查估量值的偏差和产生的查补方差。
调查是生疏客观世界的一种手段。任何工作都离不开调查。
决策就必需进展市场调查,因此很多调查公司应运而生。
社会经济调查的任务主要是应用统计学的调查、整理和分析方法争论社会经济问题,目的是科学地反响社会、经济中各种各样的问题,分析问题形成的缘由和影响,研究其进展和变化的客观规律,为解决问题制定政策或政策供给依据。简洁地说,调查是为决策效劳。
调查的第一个阶段是打算,负责调查打算和设计的应当是一个由多方面人员组成的小组。
进展全面调查还有一些其他的缘由,其中之一就是为以后的抽样调查供给抽样框。
值得留意的是:全面调查和抽样调查并不是完全对立的,依据具体调查的需要,可将这两种方法结合起来使用。
防止泄密的方法主要有两种:限制扰乱。
均值插补局限性:虽然均值插补可能会得到较好的点估量〔对总量估量和均值估量
等〕,但由于在插补类均值这一点形成一个人为的“峰值”,从而破坏了分布状态和变量之间的关系,因此,假设用常规的抽样方差公式进展计算,就会低估最终的方差。
离群值的检验可以看作审核的一种类型,主要是用来觉察和确认可疑的记录。离群
值被定义为一个观看值或一组观看值,他们看起来与数据中的其他观看值不全都。
集中趋势的另一个度量是中位数。对与样本数据中位数是加权数据的中间值,假设数据个数为偶数,中位数是最中间两个数值的平均数。中位数即可用于定量数据,也可用于定序数据。而且对于有序数据来说,中位数是刻画集中局势最好的度量。
与均值相比,中位数的主要优点在于它更少受极端值的影响。
集中趋势的最终一个度量是众数。
假设一个分布是双峰的,则在解释数据的集中趋势度量是要特别留神,均值和中位数都可能导致误会。在这种状况下,有两个众数,给出这两个众数可以很好的地解释数据分布中存在的两个峰值。
在统计分析中,有时还是用其他统计量。雨中位数一样,四分位数也是一个位置度
量,
有时候,泄密掌握会对数据的质量产生负面影响,由于有些数据低不到发表或必需进展修改〔通过舍入数据、合并类别、排解小数格等〕。泄密掌握是为了确保被调查者的个人隐私受到敬重,与此同时最大程度地保持数据的效用。
调查中的泄密主要有两种类型:身份泄密和归属泄密。
由于普查〔全面调查〕的调查结果通常没有或然性,所以归属泄密常常发生在普查中。例如在某一地区医生收入的全面调查中供给了过于狭窄的范围。
调查的步骤与过程:一,调查的打算与设计二,调查前的预备三,调查的实施四,调查结果的分析与报告
进展全面调查还有一些其他缘由,其中之一是为以后的抽样调查供给抽样框
值得留意的是:全面调查和抽样调查并不是完全对立的,依据具体调查的需要,可将这两种调查方法结合起来使用
..
非抽样误差不仅消灭在抽样调查中,也消灭在全面调查中.
效率原则:在同样完成调查要求的前提下,,要在获得同样信息的前提下,应选择最简洁的调查方式,以使问卷的长度和题量到达最小.
关于态度的度量方法:要对这种有关态度问题的精度量是比较困难的,通常只能实行打分或评定等级进展排序的方法。
样本的抽选概率与抽样比〔看看P81〕
介绍Deff指标〔生疏P84〕
圆形系统抽样:假设N不能被n整除,则可以使用圆形系统抽样法来避开消灭可能样本量不全都的状况。我们把总体单元假想排列在一个圆上,并承受模余数法。
整群抽样的具体方法:整群抽样包括两步过程,首先将总体划分为群,然后抽选群的样本,再调查样本群中的全部单元。
抽样方差的大小与样本量的关系:假设其他因素不变,抽样方差的大小一般随着样本量的增大而削减。然而,为获得给定的方差,所需的样本量并不随总体大小的增大而等比例增加。实际上,在确定给定抽样方差所需的样本量时,对中等规模的总体来说,总体大小仅起有限的影响;而对大的总体则几乎没有影响。
样本量和精度之间的关系:随着抽样方差的不断减小,估量值的精度就会渐渐提高,
而估量值的精度越高,所需的样本量相应也就越大。
精度的表示方法:我们一再提到精度是用调查估量值的抽样方差或抽样误差来表示的,抽样方差或抽样误差越小,精度越高。调查估量值的精度与样本量时亲热相关的,随着样本量的增加调查估量值的精度也会不断提高。换句话说,对应估量量的抽样方差就会不断减小。所以,样本量取决于调查估量值所要求的精度。
P149表:留意此表中,当样本量从50加一倍增到100时,比例估量值的误差限有所降低,从±±,并没有如我们可想象的那样,减半至±。同样,对于500的样本量,或者5倍于100的样本量,误差限也只是削减到±,也没有与样本量增加5倍相对应的,削减到原来的1/5,即从±±。最终,样本量从500增加到1000时误差限也没有削减一半。
总体指标的变异程度何时最大:对于只取两个值的指标,即二元变量,则当这两个值在总体中以50%和50%的比例消灭时,总体指标的变异程度最大。
如何确保到达调查要求的精度:为确保到达调查要求的精度,在计算样本量时,建议对某一指标的总体变异程度实行较为保守的估量。换句话说,在实际中假设事先不知道调查中要测量指标变异程度的数据,那么最好的方法是假定争论指标具有最大的变异程度。例如对于二元变量,应当假定总体中该变量的变异程度为50%和50%对半平分,即假定P=。
总体大小的作用:在样本量确定过程中,人们常常以为总体越大,应抽的的样本就应当大,其实总体所起的作用因它的大小而有所差异。对于小规模总体,它起着重要作用;对于中等规模的总体,其作用也是中等,而大总体的作用很小。
P152表:由表可知,为满足要求的精度水平,随着总体大小的增加,样本量增加的比率渐渐减小到零。
公关工作包括一些大型调查的宣传活动,也包括在小规模调查使用的致被调查者的信、调查手册和一般机构介绍等各种宣传资料。为使被调查者了解调查的意义并能够和调查人员乐观合作,一项调查应当开展群众性的宣传活动
实际调查中很多状况下都需要对调查的单位进展寻踪,即在现场操作时仅依据抽样框的信息还不能对样本单元定位,因此需要进一步查找。对于邮寄调查,假设地址不详或地址错误、公司停业或被调查者搬迁,问卷就会被邮局退还,在访问调查中也可能消灭被调查者地址不具体等状况,尤其抽样框已经老化,在正式调查之前更应当对样本单元进展寻踪。
严格按问卷的措辞提问:争论说明,假设调查员没有完全准确的按问卷措辞去提问,那么很微小的措辞变化都可能会使被调查者的答复发生转变,可能会歪曲设计的原意而造成偏差。因此在实施调查中,调查员必需严格依据问卷的要求来提问,确定不能依据自己的理解来修改问卷中的问题的提法。
当调查涉及到机密信息时,调查员不应当要求被调查者当着其他人答复。假设被调查者有客人在场。调查人员应当与被调查者另约时间在访问,或者另选私人场所进展访问。寄宿者、租宿者和未成年的孩子,可能会要求避开其他家庭成员单独承受访问。
最终一点应值得留意的是调查人员要保护自己的人身权利。假设受到辱骂、口头恐
吓、身体骚扰、或暴力等威逼,调查人员应当马上撤退并向督导和有关领导报告。
为了避开花过多的时间和经费审核那些对最终的估量并无太大影响的数据,建议进行选择性审核。选择性审核基于这样一种思想,即:只有那些审核中觉察的“关键”问题而不是全部问题,才需要实行相应的处理措施。选择性审核一般适合于定量数据。