文档名称：

国民经济统计概论.pdf

格式：pdf 大小：566KB 页数：22页

下载后只包含 1 个 PDF 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

国民经济统计概论.pdf

上传人:小屁孩 2024/4/15 文件大小：566 KB

下载得到文件列表

国民经济统计概论.pdf

相关文档

文档介绍

文档介绍：该【国民经济统计概论】是由【小屁孩】上传分享，文档一共【22】页，该文档可以免费在线阅读，需要了解更多关于【国民经济统计概论】的内容，可以使用淘豆网的站内搜索功能，选择自己适合的文档，以下文字是截取该文章内的部分文字，如需要获得完整电子版，请下载此文档到您的设备，方便您编辑和打印。:..,整理数据,分析或推断数据,并以此为依据对所研究对象做出判断或决策的一门方法论科学。可概括为统计学是一门研究客观现象总体的数量表现及其变动规律的方法论科学。,①一类是以抽象的数量为研究对象,研究一般的收集数据,整理数据和分析数据方法的理论统计学,②另一类是以各个不同领域的具体数量为研究对象,研究在特定领域如何设定指标,收集数据,整理数据和分析数据方法的应用统计学。③理论统计学具有通用方法论的性质。应用统计学则与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。它通常具有边缘交叉和复合型学科的性质。理论统计学所提出的科学的数量方法为应用统计学研究提供了理论依据和条件,而应用统计学的发展又可进一步改进,完状况和发展理论统计学所提出的数量方法。3.①统计学按所处的发展阶段和采用的研究方法不同,可分为描述统计学和推断统计学②描述统计学研究如何对客观现象的数量进行计量,观测,概括和表述,是整个统计学的基础和统计研究工作的第一步。③推断统计学研究如何根据总体中的部分数据(样本指标)去推断总体数据(总体参数)的方法。推断统计学是现代统计学的核心内容,它以概率论为理论依据,利用部分数据对总体数据的某些性质或数量特征进行推断和检验。④描述统计学和推断统计学是统计方法的两个组成部分,描述统计学是整个统计学的基础,推断统计学是现代统计学的主要内容。4.①总体是构成统计活动研究对象的全部事物所组成的整体;②总体中的每个个体事物则称为个体,③样本是指从总体中随机抽取出来,并作为其代表的那一部分个体所组成的子集。④总体看作由研究对象的所有个体组成的集合,而样本就是该集合中的一个子集。:样本是指从总体中随机抽取出来,并作为其代表的那一部分个体所组成的子集。特点:①样本中的每个个体都必须取自于总体的内部。②从一个总体中可以抽取许多个不同的样本③样本是总体的代表④样本的随机性。6.?变量是指对客观现象进行计量的概念,包括数字变量和属性变量。?变量的特征:①变量是用于研究总体和个体具有属性变异是与数值变异的量化概念,②变量是一个具有量化性质的概念或名称,它不是指具体的数字③变量的取值有两个方面,一是在时间上取值,二是在空间上取值。?变量的分类①按其取值是否可用数字表示,分为属性变量与数字变量②变量按其取值是否连续,分为离散变量和连续变量。③变量按其变动是否有确定性,可分为确定性变量和随机变量。④变量按其在因果关系中所处的位置不同,可分为因变量与自变量⑤变量按其是否由研究对象体系范围内确定,可分为内生变量和外生变量⑥变量按其取值是否具有客观怀,可分为实在变量和虚拟变量。:..7.?总体就是组成统计活动研究对象的全部事物的全体集合。?一种总体是由自然物体所组成的总体,一种是由变量值所组成的总体。?由现实存在的各个具体事物构成的总体称为具体总体,而又想象中存在的各个假象事物构成的总体则称为设想总体。一般来说,设想总体是具体总体的抽象化,而具体总体则可以看成设想总体的组成部分,这种抽象化不仅有利于各种数据的处理与使用,而且在许多场合还可以更深入的揭示事物的本质。如:若考察某一批产品的质量,则研究的是具体总体,结果只能说明这一批产品的质量;但若考察在某种工艺条件下这种产品的质量,则研究的是设想总体,考察结果不仅能说明这种产品质量的高低,更重要的是还可以说明这种工艺条件的好坏。,称为统计推断。统计推断的基本内容是对总体指标数值的推断。样本是总体的代表或缩影,为保证统计推断的可靠性,样本必须有足够的代表性。因此,样本在总体中的散布应该是平衡均匀的,这就需要样本的抽取方式必须随机的。,简称指标。其中,测度总体特征数量的概念称为总体指标,而测试个体特征数量的概念则称为个体指标。统计指标的测度尺度有定类尺度,定序尺度,定距尺度和定比尺度。其中四种测度计量尺度的测量层次是依次递进的,定类尺度是最粗略的测度计量尺度,而定比尺度却是最精确的测度计量尺度。对于不同层次的测度计量尺度的测量结果,如果要统一化为同一层次的测量计量尺度的测量结果,则只能将高层次的测度计量尺度的测量结果转化为低层次测度计量尺度的结果。10.?反映总体及其所含个体的各个方面特征数量的一系列相互联系,相互补充的统计指标所形成的体系,称为统计指标体系。?它的设计内容主要有①设置统计指标体系的构架②确定每一个指标的内涵和外延③确定每个统计指标的计量单位④确定每个统计指标的计算方法。?统计指标体系应遵循四个原则:即目的性原则,科学性原则,可行性原则,联系性原则。,是社会经济统计活动的出发点。社会经济统计指标体系作为描述人类社会经济活动状况的指标体系,按人类社会经济活动可分为环境,社会,经济,科技四大部分。?环境统计指标体系主要包括地理环境,资源环境,社区环境,环境污染和环境保护五个方面统计指标;?社会统计指标体系主要围绕着社会生活主体状况,社会物质生活,社会精神文化生活,社会组织管理四个方面指标。?经济活动是人类社会活动的核心。相应的经济统计指标体系分为宏观经济指标体系和微观经济指标体系两部分。①宏观经济指标体系是反映社会再生产状况的指标体系,主要包括社会生产条件,社会生产成果指标,社会产品分配指标,社会商品流通指标,储蓄投资积累指标6个方面②微观(生产条件指标,生产投入指标,生产产出指标,经济效益指标,?科学技术是第一生产力,是经济发展:..的主要原动力和社会进步的基本杠杆,反映科学技术活动状况的指标体系则主要由科技活动投入,科技活动过程,科技产出成果三指标构成。1.①现场调查的主要目的是要了解研究对象的实际状况,它是在研究对象处于自然环境的条件下对其进行的观测,其主要适用于对自然和社会经济现象的数据调查。②试验观测是在人为安排的环境条件下对所研究事物的观测,其目的主要在于揭示事物相互之间的因果关系。③现场调查与试验观测的根本区别是:现场观测是一种无控制的观测,而试验观测是一种有控制的观测。:主要由?制订数据调查的方案,包括:①确定调查目的②确定调查对象和调查单位③确定调查项目和调查表④确定调查时间和调查期限⑤调查的组织实施;?现场观察登记,取得数据;?数据的整理显示。此环节既是数据调查过程的结束,又是统计分析推断过程的开始。3.?抽样方式通常有随机抽样调查和非随机抽样调查两种。?随机抽样调查又称为概率抽样调查,是完全随机的,样本被抽出的概率可以计算。基本方法主要有:①简单随机抽样②等距抽样③分层抽样④整群抽样?非随机抽样调查,每个样本被选中的机遇无法计算,更不能用概率表示。可分为①任意抽样②立意调查③配额抽样。4.①概率抽样的样本抽取是完全随机的,并且每个可能的样本被抽出的机遇大小是可以用概率计算和表示的;②非概率抽样的样本抽取是凭人们主观判断选取的或者是完全是有人们随意选取的,且每个样本被选中的机遇无法计算,更不能用概率表示。③概率抽样和非概率抽样所得到的数据资料虽然都可用来推算总体的指标数值,但是非概率抽样不能计算出每个可能样本被抽出的概率,所以无法估计推算用样本估计总体所产生的误差的大小,而概率抽样则可计算出每个可能样本被抽出的概率,从而可以估计推算出样本估计总体所产生的误差的范围,并可对此误差范围加以控制。因此从估计误差的计算和控制这种意义上来说,概率抽样明显的比非概率抽样优越。在实践中,重要的抽样调查均采用概率抽样调查方式,统计学主要研究的内容也就是概率抽样及所得数据资料的分析方法。5.①现场调查的个体指标观测方式主要有访问法和观察法,②观察法的优点是调查过程中被调查者并不知晓自己正在接受调查,一切动作行为均为自然状态,故所得资料真实可靠,缺点是调查过程中观察不到诸如行为动机等内在因素,并且有时需要作较长时间的观察才能得到结果,调查成本较高,实践使用时限制条件也较多。6.①试验观测是在人为安排的环境条件下对所研究事物的观澜,其目的主要在于揭示事物相互之间的因果关系。进行试验观测必须遵循均衡分散性原则和整齐可比性原则。②均衡分散性是指所进行的试验应均衡地分散在各个因素的不同水平或偝的全部各种可能配合之中,以便保证试验结果具有较强的代表性。③整齐可比性是指试验考察某个因素的各个水平或位级的效应时,其他因素应保持相同的水平,以便保证在该因素各个水平:..或位级的效应之中能最大限度的排除其他因素的干扰,从而能有效地进行比较。④之所以必须遵循这两个原则,其目的就是为了使试验观测结果具有代表性和便于分析比较。7.①试验观测方法可分为完全随机试验观测和随机区组试验观测。②完全随机试验类似于简单随机抽样调查,即将各试验单位随机地安排到所要进行试验的因素与水平配合之中进行试验观测。适用于各个试验单位本身必须具有同质性的,可满足均衡分散性和整齐可比性的要求。③随机区组试验观测类似于现场调查中的分层随机抽样调查。适用于试验单位本身存在较大情况。8.①电子计算机技术的发展和普及为建立存储调查资料的电子计算机数据库提供了极大的方便与可能,电子计算机数据库技术不仅提供了一种存储数据的仓库,还提供了各种各样数据排序与分类的功能,为从各种不同角度对调查数据进行分析提供了方便。②数据资料的采集耗费巨大,应当认真的妥善保管,不得随意丢弃,并要尽可能的开发利用,以充分发挥其拥有的效用。因此对于各种数据资料,不仅应当建立各种各样的电子计算机数据库将他们妥善保存,还应尽可能提供给相关部门和人员,对其进行各种各样的科学分析,充分挖掘出其中所含有的有用信息,为相关决策提供出科学的依据。9.①分类是对总体或样本的划分和对个体的合并,遵循互斥性和完备性原则,有单值分类和组距分类两种分类方法。②平行分类体系中各种不同项目的分类是相互独立平行的,体系中的类别总数等于各种分类的类别数之和③复合分类体系中各种不同项目的分类是逐一嵌套复合的,复合分类体系中的类别总数等于各种分类的类别数之积。?什么是组距分类?它们各在什么场合下应用??单值分类中作为分类依据的个体项目只能取很少的几个数值,可以将每个不同的取值作为一类,分类项目中有几个不同的取值,就可以分成多少类。?组距分类中,作为分类依据的个体项目的不同取得个数很多,可以将该个体项目的取值范围划分成若干个不同数值的区间,在同一区间内取值的个体为一类。11.?统计表一般由5个部分构成,分别为:总标题,横行标题,纵栏标题,数据资料,表末附注。?编制时应遵循的规则包括①全面安排,合理布局;②各种标题应简明扼要③项目排列应合理(水平指标在前,比率指标在后)④计量单位必须注明⑤栏数多时应加以编号⑥数字填写,整齐规格;⑦若有必要,加注说明。,构成次数分布的要素有哪些?观测变量的各个不同数值及每个不同数值的出现次数的顺序排列,称为变量的次数分布。各组变量值和各组次数或各组频率是次数分布表的两个必不可少的要素。,显示次数分布的方法有哪几种①编制观测变量次数分布表的方法通常有单值分组次数分布表和组距分组次数表两种形式。②单值分组次数分布表适用于离散的只有少数几个不同数值的观测变量,将观测变量的每一个不同取值作为一组,即每一个不同的取值代表一个组的变量值,并计算出各:..组变量值出现的个数,即各组次数,然后顺序列在次数分布表中。③组距分组次数分布表适用于取值较多的离散型变量或是连续型变量,将变量的整个取值范围依次划分为若干个敬意,每个区间作为一个分组,并计算出每个分组敬意上观测变量的变量值的个数,然后依次次各个分组敬意和各分组区间上变量值的个数在一个统计表中顺序列出。:①确定组数(用斯特吉斯公式:组数m=1+?min?(x)量值的个数为N。)②确定组距(组距w=③确定组限(上限不在内原则)m(组数)④计算各组的次数(频率)⑤,二者有何联系?总体次数分布揭示了观测变量的分部可能取值及其出现次数的分布状况,而样本次数分布则是样本中观测变量的各个不同数值及其出现次数顺序列示。②总体次数分布通常都是未知的,而样本次数分布则可以通过对抽样观测数据的整理而得出。样本次数分布是总体次数分布的一个代表,可以用来估计未知总体次数分布。5.①次数分布的理论模型:也就是随机变量的概率分布模型,即随机变量取各个不同数值概率的数学模型。②表示随机变量的概率分布的方法有概率分布表,概率分布图和概率分布函数三种,其中概率分布的函数式在理论分析研究中具有更地位和作用。但由于其十分复杂,不便于应用,所以,在实际应用中一般使用分布表和分布图。,二项分布,超几何分布和泊松分布各有什么实际背景,相互间有何联系??两点分布(即贝努里试验)又称0-1分布,适用特征:①实验只有两种对立的结果;②若成功的概率为P,则失败的概率为1-P或Q。即P+Q=1;③实验为独立试验。?超几何分布的应用条件:①从含N个个体的总体中,以不重复方式随机抽取n个个体作为样本,各次抽样并非独立;②总体中的全部个体分为AB两类,其中A类个数为D个,B类个数为N-D个;③样本中从A类D中抽取K个,从B类N-D中抽取数目为n-k个,若要确定?kn次实验中恰好出现k次A类的概率为PX=k=DN?Dk=0,1,2……n;?二项分布CnN的应用条件:在n次贝努里试验的基础上,若要确定其恰好有k次成功的概率,其中随机变量X表示实验次数。其概率模型为:PX=k=CkPk(1?p)n?kk=0,1,2……n其中,n0<P<1;n为正整数。⑤当n=1时,二项分布就变为两点分布,因此两点分布可以看作二项分布在n=1时的一个特例。(k=1,2,3??),X取各个可能值的概率,k即事件{X=x}的概率(分布律)为P{X=x}=P,k=1,2,??且P满足:①P≥0,kkkkkk=1,2,3??②∞P=1。k=,其一,任何两个相等的间隔期内某一事件发生次数的概率相等;其二,在某一间隔内某一:..事件的发生是否和其他任何一个间隔期内该事件的发生与否相互独立。其分布律为P??{X=k}=???,k=0,1,2……n记作X~P(λ),λ>0.?!:对于随机变量X的分布函数F(x),若存在非负函数f(x),使对任意实x数x有F(x)=fxdx,则称X为连续型随机变量,f(x)为X的概率分布密度,简称分布?∞密度或概率密度。,X2分布,t分布和F分布都是如何定义的?这几种分布之间有何联系?(x?μ)21??正态分布:若随机变量X的概率密度为f(x)=e2σ2,-∞<x<+∞,其中σ>0为常2πσ数,则称X服从参数为μ,σ的正态分布。记作X~N(μ,σ2)。若μ=0,σ2=1,即x21e?X~N(0,1)时,则称X服从标准正态分布。其概率密度为φ(x)=2,-∞<x<+∞.2πx?μ如果X~N(μ,σ2),则Z=~N(0,1).Z称为X的标准化。当Z<0时,可由等式σφ(Z)=1-φ(-Z)得到。?指数分布通常用来描述完成某项任务所需的时间,其概率密度1?x函数:当x≥0,f(x)=e,当x<0,f(x)=0,其中期望值λ>0.?χ2分布:是若干个λλ相互独立的标准正态随机变量平方和的概率分布模型。?t分布:设随机变量Z服从标准正态分布,则随机变量X服从自由度为n的X2分布,即有Z~N(0,1),X~X2(n),Z且二者相互独立,则随机变量t=服从学生t分布。,t分布的极限分布就是标准正态分布。而不其自由度n≥30时,t分布与标准正态分布的差别就已经很小,可以用标准正态分布来代替t分布。泊松分布用来描述某区间内某事件的发生次数,而指数分布则用来描述两次事件之间的长度。?F分布是两具互相独立的X2分布随面变量除以各自的自由度以后,二者再相除之商所构成的随机变量的概率分布模型。设随机变量U服从自由度为m的X2分布,随机变量V服从自由度为n的X2分布,即有U~X2mnm(m),V~X2(n),且二者相互独立,则二者分别除以各自的自由度后再相除后构成的随nUm/m机变量。F=服从F(m,n)分布,其概率密度函数为Vn/nF分布记作F(m,n)随机变量X服从F分布,记作X~F(m,n),权数对算术平均数大小起着权衡轻重的作用,但不取决于它的绝对值大小,而取决于他的比重。如果各组绝对权数按统一比例变化,则不会影响算术平均数的大小。:..----①分布中心是指距离一个变量的所有取值最近的数值。②变量的分布中心是变量取值的一个代表,可以用它来反映其取值的一般水平③变量的分布中心可以揭示其取值的次数分布在直角坐标系上的集中位置,可以用来反映变量分布密度曲线的中心位置,即对称中心或尖峰位置。,中位数和众数,三者之间关系----取决于变量值在数列中的分布状况。①正态分布情况下,三者在数量上完全相等即-=m=m②由于众xe0数一般不受极端值的影响,中位数只受极端值所引起中间位置变动的影响,而不受极端值本身大小的影响,极端值对算术平均数的影响最大,因此,当有极大值出现时,三者关系为m<m<-,称为正偏分布或右偏分布。③当有极小值出现时,三者数量关系为-0exx<m<m④无论左偏还是右偏,中位数总是在众数和算术平均数中间位置。,众数与中位数的距离约为中位数与算术平均数距离的2位,即:m-m=2(m-0ee-)。---变量的各个取值之间的离散程序是变量次数分布的另一个重要特征,①通过对变量取值之间离散程序的测定,可以反映各个变量值之间的差异大小,从而可以反映分布中心指标对各个变量值代表性的高低。②通过对变量取值间离散程序的测定,可以大致反映变量次数分布密度曲线的形状。,四分位全距,平均差,标准差,方差和变异系数等①极差(全距)R=max(x)-min(x),是指一组变量值中最大变量值与最小变量值之差,ii用来表示变量的变动范围,优点:计算简单,意义明了,缺点:极差的确定只根据两个极端变量值计算,不受中间变量值影响,不能全面反映差异情况②四分位全距(IQR=|Q-Q|).是指将一组由小到大排列的变量值分成四等分,得到三个分割点QQQ,③平12123均差(=其中x代表各变量值)平均差反映了变量的各个取值离算术平均数i的平均距离。平均差意义明确,计算简便。但运算复杂。④标准差是变量的各个取值离差平方的平均数的平方根,又称为概率方差,标准差和平均差,同样是根据一组变量值中的所有变量值计算差异程序,也同样是以算术平均数为标准,但标准差不但可以消除离差正负项的差别,而且强化了离差的信息,较为常用。:各个衡量变量取值之间绝对差异的指标与算术平均数的比率,通称为变异系数,主要用于不同变量的各自取值之间差异程序的比较。具体来说有,极差系数,平均差系数数的标准差系数。因为对于不同的变量,其变量的极差,平均差和标准差各有不同的数量级和不同的量纲,难以直接对比。:?贝努里大数定理:设事件在一次试验中发生的概率为p,在n次独立重复试验中,事件A发生了m次,则,对任意给定的正数ε,有,其等价形:..m式为:此定理说明:事件发生的频率,依概率收敛于事件发生的概率p,nm表达了频率的稳定性,当n很大时,p≈,这种方法称为抽样估计。n?辛钦大数定律:用测量数据的算术平均数代替其真值的方法依据。假定要测量某一物理量μ,在不变条件测量n次,得到的结果xx?x是不完全相同的,它们可以看作n1,2n个独立随机变量XX?X(它们服从同一分布且数学期望均为μ即E(X)=μ,k=1,2?)1,2,nk的试验观察值,对任意正数ε,恒有。当n很大时,n次测量结x1+x2+x3果的算术平均数作为真值μ的近似值,即μ≈。:?林德贝格-勒维中心极限定理(也称独立同分布中心极限定理)设随机变量X,X?X相互独立,服从同一分布,且具有数学期望和方差E(X)=μ,D(X)=σ212nk≠0,(k=1,2?),记则恒有:?德莫佛-拉普拉斯中心极限定理。设X~B(n,p),0<p<1,则其结果表明二项分布的n极限分布是正态分布,因此,当n充分大时,若随机变量X~B(n,p),则X~Bnn(np,np(1-p)):有限总体中所包含的个数为N,抽取n个个体的样本,则总样本个数是Nn,1而样本容量为n,:即不重置抽样或不放回抽样。其特点是①n个个体的样本是由n次抽取的结果组成。②每次抽取的结果不是独立的③虽然在同次试验中每个个体被抽中的概率是相同的,但在不同次试验中被抽中的概率是不相同的,若考虑顺序其总样本个数为nN!nN!P=,不考虑顺序,总样本个数为C=。NN?n!NN?n!N!:对于给定的总体和抽样方式以及样本容量,样本指标取值的概率分布就称为抽样分布,在确定样本容量下的抽样分布称为样本统计量的精确分布。,样本比例和样本方差。样本均值的抽样分布:,只要样本容量n足够大,其样本均值x的概率分布趋σσ2近于以总体均值μ为期望,以为标准误的正态分布,即x~N(μ,)。对于来自两点分布总体的一个简单随机样本,如果样本容量nP(1?P)足够大,则样本比例P的概率分布就趋近于以总体比例P为期望,以为标准误nP(1?P)的正态分布,即,P~N(P,)n:..,则对于来该总体的一个n的简单随机样本,其无偏样本2方差S2与总体方差σ2的比值的n-1倍,服从自由度为(n-1)的χ分布,即(n?1)S22~。抽样估计有两种方法:点估计和区间估计。:用来估计总体指标数值的统计量称为该总体指标的估计量,该估计量的数值称为该总体指标的估计值。总体指标的估计值就是该估计量在某个给定样本上的取值。,无偏性,有效性,充分性和稳健性等。①一致性。对于总体指标,其估计量的取值随着样本容量的增大越来越接近于总体指标的真值,则该估计量就称为总体指标的一致估计量,或为相合估计量,一致性是对估计量的最基本的要求。②无偏性,小样本的总体方差应采用无偏样本估计,大样本估计总体方差时采用常规样本方差和无偏样本方差都可③有效性,两个无偏估计量比较,方差较小者为有效,若是两个估计量的方差之比称为二者的相对效率,若比率w<1,则估计是分子比分母有效。④充分性:估计量是总体指标的充分估计量,样本方差是总体方差的充分估计量。⑤稳健性:样本估计量对样本数据的污染不敏感,所以估计量就是总体指标的一个稳健统计量。样本中位数是总体均值的一个稳健估计量。估计量根据样本数据的特点在有效性和稳健性二者之间折中。,它是先将总体中各个个体按某种特征分成若干大类,每类内部的各个个体都相差不大,而类与类之间则相差较大,然后,在每一类内采用简单随机抽样方式抽取若干个体,所有类中抽出的个体的集合构成样本。类型抽样的特点:能够使总体中的每个类型都有一些个体被投入样本,有助于提高样本的代表性,适用于总体内部差异较大且有明显的不同类型界限或标志。:样本估计量的标准差通常称为该估计量的标准误差,简称标准误。实践中一般采用样本估计量的标准差作为衡量抽样估计误差的指标。记所要估计的总体指标为θ,其估计量为θ,则此估计量的标准误就定义为,它的影响因素有①总体中各个体之间的差异程度。②样本容量的大小③抽样的方式与方法。要提高抽样估计的精确程度,就必须设法降低抽样误差及其标准误,从而必须根据其影响因素采取相应的措施。15.?估计区间,就是在事先给定的概率保证程度下,根据样本估计量的概率分布,确定出可能包含未知总体参数的某个区间,作为对未知总体参数的估计。?置信概率:记待估计的未知总体指标为θ,样本估计量为θ,事先给定的概率为1-α,若根据样本估计量θ的概率分布可计算出一个区间(θ,θ),使得该区间包含未知总体参数θ的概LU率等于事先给定的概率1-α,即有等式P(θ<θ<θ)=1-α成立,则该区间(θ,LUL:..θ)就称为未知总体参数的置信区间,其中分别称为置信下限和置信上限;而概率1-Uα就称为置信概率或置信度,它表明了使用此区间估计的可靠程度或把握程度,其中α称为该区间估计的风险。?估计精度:区间估计既给出了抽样估计的可靠程度,又给出其精度。其中置信概率是可靠程序的度量,而置信区间的长度则表达了估计的精确程度,置信概率越大,估计的可靠程度越高。区间估计的可靠程度和精确程度是相互矛盾的。影响估计区间长度的因素主要有总体中各个个体之间的差异程度,样本容量的大小,抽样的方式和方法等。。以组织抽样调查时,抽样误差的大小直接影响样本指标代表性的大小,而必要的样本单位数目是保证抽样误差不超过某一给定范围的重要因素。影响它的因素主要①研究对象的变化程度②所要求或允许的误差大小③要求推断的置信程度。当所研究的对象差异越大,允许误差越小,置信程度越高时,样本要求量越大。:两个现象(或变量)之间存在着一定的联系,但又不是严格的,确定的关系,称为相关关系;当一个变量的变化完全决定另一个变量的变化,或两变量之间是一种严格的,确定的关系时,这种关系称为函数关系。:如果两变量之间的变化方向是一致的,即存在正相关;若变量之间的变化方向是相反的,:其变量Y与变量X的相关关系线性组合,或绘制的散点图近似地表现为一条直线。非线性相关:Y与X是非线性组合,。利用样本数据计算的相关系数称为样本相关系数,用r表示。:通过样本观测值对估计值进行估计,称为估计的线性回归方程。方法用最小二乘法,其思想是:对每一样本观测值,考虑观测值与其回归值的离差越小越好,综合地考虑n个离差值,定义离差平方和为Q。寻找估计值,使Q达到最小。:是残差平方和SSE(即观测值与估计值的差的平方和)的均方根,反e映了实际观测值与估计值之间的差异程度,。从实际意义上看,反映了用估计的回归方程预测被解释变量时预测误差的大小。S越小,回归方程对各观测点的代表性就越好,e拟合程度就越高,预测也就越准确。:对于x的给定值,求出y的平均值的估计区间。在x=x,1-a的置0信度下,:对于x的给定值,:建立线性回归模型时,需要假定被解释变量y与解释变量x之间具有线性关系,且解释变量(即自变量)的取值是非随机的(即其值是外生的,事:..先给定的)被解释变量则是随机变量,这就意味着对于给定的解释变量x,y的取值都相应地对应着一个分布。=,是说明回归方程对观测数据拟合程度的一个度量值,判定总变差平方和SST系数越高,说明直线对观测数据的拟合程度越好。=b+bX中b是直线的截距,表示当解释变量x为零时y的平均值。回归系数b是直0101线的斜率,表示解释变量x每增加一个单位,被解释变量将相应地平均变化b个单位。:?时间数列分为四个基本要素:即长期趋势,季节变动,循环变动和不规则变动。?长期趋势:是指客观现象在一个相当长的时期内,受某种稳定性因素影响所呈现出的上升或下降的趋