文档介绍：编辑版word
页脚下载后可删除，如有侵权请告知删除！
编辑版word
统计学依据数据的计量尺度将数据划分为三类：定距型数据（Scale）、定序型数据（Ordinal）、定类型数据（Nominal）。
定距型数据通常是指诸如身高、体重、血压等的连续型数据，也包括诸如人数、商品件数等离散型数据；
定序型数据具有内在固有大小或高低顺序，但它又不同于定距型数据，一般可以数值或字符表示。如职称变量可以有低级、中级、高级三个取值，可以分别用1、2、3等表示，年龄段变量可以有老、中、青三个取值，分别用A B C表示等。这里，无论是数值型的1、2 、3 还是字符型的A B C ，都是有大小或高低顺序的，但数据之间却是不等距的。因为，低级和中级职称之间的差距与中级和高级职称之间的差距是不相等的；
定类型数据是指没有内在固有大小或高低顺序，一般以数值或字符表示的分类数据。如性别变量中的男、女取值，可以分别用1、 2表示，民族变量中的各个民族，可以用‘汉’‘回’‘满’等字符表示等。这里，无论是数值型的1、 2 还是字符型的‘汉’‘回’‘满’，都不存在内部固有的大小或高低顺序，而只是一种名义上的指代。
我觉得教育年限应该设置成定距型数据（Scale）吧。因为，教育年限应该是一个连续的变量，它不存在内在的大小或高低顺序问题。
将可变的数量标志抽象化就称其为变量，其取值称为变量值或标志值。变量分为确定性变量和随机变量。确定性变量是指受必然性因素的作用，各变量值呈现出上升或下降惟一方向性变动的变量；随机变量是指受偶然性因素的作用，变量值呈现出随机的混沌状态变动的变量。。根据变量的取值是否连续划分，有连续型变量和离散型变量。连续型变量是指在一个取值区间内可取无穷多个值。连续型变量值要用测量或计算的方法取得；离散型变量是指在一个取值区间内变量仅可取有限个可列值。离散型变量值只能用计数的方法取得。
,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得.
反之,在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得.
如果变量可以在某个区间内取任一实数，即变量的取值可以是连续的，这随机变量就称为连续型随机变量，
1）无偏性。无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为θ，所选择的估计量为 θˆ，如果E( θˆ)= θ,称 θˆ 为 θ 的无偏估计量。
（2）有效性。一个无偏的估计量并不意味着它就非常接近被估计的参数，它还必须与总体参数的离散程度比较小。假定有两个用于估计总体参数的无偏估计量，分别用m1和m2 表示，它们的抽样分布的方差分别用 D（m1 ）和D（m2 ）表示，如果 m1的方差小于m2 的方差，即D（m1）< D（m2 ）,我们就称m1是比m2更有效的一个估计量。在无偏估计的条件下，估计量方差越小估计也就越有效。 (3)一致性，是指随着样本量的增大，点估计量的值越来越接近被估总体的参数。
编辑版word
页脚下载后