文档介绍:. .
. v v .
5. 一致性:保持时间序列的可比性
6. 最低本钱:以最经济的方式取得数据
第三章
数据审核(完整性和准确性)数据筛选(符合特定条件)数据排序(那一定顺序)数据***(按需要汇总)
频数(frequency) :落在各类别中的数据个数比例(proportion) :某一类别数据占全部数据的比值百分比(percentage) :将比照的基数作为100而计算的比值比率(ratio) :不同类别数值的比值
条形图:用宽度一样的条形的高度或长短来表示
各类别数据的图形。有单式条形图、复式条形图等形式主要用于反映分类数据的频数分布,绘制时,条形图可以横置或纵置,纵置时也称为柱形图。
帕累托图:按类别数据出现的频数多少排序后绘制的条形图
饼图:也称圆形图,是用圆形及圆扇形的角度来表示数值大小的图形2. 主要用于表示总体或样本中各组成局部所占的比例,对于研究构造性问题十分有用
组距分组:将变量值的一个区间作为一组2. 适合于连续变量3. 适合于变量值较多的情况4. 需要遵循“不重不漏〞的原那么5. 可采用等距分组,也可采用不等距分组
分组数据:直方图〔用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图〕,折线图。
数值型数据:茎叶图,箱线图,线图,
数值型数据多变量:散点图〔用横轴代表变量x,纵轴代表变量y,每组数据(xi yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图〕,气泡图,雷达图(假定各变量的取值具有一样的正负号,总的绝对值与图形所围成的区域成正比)
一好的图表应包括以下根本特征显示数据让读者把注意力集中在图表的容上,而不是制作图表的程序上防止歪曲 强调数据之间的比较效劳于一个明确的目的有对图表的统计描述和文字说明5种鉴别图表优劣的准那么:一好的图表应当精心设计、有助于洞察问题的实质使复杂的观点得到简明、确切、高效的阐述能在最短的时间以最少的笔墨给读者提供最大量的信息是多维的表述数据的真实情况
. .
. v .
第四章
集中趋势:一组数据向其中心值靠拢的倾向和程度2. 测度集中趋势就是寻找数据水平的代表值或中心值3. 不同类型的数据用不同的集中趋势测度值4. 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测
众数:1. 一组数据中出现次数最多的变量值2. 适合于数据量较多时使用3. 不受极端值的影响4. 一组数据可能没有众数或有几个众数5. 主要用于分类数据,也可用于顺序数据和数值型数据
中位数:. 不受极端值的影响3. 主要用于顺序数据,也可用数值型数据,但不能用于分类数据4. 各变量值与中位数的离差绝对值之和最小
四分位数:排序后处于25%和75%位置上的值.
平均数:也称为均值,是集中趋势的最常用测度值,一组数据的均衡点所在。表达了数据的必然性特征,易受极端值的影响。有简单平均数 和加权平均数(分组数据) 之分。
几何平均数〔计算平均比率主要用于计算平均增长率〕:
平均数的性质:各变量值与均值的离差之和等于零
各变量与均值的离差平方和最小
调和平均数:均值的另一种表现形式〔直接掌握公式中分子资料,缺频数资料〕
离散程度:均值的另一种表现形式〔直接掌握
公式中分子资料,缺频数资料〕
异众比率〔分类数据〕:对分类数据离散程度的测度,是非众数组的频数占总频数的比率,用于衡量众数的代表性
四分位差〔顺序数据〕:对顺序数据离散程度的测度2. 也称为距或四分间距3. 上四分位数与下四分位数之差QD = QU – QL4. 反映了中间50%数据的离散程度5. 不受极端值的影响6. 用于衡量中位数的代表性
. .
.