文档介绍:统计分析社会调查统计
第1页,此课件共19页哦
集中趋势分析指的使用一个典型值来反映一组数据的一般水平,别的数值围绕在它的周围.
最常见的集中量数有平均数(也称为均值),众数和中位数三种.
第2页,此课件共统计分析社会调查统计
第1页,此课件共19页哦
集中趋势分析指的使用一个典型值来反映一组数据的一般水平,别的数值围绕在它的周围.
最常见的集中量数有平均数(也称为均值),众数和中位数三种.
第2页,此课件共19页哦
(1)平均数(mean)
平均数数是指总体各单位数值之和除以总体单位数目所得之商
∑X
n
第3页,此课件共19页哦
例:
某班10名学生的年龄分别为20、21、19、19、19、20、20、21、22、18、20岁,求他们的平均年龄。
第4页,此课件共19页哦
(2)众数( m0)
总体中出现次数最多的标志值是众数。
例:
7名工人日产量(件)为4、5、6、6、6、7、8。
众数是6。
第5页,此课件共19页哦
(3)中位数(Md)
把一组数据按值的大小顺序排列起来,处于中央
位置的那个数值就叫中位数. 它的含义是整个数据中有一半数值在她之上,另一半数值在它之下.
公式为: Md=(n+1)÷2
第6页,此课件共19页哦
1、标志值的个数是奇数
例:7名工人生产某种产品,日产量(件)分别为4、6、6、8、9、12、14。位于中间位置的第四名工人的日产量8件为中位数。
2、标志值的个数是偶数.
上例增加为8名工人,日产量为4、6、6、8、9、12、13、14。中位数位置在第四和第五名中间,取这两者的平均数为中位数。
第7页,此课件共19页哦
3、离散趋势分析
离散趋势分析指用一个特别的数值来反映一组数据相互之间的差异程度。
最常见的离散量数有全距(极差)、异众比率、四分位差、标准差、离散系数.
第8页,此课件共19页哦
(1)全距(极差)(Range)
全距指一组数据的最大值与最小值之差.
全距(极差)越大,在一定程度上说明这组数据的离散程度越大,集中量数的代表性越低。
计算公式:
第9页,此课件共19页哦
例:
5名学生的成绩为50、69、76、88、97
则R=97-50=47
第10页,此课件共19页哦
(2)异众比率Variation Ratio
异众比率指一组数据中非众数的次数相对于总体全部单位的比率。异众比率越小,说明众数的代表性越好,反之,异众比率越大,则说明众数的代表性越差。
公式如下:
其中n是全部个案总数, 是众数出现的频数,二者之差就是非众数的频数。这个公式所要求出的,是在全部的个案中有多少是偏离众数。不属于众数的个案所占的比率愈大,就表示众数的代表性愈小,以之作估计或预测时所犯的错误也就愈大。
第11页,此课件共19页哦
例:假设甲校有学生550名,其中父亲职业最多的是农民,有288人;乙校有学生480名,其中父亲职业最多的也是农民,有295人。则:
甲校VR=550-288/550=
乙校VR=480-295/480=
甲、乙两校学生的父亲职业,众数都是农民,但离异程度不同。%的个案不是农民,%不是农民。因此,根据异众比率,甲校的离异幅度大于乙校。也就是说,在两校作估计或预测时,虽然应用同一个众数,但在甲校所犯的错误会大于乙校。
第12页,此课件共19页哦
(3)四分位差Interquartile Range
先将一组数据按大小排列顺序,然后将其4等分,去掉序列中最高的1/4和最低的1/4,仅就中间的一半数值来测定序列的全距。
Q1的位置(第一个四分位点)=(n+1)/4
Q3的位置(第三个四分位点)=3(n+1)/4
Q=Q3—Q1
第13页,此课件共19页哦
例:调查11位同学的年龄如下:17岁、18岁、18岁、19岁、19岁、20岁、20岁、21岁、21岁、22岁、。
首先,求出Q1和Q3的位置:
Q1 的位置= = =3
Q3的位置= = =9
其次,从数序中找出Q1=18,Q3=21
则四分位差Q= Q3—Q1=21—18=3
第14页,此课件共19页哦
(4)标准差Standar