文档介绍:一、量化研究
量化研究与质化研究都重视研究的客观性、科学性与数据分析的正确性,这是两种不同的研究派别,
量化研究的特征:
量化研究注重减少“垃圾进、垃圾出”,
研究者通过正确收集数据,选择合适而正确的统计方法,以客观的立场分析数据,
使之形成有用的信息,以检验研究假设,进而发现研究结果,整理归纳形成结论。
一、量化研究
量化研究与质化研究的区别:
1、“量”采用逻辑实证主义,将现象背后的原理简化为单一的客观实在,不因人的主观意志而转移(内部动力机制);“质”采用自然现象主义,认为自然和社会是多元的(描述多元的现象)。
2、“量”注重变量间必然的因果关系或相关情形, “质”注重变量脉络间关系的诠释和分析。
3、“量”重视假设演绎法, “质”注重经验归纳法。
4、“量”的研究者保持中立,借助仪器或问卷等收集信息, “质”的研究者一般采用参与性的活动通过互动收集信息。
5、“量”的研究重视由受试样本推论到总体, “质”的情景限制推论。
二、量的研究步骤
选择定义研究问题(设计问卷)
研究问题必须是可以检验的、有研究价值或重要的问题
方法:通过相关文献的研究分析,挖掘相关研究问题,制定
研究主题,草拟研究问题,对于重要的关键词要给予完整解释
执行研究程序
实施程序包括:样本的选择、测量工具的改进、数据的搜集
数据分析
检验研究假设、选择合适而正确的统计方法(描述性统计、推断性统计)
结果分析与结论
根据数据分析的结果,结论应该与最初拟订的假设或研究问题有关,研究结论要指出假设是否得到支持。
理论
假设
概念的操作性定义
选取样本
调查、相关设计
访问或问卷调查
实验设计
设计实验组
事实观察、访问、问卷
搜集资料
分析资料
结果发现
例1
三、量表的编制
变量的属性
名义变量:变量分类,如性别、年级、企业性质等
(控制性变量)
次序变量:方向性,如表示优劣、多少、高低、次序等
等距(比率)变量:间距相等、具有可加、可乘性,如经
营额、学生成绩、各种财务杠杆等
*不同的变量属性,所使用的统计方法也不同,如果设计的变量属性不符合所要求使用的统计方法,会导致统计结果的错误(在回归分析中应该特别注意)
例如:多元回归分析的自变量与因变量应该都是“连续变
量”,自变量如果是类别变量或次序变量应该首先转换为虚拟
变量(与研究相关的变量的矢量方向一致及变量属性一致) 。
量表编制的原则(如何使用量表将定性问题转换为定量)
量表的属性应该是次序变量,但次序变量与名义变量都属
于“离散变量”,离散变量无法求平均数或进行相关性统计、
回归等分析,因此必须转变成等距的虚拟变量来统计。
五点量表法(Liket-five point,李克特):最可靠的方法,适合与一般群体来设计,其好处在于不但能分清矢量的高低程度,而且等确定中心距,以保持变量的内部平衡。
七点量表法(Liket-Seven point,李克特) :适合与高精确度的问卷设计,一般适合与专家群体,其确定的准确度更高,但如果受试群体没有能力分清这种高精确性的矢量,会导致问卷收集数据的不准确性。
非常符合
符合
有时符合
不符合
非常不符合
5
4
5
2
1
总是如此
时常如此
有时如此
很少如此
从为如此
5
4
3
2
1
非常同意
同意
不能确定
不同意
非常不同意
5
4
3
2
1
非常重要
重要
不能确定
不重要
非常不重要
5
4
3
2
1
问卷设计:
我认为参加在职训练能增进工作效率
非常同意□□□□□非常不同意
5 4 3 2 1
你认为安全在你外出旅游中的作用是:
1. 很不重要 2. 不重要 3. 无所谓 4. 较重要 5. 很重要
例2
四、统计与数据挖掘方法论
Database
ODBC
Interface
Data cleaning
Data transforming
Data selecting
Objective
Data
Data
mining
Mode
Explaining
Man-machine interaction
Data preprocessing
五、数据处理常用方法
将问卷各个题目按照关键字段依次输入EXCEL,形成二维的数据库
编号
字段1
字段2
字段3
字段4
字段5
字段6
字段7
字段8
1
3
4
5
3
5
2
4
5
2
2
3
5
4
2
5
3
4
选择合适的方法进行数据库的数据的转换
字符性转换为数字性,尽量使用EXCEL强大的转换功能
数据的非正常值的转换,如通过查找原始问卷、变量属性的转换
数据格式的