文档介绍:环保意识调查问卷的Logistic模型李洪涛宁静方兆本2012-7-2311:29:08 来源:《统计与精算》2002年第4期内容提要:本文应用多元统计分析中的方差分析,logistic模型等方法对环保意识调查问卷反馈的信息进行统计分析,建立被调查企业对环境保护意识的logistic模型,进而可对企业家的环境保护意识的好坏进行判断。关键词:logistic模型方差分析作者简介:李洪涛,宁静,方兆本,中国科学技术大学商学院,合肥230026 引言为了推进发展中国家环保事业的研究,了解我国企业家的环境保护意识,联合国教科文组织和联合国开发计划署委托中国科学院国际合作局由我们实施了一项名为《通过清洁生产来加强企业管理者在环境保护中的作用》的项目。该项目的旨在于改进环境管理教育,通过与国际机构合作,组织培训及对示范企业进行考察,使企业家在环境保护中发挥更大的作用。项目通过问卷和访谈两种形式进行。为了实施这个目的,需要评估出各个企业家的环保态度,进而判断哪些企业家环保意识好,哪些需要通过环境管理教育提高环保意识。一、数据与方法(一)数据来源问卷采用三种形式:随机的信件调查、有选择的发送传真、当面填写。共发放问卷480份,收回316份问卷,%。问卷访问范围覆盖华东、华南、西南、西北、东北五个地区,包括22个省、市、直辖市(%),遍及20个行业。%。从此看出,问卷的抽样省市分布比较合理,得出的信息具有一定的代表性。问卷涉及的行业分布主要集中在化工、建材、机械、电器电子和医药行业。每份问卷包括31个问题,均为选择题。其中复选题11个,单选题20个。每道题的选择答案为4到7个,在处理时,分别根据选择答案在被选答案中的排列顺序(即序号)来代替。(二)方法采用多因素方差分析模型和logistic模型。二、建模为了建立被调查企业家对环境保护意识的得分模型。我们先根据问卷的题目选出与被调查者对环保态度明显相关的变量,在此基础上,计算出每家企业的环境意识得分。记为y[,0]。并检验初选变量的合理性。把y[,0]作为因变量,对问卷中其余未选入题目进行最优全子集回归,选出初步最优相关变量。对此作ANOVA模型判断初步最优相关变量的不同水平是否对因变量有显著影响,然后选出有显著影响的变量进入企业环境意识得分的计算,得出y[,1],再以y[,1]为因变量用新的ANOVA模型判断剩余变量是否有显著影响。如此循环直到一稳定状态,得到企业环保意识的最优计算得分标准的变量。并根据此得分建立logistic模型,得到各企业基于问卷填写反映出的环保意识好的概率。(一)初始变量的选择(1)把问卷中直接反映被调查者对环保态度的题目选出,对每位企业家评分,分值从-1到+1,得到Y[,0]。初选题目及评分标准为: 第6题:在描述本企业的近来主要成就中,以选择“对环境影响减少”在各自答案的先后顺序评分。第9题:根据企业家所在企业通过ISO14000的情况来评分,已经通过的给最高分1,依次类推。第11题:根据企业家认为“既要经济发展,又要保护环境”是否可行的态度评分。第13题:对选近年来企业已减少对环境的影响答案的企业家增加1分,否则得-1分。第18题:根据企业家对“一票否决权”的赞成程度为他们评分。第19题:根据企业家对“谁污染,谁治理”的原则的赞成程度为他们评分。第22题:根据企业确保遵守环境法律法规的途径的多少来为企业家评分。第30题:根据企业与社区群众发生环境纠纷的频度为企业家评分。将每位企业家的八道题的得分求和,得到初始得分Y[,0]。(2)检验初选变量的合理性: 以初次得到的企业家环保意识得分作为因变量,初选的题目作为自变量,建立回归模型。得回归方程为: Y=-[,1]-[,2]-[,3]-[,4]-[,5]+[,6]+ε其中Y代表企业环保意识得分,X[,1],X[,2],X[,3],X[,4],X[,5],X[,6],分别代表被调查企业在第9题,第11题,第18题,第19题和第30题中所选答案,取值范围为1,2,3,4,5,6的自然数,分别代表各题的所选答案在被选答案中的标号。从模型系数的t检验可知:,每个系数都显著的不为零,这说明初次选入的变量虽然不能确保包括了全面的最优相关变量,但保证了各个变量都提供了一定的信息且不能互相代替。(3)从剩余变量中选择较相关的变量利用Y[,0]对剩余变量(题目)作最优全子集回归,根据C[,p]准则,选出如下最优子集:“X[,1],X[,2],X[,3],X[,4],X[,5],X[,6],X[,7],X[,8],X[,9],X[,10],X[,1