文档名称：

SPSS市场分析.pdf

格式：pdf 大小：541KB 页数：5页

下载后只包含 1 个 PDF 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

SPSS市场分析.pdf

上传人:1781111**** 2024/5/11 文件大小：541 KB

下载得到文件列表

SPSS市场分析.pdf

相关文档

文档介绍

文档介绍：该【SPSS市场分析】是由【1781111****】上传分享，文档一共【5】页，该文档可以免费在线阅读，需要了解更多关于【SPSS市场分析】的内容，可以使用淘豆网的站内搜索功能，选择自己适合的文档，以下文字是截取该文章内的部分文字，如需要获得完整电子版，请下载此文档到您的设备，方便您编辑和打印。:..】数据分析概述?日期型:用来表示日期或时间的。SPSS的基本功能:数据管理、统计分析、二、变量的测量尺度(Measure属性)图表分析、输出管理等,具体内容包括描述(1)定类尺度:对事物的类别或属性的测统计、列联分析,总体的均值比较、相关分度,按事物的属性对其进行分类或分组。析、回归模型分析、聚类分析、主成份分析、特点:其值能测度类别差异,不能比较大时间序列分析、非参数检验等多个大类小。对定类尺度的变量只能计算频数和频2、SPSS的主要界面有数据编辑窗口和结率。果输出窗口适用数值型或字符型变量;进行分类时,必须符合穷尽原则和互斥原则。SPSS3种基本运行方式--完全窗口菜(2)定序尺度:对事物间的等级或顺序差别的测度,可比较优劣或排序。单方式;程序运行方式;混合运行方式特点:测量数值不代表绝对的数量大小,SPSS中使用的对话框主要有两类--文件只能排序,不能运算。操作对话框;统计分析对话框(3)定矩尺度:对事物类别或次序之间间距的测度。4、SPSS5个窗口:数据编辑窗口、结果特点:不仅能将事物区分为不同类型并进行排序,而且可能准确指出类别之间的差管理、草稿结果、语法编辑、脚本窗口距是多少;定矩变量通常以自然或物理单位5、SPSS的四种运行方式:菜单对话方式、为计量尺度,因此测量结果往往表现为数程序方式、Include命令方式值,所以计量结果可以进行加减运算。6、spss的三种输出结果:表格格式;文本(4)定比尺度:能够测算两个测度值之间格式;标准图与交互图比值,测量结果为数值。数据编辑器窗口包括:标题栏、菜单栏、工特点:定比变量是测量尺度的最高水平,它具栏、数据值编辑区、信息区(数据视图和除了具有其他三种测量尺度的全部特点外,变量视图)状态栏。数据编辑窗口包含变量还具有可计算两个测度之间比值的特点,因和观测。变量编辑窗口包含属性名和变量此它可以进行加、减、乘、除运算,而定矩【2】数据录入与获取变量值可进行加减运算。1、统计软件中数据的录入格式---即:一个三、Label:定义变量名标签;Value:定义观测者占一行,一个变量占一列变量值标签2、录入数据的步骤:1定义变量名;2指定四、缺失值:用户自定义缺失值和系统缺每个变量的各种属性;3录入数据。变量名不能与spss保留字相同,spss的保失值两大类。字符型变量,默认的缺失值留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH为空格;数值型变量,默认的缺失值为零。3、SPSS文件:语法文件(*.sps)、数据一、数据的直接录入1、DataView表可以直接输入观测数据值文件(*.sav)、结果输出文件(*.spv)。或存放数据,表的左端列边框显示观测个体一、变量储存类型:数值型、字符和日期型的序号,最上端行边框显示变量名。数值型:是0-9的阿拉伯数字和其他符号,2、VariableView表用来定义和修改变量的如美元符号、逗号或圆点组成的。名称、类型及其他属性?字符型:默认显示宽度为8个字符位,不Name:变量名,必须以字母、汉字及@区分大小写字母,不能进行数学运算。注意:在输入数据时不应输入引号开头,不能是数字;不能有空格或某些特:..不能与的关键字相同;首多重分类法:利用多个变量对一个多选题的答案进行定义,应该用多少个变量,由被字符为“$”是系统变量名;总长度不超过8访者实际可能给出的最多答案数而定。6、外部数据的获取:直接打开,利用文本个字符,共容纳4个汉字或8个英文字母,导向读入文本数据以及利用数据库OBDC接口读入数据。英文字母不区别大小写,最后一个字符不】数据管理Transform菜单:新变量的生成、记录的排能是句号。变量名不能重复序、对变量进行计数等。计算新变量:Compute;变量转换:Recode、Count等Type:变量类型包括8种:数值型、逗点pute过程--用于给变量赋值,其特点如下:数值型、圆点数值型、科学计数法型、,也可以是已有的变量。、美元记号型、设定货币、字符型。数,,也系统默认的为数值型。常用的为数值型、可以设定逻辑条件,只对满足条件记录加以赋值。其余纪录的相应变量或保持原状,或日期型和字符串和时间型4种。被赋于缺失值。变量所占的宽度。Decimals:小数点2、Categorizevariable过程--用于将连续性后位数。Label:变量标签。Values:变量值变量自动按要求公成等间距的几组。标签。Missing:缺失值的处理方式。3、count过程--对满足某项条件的数据进行Columns:变量在DateView中所显示的列计数宽(默认列宽为8)。Align:数据对齐格式Data菜单:对变量、观测量的编辑处理;对(默认为右对齐)。Measure:数据的测度方变量数据的变换;对观察量数据整理。式。系统给出名义尺度、定序尺度和等间距(1)简单命令:包括插入变量、插入记录尺度三种(默认为等间距尺度)。和到达某条记录,他们的功能实际上都可以3、SPSS软件编辑窗口除可以使用*.sav扩用鼠标在数据表界面上直接完成,很少会使展名数据文件,还可以直接打开和保存下述用菜单来调用。类型的文件:SPSSDOS版本产生的数据文(2)常用的简单过程:包括排序、拆分文件*.sys;Excel报表程序产生的数据文件件、选择记录和加权记录。*.xls;DBASE数据库格式文件*.dbf;SAS(3)文件合并过程:将几个数据文件合统计软件产生的数据文件。4、单选题的录入可以采用字符直接录入、并为大的spss数据文件,横向合并和纵字符代码+值标签、数值代码+值标签三种方式。向合并5、多选题的录入(4)其他过程:数据汇总过程和查找重复记录导向。多重二分法:是在编码的时候,对应每一用“(*)”表示变量来自于当前活动个选项都要定义一个变量,有几个选项就有数据文件中的变量,而用“(+)”表示将几个变量,这些变量均为二分类,他们各自要和当前数据文件进行合并的数据文件中代表对一个选项的选择结果。的变量。:..(3)分布特征(DistributionTendency)(1)在变量名处单击右键,弹出“sort和“SortDescending”。偏度系数(Skewness)和峰度系数(2)对于多变量排序,则需要使用SortCases过程来进行。(Kurtosis)二、多变量排序需要注意的三点:(1)在多重排序中,制定排序变量名是很(4)其他趋势百分位数指标(Percentile)、关键的,先指定的变量在排序时必然优先于极端值(Outlier)。后制订的变量。所用到的统计图则有:条图、饼图、直方(2)可以指定按某变量值升序排序的同时按另一变量值降序排序,或相反。图、箱式图、QQ图(用于判断正态性的(3)排序以后,原来记录数据的排列次序将被打乱。2、DescriptiveStatistics子菜单用于连续变量4、记录拆分--SplitFile;记录筛选--Select统计描述的过程Cases--Allcase:选择所有数据;Ifcondition(1)Frequencies:产生原始数据频数表,issatisfied:按指定条件选择数据。Random并能计算百分位数。对分类和定量资料都适Sampleofcases:对观察值进行随机抽样。用。Basedontimeorcaserange:顺序抽样。Use(2)Descriptive过程用于一般性的统计描filtervariable:用指定变量作过滤。述它不能绘制统计图一、数据汇总(3)Explore过程用于对连续性资料分布状分类汇总就是按指定的分类变量对观测值况不清楚时的探索性分析,它可以计算许多进行分组,对每组记录的各变量求指定的描描述统计量,给出各种统计图,并进行简单述统计量,结果可以存入新数据文件,也可的参数估计。以替换当前数据文件。(4)Ratio过程用于对两个连续性变量计算相对比指标,当研究者关心A、B两个指标】连续性变量的统计描述比值的变动情况时,该过程非常有用。1、统计描述中的可用工具统计的调查方式:(1)非随机:典型调(1)各种初步汇总描述方法:频数、百分位查、重点调查(2)随机:简单随机抽样、综合:分层(分数(2)各种统计描述指标:均值、标准差、类)抽样、整群抽样、等距抽样、(3)统计表(4)统计图表获得数据的调查方法:data—selectcase)集中趋势(CentralTrend):均数【5】分类变量的统计描述及多选题分析(Mean)中位数(Median)众数(Mode)1、Chi-Square过程其分析目的是检验分类数据样本所在总体分布(各类别所占比例)总合(Sum)是否与已知总体分布相同,是一个单样本检验。(2)离散趋势(DispersionTrend)标准具体做法是:先按照已知总体的构成比分布计算出样本中各类别的期差()、方差(Variance)、望频数,然后求出观测频数和期望频数的差值,最后计算全距(Range)、最小值(Minimum)、最出卡方统计量,利用卡方分布求出P值,以得出检验结论。大值(Maximum)、标准误()?如果理论假设是正确的,由此推算:..显著性判别。近实际观测数5、Means过程倾向于对样本进行描述,它据(次数),由此计算出的卡方值会很小;可以对需要比较各组计算描述指标,进行检如果理论假设不正确,理论次数与实际验前预分析。当然如果你愿意,也可直接比观测次数的偏差会很大,卡方值也会很较。大。显著性水平P=?Means过程的优势在于所有的描述2、累计频数是指本类别及较低类别出现的统计量均按自变量的取值分组计次数之和,累计百分比则是指本类别及较低算,无需像其他过程那样必须先调类别出现的次数之和占总次数的百分比。用SplitFile过程。3、Crosstabs过程有描述功能和统计推断能6、One-samplesTest过程用于进行样本所在力。不能产生一维频数表(单变量频数表),总体均数与已知总体均该功能由Frequencies过程实现。数的比较,即单样本的t检验。3、分类资料数据录入格式简介由于样本数据是通过随机调查若干名观察1采用频数表格式来记录。2传递的总信息对象得来,我们只知道他所在总体的均数在量和传统的枚举格式差不多,只是不能得知该样本均数的附近,但具体是多少并不清具体的个体取值而已。3对频数表格式需要楚。为了回答该问题,统计学上采用了小概用WeightCases过程指定频数变量。率反证法的原理:我们有如下两种假设:】均值比较Ho:u=uo,样本均数与总体均数1、假设检验的基本思想--小概率原理的差异完全是抽样误差造成。所谓小概率原理,就是认为小概率H1:u?uo,样本均数总体均数的事件在一次试验中几乎不可能发差异除了由抽样误差造成外,也反映了两生。也就是说,个总体均数确实存在的差异。如果对总体的某个假设是真实的,那么不利7、Paired-SampleTTest是检验两个有联系于或不能支持这一假设的小概率事件A在正态总体的均值是否存在显著的差异。又称一次试验中是几乎不可能发生的;要是在一配对样本的t检验。该过程用于进行配对次试验中事件A竟然发生了,我们就有理由设计的差值均数与总体均数0比较的t检怀疑这一假设的真实性,拒绝这一假设。验,配对设计有两种情况:。,就是假设检验问题(hypothesis相近者配对,分别给予两种处理,以观察两testing)。种处理效果有无差别。2、假设检验的两类错误?两独立样本t假设的基本步骤提出零假接受或拒绝H,都可能犯错误I类错误设、选择检验统计量、___计算检验统计量0弃真错误,发生的概率为α(αerror)观测值和概率P值__、给出显著性水平a,II类错误——取伪错误,发生的概率为β并做出决策(βerror)【7】方差分析3、Z检验和t检验主要用于总体参数的检1、单因素方差分析One-wayANOVA过程验,包括平均数、百分比等的检验。用于进行两组及多组间样本均数的比较,即平均数单值的假设检验,平均数差异的假设成组设计的方差分析。如果做了相应选择,检验;若n<30的小样本,用t检验,大样还可进行随后的两两比较。甚至于精确设定本用z检验均数比较方式。方差分析就是对多个总体4、正态总体参数假设检验的步骤均值是否相等这一假设进行检验。1:建立原假设H和备择假设H。2:计2、方差分析的原理01算统计量3:确定显著水平的值,查相应?数据差异的来源--因素的水平不同的分布表得其临界值以及拒绝域。4:进行(系统性差异);随机因素(随机性:..。数据差异的度量--水平之间的方差(组间方差)系统性因素和随机因素共同作用。水平内部的方差(组内方差)——随机性因素的作用。】相关分析与回归分析对变量之间的相关关系进行分析(Correlate)。其中包括简单相关分析(Bivariate)和偏相关分析(Partial)。回归分析(Regression)1、非单调关联--一个变量的出现(或不出现)与另一个变量的出现(或不出现)存在系统上的关联。单调关联--调研人员可以指出两个变量关联的总体方向。有两类单调关联:增加型和减少型。线性关联--两个变量之间存在“直线关系”,一个变量出现一定数量自动表明另一个变量也会出现一定数量。曲线关联--一个变量与另一个变量相关,但是关联不是用直线而是用曲线描述的。通过Analyze菜单进行相关分析(Correlate)2、简单相关分析一是通过散点图直观地显示变量之间关系,二是通过相关系数准确地反映两变量的关系程度。散点图SPSS软件的绘图命令集中在Graphs菜单单击GraphsScatter,打开Scatterplot散点图对话框,Simple简单散点图Matrix矩阵散点图Overlay重叠散点图3-D三维散点图简单相关分析操作--Analyze?Correlate?Bivariate3、偏相关分析--Analyze?Correlate?Partial4、回归分析(regressionanalysis)是确定两个或两个以上变量间相互依赖的定量关系