1 / 26
文档名称:

SPSS实验报告.pdf

格式:pdf   大小:4,601KB   页数:26页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

SPSS实验报告.pdf

上传人:1781111**** 2024/5/11 文件大小:4.49 MB

下载得到文件列表

SPSS实验报告.pdf

相关文档

文档介绍

文档介绍:该【SPSS实验报告 】是由【1781111****】上传分享,文档一共【26】页,该文档可以免费在线阅读,需要了解更多关于【SPSS实验报告 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:..、原理及作用;.掌握用SPSS进行单因素、双因素及协方差分析的方法;.结合参考资料了解方差分析的其它方法及作用。二方差分析的原理方差分析的基本原理是认为不同处理组的均值间的差别基本来源有两个:()随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作wSS,组内自由度wdf;()实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差的总平方和表示,记作bSS,组间自由度bdf。,选择土壤条件基本相同的土地,分成块,将每一个品种在块试验田上试种,测得小表亩产量(kg)(数据文件为data-.sav),。(数据来源:《SPSS实用统计分析》郝黎仁,中国水利水电出版社).......产量......实验步骤:第步分析:由于有一个因素(小麦),而且是种饲料。故不能用独立样本T检验(仅适用两组数据),这里可用单因素方差分析;第步数据的组织:分成两列,一列是试验田的产量(output),另一列是小麦品种(breed)(A、B、C、D);第步方差相等的齐性检验:由于方差分析的前提是各个水平下(这里是不同品种的小麦产量)的总体服从方差相等的正态分布。其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的。因此必须对方差相等的前提进行检验。paremeans—One-WayANOVA,将小麦产量(output)选入dependentlist框中,将品种(breed)选入factor:..,选中Homogeneityofvariancetest(方差齐性检验),parisons,.。如下图所示:实验结果及分析::方差齐性检验的H假设是方差相等,从上表可看出Sig.=.>.,说明应该接受H假设。几种小麦的方差检验结果(如下):组间平方和为.,自由度(df)为,均方为.;组内平方和为.,自由度为,均方为.,;F统计量为.。由于组间比较的:..值)=.<.,故应拒绝H假设(四种小麦的产量无显著性差异),说明四种小麦的产量有显著性差异。:在等齐性检验中Sig.=.>.,所以接受H假设(四种小麦产量无显著性差异),组间比较的相伴概率Sig(P值)=.<.,故应拒绝H假设(四种小麦的产量无显著性差异),说明四种小麦的产量有显著性差异。因此,,,B,C,D的寿命(由行驶的里程数决定),见表.(单位:千英里)(数据文件为data-.sav),其中每种轮胎应用在随机选择的辆汽车上。?(数据来源:《统计学(第三版)》,,科学出版社):第步分析:由于有一个因素(轮胎),而且是种饲料。故不能用独立样本T检验(仅适用两组数据),这里可用单因素方差分析;第步数据的组织:分成两列,一列是轮胎(tyre),另一列是里程(mileage);第步:方差相等的齐性检验:由于方差分析的前提是各个水平下(这里是不同类型轮胎的寿命)的总体服从方差相等的正态分布。其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的。因此必须对方差相等的前提进行检验。paremeans—One-WayANOVA,将轮胎(tyre)选入dependentlist框中,将里程(mileage)选入factor框中,点开Options,选中Homogeneityofvariancetest(方差齐性检验),点:..parisons,将significancelevel的值设置为.。实验结果及分析:从上面两个表可以看出:方差齐性检验的H假设是方差相等,从上表可看出Sig.=.>.,说明应该接受H假设。组间平方和为.,自由度(df)为,均方为.;组内平方和为.,自由度为,均方为.;.。由于组间比较的相伴概率Sig(P值)=.>.,故应接受H假设(四种轮胎的寿命无显著性差异),说明四种轮胎的寿命无显著性差异。如果想进一步了解空间是哪种和其他组有显著性的均值差别(即哪种轮胎更好),就需要在多个样本均值间进行两两比较。单击PostHoc按钮,打开击PostHoc按钮,打开One-WayANOVA:parisions对话框,如图所示。在其中可以选择一种或几种比较分析的方法。输出结果为::..B型轮胎相比于A、C、D、要好,D型轮胎的寿命最短。.某超市将同一种商品做种不同的包装(A)并摆放在个不同的货架区(B)进行销售试验,随机抽取天的销售量作为样本,具体资料见表.。要求检验:、摆放位置及其搭配对销售情况是否有显著性影响。(数据来源:《应用统计学》耿修林,科学出版社;数据文件:data-.sav),,,,,,A,,,,,,A,,,,,,实验步骤:第步分析:需要研究不同教学方法和不同性别对数学成绩的影响。这是一个多因素(双因素)方差分析问题。第步按Analyze|GeneralLinearModel|Univariate的步骤打开Univariate对话框。并将“销量”变量移入DependentVariable框中,将“包装”和“摆放位置”移入FixedFactor(s)中,如图::..步单击Options,由于方差分析的前提上方差相等,故应进行方差齐性检验,选中“Homogeneitytests”;第步。打开Univariate:parisonsforObservedMeans对话框,在其中选出需要进行比较分析的对话框,这里选“组别”,再选择一种方差相等时的检验模型和不相等时的检验模型;第步选择建立多因素方差分析的模型种类。打开Model对话框,本例用默认的Fullfactorial模型。这种模型将观察变量总的变异平方和分解为多个控制变量对观察变量的独立部分、多个控制变量交互作用部分以及随机变量影响部分。第步以图形方式展示交互效果。如果各因素间无交互效果,则各个水平对应的图形应近于平行,否则相交。点开Plots,选择两个变量之交互作用,如图:第步对控制变量各个水平上的观察变量的差异进行对比检验。选择Contrasts对话框,对两种因素均进行对比分析,方法用Simple方法,并以最后一个水平的观察变量均值为标准。(选择Contrasts方式后需单击Change进行确认)第步运行结果及分析。实验结果及分析:分组描述:方差齐性检验结果::..LSD方法的结果如下:多因素方差分析及交互检验:该表是进行多因素方差分析的主要部分,由于指定建立饱和模型,因此总的离差平方和分为个部分:多个控制变量对观察量的独立作用、交互作用及随机变量的影响。关于多个控制变量的独立作用部分。不同包装贡献离差平方和为.,.,均方为.,这说明摆放位置比包装影响大。从相伴概率来看,都小于.,说明两者均有影响。关于多个控制变量的交互作用部分,这里组别与性别的交互作用的离差平方和为.,均方为.,.。表明它们的交互作用对观察结果造成了显著影响。Error部分是随机变量影响部分。:..可以看第,组与第组比较的均值差异均显著。下图是摆放位置变量的均值比较结果,可以看第,组与第组比较的均值差异均显著。.研究杨树一年生长量与施用氮肥和钾肥的关系。为了研究这种关系,一共进行了个样地的栽培实验,测定杨树苗的一年生长量、初始高度、全部实验条件(包括氮肥量和钾肥量)及实验结果(杨树苗的生长量)数据如表.,、钾肥量及树苗初始高度中哪些对杨树的生长有显著性影响。(数据来源:《生物数学模型的统计学基础》李勇,科学出版社;数据文件:data-.sav)..多....少..多..少..多..少..多.....实验步骤:第步分析:入学成绩肯定会对最后成绩有所影响,这里着重分析不同教学方法的影响,就应该将生长量的影响去除。就应该用到协方差分析。第步按以下步骤analyze|generallinearmodel|univariate,将树苗初高为协变量,并按以下设置::..步其它设置与多因素方差分析大同小异。实验结果及分析:可以看出氮肥量和初始高度的影响是不显著的,而钾肥量的影响是显著的。、原理及在统计中的作用;:..掌握用SPSS进行两个变量间的相关分析;.掌握用SPSS进行偏相关分析;.掌握用SPSS进行距离分析。二相关分析的基本概念及原理、基本概念人们在实践中发现,变量之间关系分为两种类型:函数关系和相关关系。函数关系是变量间的一咱确定性关系。但是,在实际问题中,变量间的关系往往并不是那么简单,也就是说,变量之间有着密切关系,但又不能由一个(或几个)变量的值确定另一个变量的值,这种变量之间的关系是不确定性关系,称为相关关系。其特点是:一个变量的取值不能由另一个变量唯一确定,即当自变量x取某个值时,因变量y的值可能会有多个。这种关系不确定的变量显然不能用函数形式予以描述,但也不是杂乱无章、无规律可循的。基本数学原理为了准确度量两个变量之间关系的密切程度,用相关系数来度量。对两个变量之间线性相关程度的度量称为简单相关系数。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为;若根据样本数据计算的,称为样本相关系数,记为r。r>,正相关,表明自变量和因变量呈相同方向变化;r<,负相关;r的绝对值愈接近,表示x,y愈接近线性相关。当|r|=时,y的取值完全依赖于x,两者为函数关系,是完全的线性关系;r的绝对值愈接近,表示x,y愈没有线性相关关系。当r=,表示两个变量之间不存在线性相关系。当<r<,表示x,y有相关关系,但是非线性关系。|r|>=.,视为高度相关;.<=|r|<.,视为中度相关;|r|<.视为不相关。偏相关系数的检验:在利用本研究总体的特性时,由于抽样误差的存在,样本中控制了其他变量的影响,两个变量间偏相关系数不为,不能说明总体中这两个变量间的偏相关系数不是,因此必须进行检验。检验的零假设:总体中两个变量间的偏相关系数为。,要求对以上组数据两两之间进行相关分析,。(数据来源:《统计软件SPSS系列应用实践篇》苏金明,电子工业出版社;数据文件:data-.sav):第步分析:分析三组数据的两两之间的相关性,而且给出的是具体的数值,这是一个二元相关性问题;第步数据组织:将三个变量分别定义为花瓣、花枝和花萼;:..步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations并作如下图所作的设置:实验结果及分析:运行结果中给出了个变量两两之间的Pearson相关系数(PearsonCorrelation)、双侧显著情况检验概率(Sig.(-tailed))和数据组数(N)。。另外,从表中可以看出,花瓣长和花枝长的数据具有很强的相关性。而双侧检验的显著性概率均小于.,因此否定零假设(零假设是变量之间不具有相关性),认为相关系数不为零,变量之间具有相关性。.试确定-年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关性,。(数据来源:《数据统计与管理》年第期,中国商场统计研究会主办;数据文件:data-.sav)表.-年安徽省国民收入数据表年份国民收入.............:..)存款余额.............(亿元)年份国民收入..(亿元)...........存款余额.............(亿元)实验步骤:第步分析:由于对不同年份的国民收入和存款余额均是定序数据,故考虑二元定序变量的相关性进行分析;第步数据组织:将三个变量分别定义为年份、国民收入、存款余额;第步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations并作如下图所作的设置;运行即可。实验结果及分析::..Kendall相关系数为.>,双尾检验的相伴概率为.<.,应拒绝两变量不相关的原假设,说明两变量具有显著的正相关性;从下半部分可以看出,两变量的Spearman相关系数为.>,同时双尾检测的相伴概率值Sig.=.<.,也说明了两变量呈显著的正相关。。.某高校抽样得到名短跑运动员,测出米的名次和跳高的名次如表.,。(数据来源:《应用统计学:数据统计方法、数据获取与SPSS应用》马庆国,科学出版社;数据文件:data-.sav):第步分析:考虑是百米名次和跳高名次的相关性问题,应用二元变量的相关性进行分析;第步数据组织:将两个变量分成两列,分别定义为百米名次、跳高名次;第步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话BivariateCorrelations,将“百米名次”和“跳高名次”两变量移入variables框中,选择person相关系数;在testofsignificance中选择单尾检验;单击再单击Options按钮,打开BivaiateCorrelations:Option对话框,选择Statistics方框内的两个复选框,如下图::..描述性统计表:上表是对两种名次的描述性结果,百米名次的均值为.,标准差为.;跳高名次的均值为.,标准差为.,;记录数共条。相关分析结果表::..表中可以看出,相关系数为,说明呈正相关,而相伴概率值Sig.=.>.,因此应接受零假设(H:两个变量之间不具相关性),即说明百米名次不受跳高名称的显著性影响。.,请分析销售量与平均价格、广告费用和日照时间之间的关系,并说明此题用偏相关分析是否有实际意义(显著性水平为.)。(数据来源:《SPSSforWindows统计分析(第版)》卢纹岱,电子工业出版社;数据文件:data-.sav)..........广告费用日照时间.........实验步骤:第步分析:这个因素彼此均有影响,分析时应对销售量与另外三个因素分别求偏相关,在销售量与一个因素的相关时控制其他因素的影响,然后比较相关系数,按个因素对太阳镜销售量的影响的大小排序。第步定义变量:月份、销量、价格、广告费用、日照时间。第步按Analyze|Correlate|Partial顺序启动偏相关分析的主对话框,指定分析变量和控制变量,第一次分析变量为销量与价格的偏相关系数,其余为控制变量。在主对话框中使用系统默认的双尾检验,显示实际的显著性概率。实验结果及分析:从上图可以看出,广告费用和价格为控制变量,日照时间和销量关系密切,相关系数为.,双尾检测的相伴概率为.,明显小于显著水平..故应该拒绝零假设,说明太阳镜的销量与日照时间存在显著的相关性。同理可知,销量与广告费用关系密切,与价格不存在显著的相关性。如下图::...个幼仔,现分别对个幼仔的长、体重、四肢总长、头重进行测量,试就这几个测量数据而言,用距离分析法分析个幼仔的相似性,。(数据文件为:data-.sav):第步分析:这是一个求个案间的相关性(相似性)问题。第步按Analyze|Correlate|Distances打开Distance对话框,并选BetweenCases(个案之间)和Similarities(相似性),如图-所示,其它不作任何设置,运行。实验结果及分析::..Pearson相关系数可看出,个幼仔极相似,特别是第个和第个。、原理及在统计中的作用;.掌握用SPSS进行线性回归、曲线回归的方法;.根据线性回归、曲线回归等方法探索其它回归方法。二回归分析的原理自变量与因变量之间呈线性关系时,我们可以构造线性回归方程。根据参与线性回归的自变量个数的多少,可将线性回归分为一元线性回归和多元线性回归。一元线性回归()基本数学原理)回归模型与参数的确定一元线性回归研究因变量与一个自变量之间的关系。其回归模型为:y=a+bx,式中,y为因变量,x为自变量,a,b为待定参数(其中b称为回归系数)。通常采用最小二乘法来确定上面两个待定参数,即要求观测值与利用上面回归模型得到的拟合值的平方和最小。差值平方和达到最小时的模型参数便作为待定参数的最终取值,代入模型,便可以确定回归方程。)线性回归下的统计检验通过样本数据建立一个回归方程后,不能立即就用于对某个实际问题的预测。因为,应用最小二乘法求得的样本回归直线对总体回归直线的近似,这种近似是否合理,必须对其作各种统计检验。多元线性回归:..用多元线性回归进行研究。多元线性回归与一元线性回归一样,进行多元线性回归还是需要进行回归系数的检验,需要估计回归系数的置信区间,需要进行预测与假设检验等方面的讨论。所不同的是,由于多元回归涉及到多个自变量,进行回归时就要考虑各个自变量之间的关系,如它们是否存在共线性的问题。另外,还有异常值和强影响点等问题。多元回归的方法有:Remove(强迫剔除法)、Backward(后向水去法)、Forward(前向逐步法)。,为了冶炼出符合要求强度的钢,常常通过控制钢水中的碳含量来达到目的,因此需要了解y与x之间的关系,,现对x和y进行一元线性回归分析。(数据文件为:data-.sav)..........钢强度....实验步骤:第步按Analyze|Regression|LinearRegression的顺序打开LinearRegression对话框,打开Statistics对话框,选择Confidenceinterval和Estimates运行,如下图:实验结果及分析:引入或剔除变量表:..Enter方法,表示全部进入。模型综述表从这部分结果看出相关系数R=.,判定系数R=.。说明样本回归方程的代表性强。方差分析表方差分析表是对回归方程进行显著性检验的情况。从结果看,相伴概率Sig.<.,说明自变量x与因变量y之间确有线性关系。回归系数表从两系数的相伴概率来看均<.,说明均具有显著性意义,说明回归系数是显著的,则回归方程为:y=.+..,销售量与平均价格、广告费用和日照时间之间的关系作多元线性回归分析。(数据文件:data-.sav):..某公司销售太阳镜的数据月份销量价格..........广告费用日照时间.........实验步骤:第步分析:显然是采用多重线性回归分析方法;第步建立数据文件,变量名为月份、销量、价格、广告费用、日照时间;第步按Analyze|Regression|linear?的顺序打开LinearRegression主对话框,并将销量设为因变量,其余变量设为自变量。将“月份”变量设置为caselabel。如下图:第步单击Statistics按钮,打开LinearRegression:Statistics对话框,并选择Estimates、modelfit、descriptives和Durbin-Watson。如下::..步打开LinearRegression:Plots?框,作如下设置:第步打开LinearRegression:save?框,在save对话框里选择保存未标准预测值、标准预测值、未标准预测值残差、标准预测值残差。第步在options对话框里按默认设置。实验结果及分析:相关系数矩阵表:从表中可以看出自变量的相关系数分别为-.、.、.,单尾检验的显著性概率也很小,说明三个自变量与因变量的关系均较密切。引入或剔除变量表::..由上图数据可知,销量与另外三个变量有很强的线性关系。方差分析表:回归系数表:残差统计表:图形::..:...所示,请对x与y的关系进行曲线估计。(数据来源:《统计学(第二版)》袁卫,高等教育出版社;数据文件:data-.sav)(x).............远视率(y)实验步骤:第步分析:先用散点图的形式进行分析,看究竟是否具有线性相关性;按Graph|LegacyDialogs|Scatter/Dot顺序打开Scatterplot对话框,并选择SimpleScatter,点击Define,并作如下图设置:实验结果及分析::..远视率随着年龄x的提高而逐渐降低,而且年龄达到一定水平后,远视率的减幅变小得不明显。因此用线性回归模型表示x,y的关系是不恰当的。我们也不知道哪种拟合效果更好,于是就应先找拟合效果好的模型。实验步骤:第步现在进行曲线估计。Analyze|Regression|CurveEstimation,将里面的模型全选上,看哪种模型拟合效果更好,如下图。实验结果及分析:从拟合优度(Rsq即R)来看,quadratic和cubic效果较好(因为其Rsq值较大),于是就选quadratic和cubic来进行。重新进行上面的过程,只选以上两种模型。实验步骤:第步重新进行上面的过程,只选以上两种模型。实验结果及分析::..Quadrtic为例,其方程为:y=.-.X+.X拟合结果图:实验心得与体会在这一周的时间里,开始的时候由于初次接触这个软件,觉得学****SPSS是很有乐趣的事,对它充满了热诚。可是后来面对全是英文的软件,一整天下来对着那些繁锁的数据都不懂怎样分析,在不断地把书上的英文翻译和书上的例题看了很多次之后,,再后来经过两三次课的不断摸索,对SPSS便不再感觉那么陌生,按照实验指导书上的提示,可以较轻松地完成实验内容。在上完实验课写实验报告的过程中,我又重新地把每个题目做了一次,发现这软件虽然是英文版的,但是只要我们多练****多去理解每个英文选项的含义,我们在做数据分析的时候就不会有那么多的苦恼。在SPSS学****中,对它的认识由浅入深,循序渐进,实践中遇到的各种问题也逐个攻克,学****这种在日常工作中有价值的分析方法,使我们更能轻易应