1 / 24
文档名称:

沈阳建筑大学统计学实验报告超级完整版.pdf

格式:pdf   大小:1,420KB   页数:24页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

沈阳建筑大学统计学实验报告超级完整版.pdf

上传人:mama 2023/3/13 文件大小:1.39 MB

下载得到文件列表

沈阳建筑大学统计学实验报告超级完整版.pdf

相关文档

文档介绍

文档介绍:该【沈阳建筑大学统计学实验报告超级完整版 】是由【mama】上传分享,文档一共【24】页,该文档可以免费在线阅读,需要了解更多关于【沈阳建筑大学统计学实验报告超级完整版 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:.
学号:
实验报告
课程名称:统计学学年、学期:2014年秋季
实验学时:16实验项目数:四
实验人姓名:专业班级:
实验一:统计软件Spss、Excel介绍;数据的图表展示
实验日期:2014年11月20日第十三教学周
主要实验内容
统计软件Spss、Excel的应用介绍;利用软件进行统计数据的整理和绘制各种
统计图表。作业:、
实验操作记录:
(1)用Excel绘制频数分布表:选择【插入】菜单中的【数据***表或数据***图】
(2)用Excel绘制条形图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【条形图】
(3)用Excel绘制帕累托图:绘制好条形图,然后将条形图中的数据按升序或降序顺序重新排列
(4)用Spass绘制饼图:【Graphs】—>【Interactive-Pie-Clustered】,第2步将某个分类变量选入【Slice】
点击【Pies】
(1)用Excel生成定量数据的频数分布表:【数据】——>【数据分析】——>【直方图】,选择【图
表输出】单击【确定】
(2)用Excel绘制直方图:输入输出区域,然后选择【数据】——>【数据分析】——>【直方图】
(3)用Spass绘制茎叶图:【Analyze】——>【Descriptivestatistics-Explore】第2步:将变量选入
【Variables】
(1)用Excel绘制环形图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【环形图】再
选【环形图】
(2)用Excel绘制雷达图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【其他图表】
再选【雷达图】
用Excel绘制箱线图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【其他图表】再选
【箱线图】
实验总结:通过此次试验,加深了我对Excel和Spass操作软件的应用了解,同时能更好
的把实践与理论相结合。首先进行的就是对统计数据的输入与分析。这个输入过程,既要
细心也要用心。画图时,不仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的
要求,合理而正确的分配输入数据。:.
教师评语:
出勤和课堂
项目预****实验过程作业报告书写其他
纪律
本次实
得分
验成绩
成绩合计:
教师签字:批改日期:
为评价家电行业售后服务的质量,随机抽取由100个家庭构成的一个样本。质
量服务的等级分别表示为:;;;;。调查结果
如下:(数据略)
(1)制作一张频数分布表。
家电行业售后服务质量评价等级频数表
评价等级频数频率
A1414%
B2121%
C3232%
D1818%
E1515%
总计1001
(2)制作一张条形图,反映评价等级的分布。
(3)绘制评价等级的帕累托图。
(4)制作一张饼图,反映评价等级的构成。
为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测
试,所得数据如下:(数据略)
(1)以组距为10进行分组,整理成频数分布表。
灯泡使用寿命频数分布表:.
按销售额分组(万元)频数频率
650-
660-
670-
680-
690-
700-
710-
720-
730-
740-

答:从直方图可以直观地看出,灯泡使用寿命的分布基本上是对称的,右边的
尾部稍长一些,灯泡使用寿命接近正态分布。
(3)制作茎叶图,并与直方图作比较。
使用寿命Stem-and-LeafPlot
FrequencyStem&Leaf
(=<651)


















(>=749)
Stemwidth:10
Eachleaf:1case(s):.
答:比较直方图与茎叶图:直方图的数据分布很方便,但原始数据看不到了,
茎叶图则不同,不仅可以看出数据的分布,还能保留原始数据的信息。
甲、乙两班有40名学生,期末统计学考试成绩的分布如下:
(1)画出两个班考试成绩的环形图,比较它们的构成。
(2)画出雷达图,比较两个班考试成绩的分布是否相似。
答:从图中可以看出甲、乙两班的成绩分布不相似,没有相似性。
下表是我国10个城市2006年各月份的气温(°C)数据:(数据略)
绘制各城市月气温的箱线图,并比较各城市气温分布的特点
答:从箱线图可看出,这10个城市的月气温存在较大差异,离散程度高的城市
为沈阳、北京、郑州、武汉;离散程度低的为海口、昆明、广州。月气温较高
的城市主要为中位数较大的海口、广州,月气温较低的为城市中位数较小的沈
阳;月气温分布较对称的城市主要有北京、沈阳;月气温分布不对称的城市主
要有:海口;月气温存在极值的城市有沈阳、北京、重庆。
实验二:用统计量描述数据;概率分布;参数估计
实验日期:2014年11月27日第十四教学周
主要实验内容
利用Spss、Excel软件对数据进行概括性度量、计算概率分布的概率及概率值,
进行参数估计。作业:、、:.
实验操作记录:
:【工具】——>【数据分析】——>【描述统计】——>【确
定】——>【输入区域】——>【输出选项】——>【汇总统计】
:第1步:【Analyze】——>【DescrictiveStatistics】——>【P-P
Plot】或【Q-QPlot】
:第1步:选择【Analyze】然后选择【Descriptive
statistics-Explore】选项进入主对话框
:【Analyze】——>【CompareMeans—Paired-
SamplesTTest】将两个样本同时选入【PairedVariables】
实验总结:实验二主要是对描述统计量的计算,像众数,中位数,标准误差,方差,峰度,偏度,
置信度等等。通过这次试验,我进一步熟悉了这些描述统计量的计算公式,懂得了该怎么算这些描述统
计量,此外,我还掌握了一些数据统计方面的技能:利用EXCEL进行数据处理、描述性统计及区间估
计。在具体的操作过程中,我感受到,合理并充分利用EXCEL对我们进行数据统计具有很大的作用,
能够使我们更加直观地看到数据,一目了然。
教师评语:
出勤和实验
本次实项目预****实验过程练****题报告书写其他
纪律
验成得分
绩成绩合计:
教师签字:批改日期:
一种产品需要人工组装,现有3种可供选择的组装方法。为检验哪种方法更好,
随机抽取15个工人,让他们分别用3种方法组装。
列1列2列3
平均16平均平均
标准误差标准误差标准误差
中位数165中位数129中位数126
众数164众数128众数126:.
一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心
测试,得到自信心测试分数如下:(数据略)
构建两种方法平均自信心得分之差μd=μ1-μ2的95%的置信区间。
PairedSamplesStatistics

Pair1方法110
方法2010
PairedSamplesCorrelations
NCorrelationSig.
Pair1方法1&
PairedSamplesTest
PairedDifferences
95%ConfidenceIntervalof
theDifference
.
MeanDeviationMeanLowerUppertdf(2-tailed)
Pair1方法1-
法2
答:从表中可以看出两种方法平均自信心得分之差μd=μ1-μ2的95%的置信
区间为(,)
实验三:假设检验;分类变量的推断;方差分析与实验设计
实验日期:2014年12月4日第十五教学周
主要实验内容
利用Spss、Excel软件对数据进行假设检验、分类变量的推断、方差分析与实
验设计。作业:、:.
实验操作记录:
(1)1)用Excelt-检验:双样本等方差假设:第1步:将原始数据输入到Excel工作表格中,选【工
具】——>【数据分析】——>【t-检验:双样本等方差假设】
2)用Excelt-检验:双样本异方差假设:第1步:将原始数据输入到Excel工作表格中,选【工
具】——>【数据分析】——>【t-检验:双样本异方差假设】
(2)用Excelt-检验:F-检验双样本方差:第1步::【工具】——>【数据分析】——>【F-检验双
样本方差】
Spass—期望频数不等拟合优度:先指定“频数”变量,【Analyze】→【NonparametricTest】→【ChiSquare】
将频数变量选入【TestVariableList】
:将列联表中的数据转换为原始数据形式,【Analyze】→【Descriptive
Statistics-Crosstabs】,行变量【Row(s)】,列选入【Column(s)】
Excel单因素方差分析:选择“工具”下拉菜单,【数据分析】,然后选择【单因素方差分析】选择【确
定】,出现对话框
Excel:可重复双因子分析:选择“工具”下拉菜单,并选择【数据分析】选项,在分析工具中选择【方
差分析:可重复双因子分析】
Spass:可重复双因子分析:选择【Analyze】,并选择【GeneralLinearModel-Univaiate】进入主对
话框。
实验总结:实验三是对正态整体的均值,比例和方差进行假设检验,在实验过程中,许
多地方让我卡住了,后来通过与老师的交流得知了正确的方法,这才知道是课本知识掌握
的不够好。除此之外,实验三还进行了方差分析,这与之前的实验比较相似,都是用到数
据分析这个工具,主要的工作量集中在数据的输入和数据的分析方面,比较难的就是就是
在根据输入的数据作出数据表,然后要进行数据分析。
教师评语:
出勤和实验
项目预****实验过程练****题报告书写其他
纪律
本次实
得分
验成绩
成绩合计:
教师签字:批改日期:
为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者选择了
面积、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数
据如下:(数据略)去显著性水平α=,检验:
(1)新肥料获得的平均产量是否显著地高于旧肥料?假设条件为:
1)两种肥料产量的方差未知但相等,即σ1²=σ2²。:.
2)两种肥料产量的方差未知且不相等,即σ1²≠σ2²。
解:(1)设μ1=新肥料,μ2=旧肥料。H0:μ1-μ2≥0;H1:μ1-μ2<0。
t-检验:双样本等方差假设
变量1变量2
平均
方差
观测值2020
合并方差
假设平均差0
df38
tStat
P(T<=t)单尾
t单尾临界
P(T<=t)双尾
t双尾临界
1),拒绝原假设,新肥料获得的平均产量显著地高于旧肥料。
t-检验:双样本异方差假设
变量1变量2
平均
方差
观测值2020
假设平均差0
df37
tStat
P(T<=t)单尾
t单尾临界
P(T<=t)双尾
t双尾临界
2)P=,拒绝原假设,新肥料获得的平均产量显著地高于旧肥料
F-检验双样本方差分析
变量1变量2
平均
方差:.
观测值2020
df1919
F
P(F<=f)单尾
F单尾临界
(2)提出假设:H0:σ1²/σ2²=1;H1:σ1²/σ2²=1
由于P=>,不拒绝原假设,没有证据表明两种肥料的方差有显
著差异。

一家电视台为了解观众对某档娱乐节目的喜欢程度,对不同年龄段的男
女观众进行了调查。
男性
ObservedNExpectedNResidual
55
66
1212
1616
2525
Total64
TestStatistics
男性
Chi-Squarea
df4
..000
(.0%).
解:提出假设:H0:男性观众喜欢该档娱乐节目的比例和女性一致;H1:男
性观众喜欢该档娱乐节目的比例和女性不一致
由于P=>,不拒绝原假设,表明男性观众喜欢该档娱乐节目的比例和
女性一致。
为分析不同地区的消费者与所购买的汽车价格是否有关,一家汽车企业的销售:.
部门对东部地区、中部地区和西部地区的四百个消费者做抽样调查,检查地区
与所购买的汽车价格是否有关。
CaseProcessingSummary
Cases
ValidMissingTotal
NPercentNPercentNPercent
汽车价格*%%%
.(2-sided)
PearsonChi-

NofValidCases400
(.0%).
汽车价格*地区Crosstabulation
地区
东部地区西部地区中部地区Total
汽车价格10—20万元Count505060160
ExpectedCount
10万元以下Count204040100
ExpectedCount
20—30万元Count30202070
ExpectedCount
30万元以上Count40102070
ExpectedCount
TotalCount140120140400
ExpectedCount
解:提出假设:H0:地区与所购买的汽车价格独立;H1:地区与所购买的汽
车价格不独立
由于P值接近于0,拒绝原假设,表明地区与所购买的汽车价格不独立。
某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意
供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验:.
得其寿命(单位:h)数据如下。试分析三个企业生产的电池的平均寿命之间
有无显著差异(α)。如果有差异,试用多重比较检验哪些企业之间有差异?
解:单因素方差分析:提出假设:
H0:α1=α2=α3;H1:α1,α2,α3不全为0
SUMMARY
组观测数求和平均方差
列15222
列251503010
列35213
方差分析
差异源SSdfMSFP-valueFcrit
组间2
组内12
总计83214
由于F=>(2,12)=,因此拒绝原假设H0,即三个企业生产的电池的平
均寿命之间有显著差异。
多重比较检验:
一:提出假设:
检验1:H0:α1=α2H1:α1≠α2
检验2:H0:α1=α3H1:α1≠α3
检验3:H0:α2=α3H1:α2≠α3
二:计算检验的统计量:
|y1-y2|=|y1-y3|=|y2-y3|=
三:计算LSD
四:做出决策:.
|y1-y2|,拒绝H0,A企业和B企业的电池的平均寿命之间有显著差异
|y1-y3|=<,不拒绝H0,A企业和C企业的电池的平均寿命之间没有
显著差异
|y2-y3|拒绝H0,B企业和C企业的电池的平均寿命之间有显著差异。
城市道路交通管理部门为研究不同的路段和不同的时段对行车时间的影响,让
一名交通警察分别在3个路段的高峰期与非高峰期亲自驾车进行试验,通过
试验共获得30个行车时间的数据单位:分。试分析路段、时段以及路段和时
段的交互作用对行车时间的影响α。
Exel:
方差分析:可重复双因素分析
SUMMARY路段1路段2路段3总计
高峰期
观测数55515
求和
平均
方差
非高峰期
观测数55515
求和150121
平均30
方差
总计
观测数101010
求和
平均
方差
方差分析
差异源SSdfMSFP-valueFcrit
行9
列2
误差18
:.
总计29
解:H0:无影响H1:有影响

P=-08<α,表明路段对行车时间的影响显著。

P=-08<α,表明时段以对行车时间的影响显著。
F=<Fcrit=,表明路段和时段的交互作用对行车时间的影响显
著。
Spass:
Between-SubjectsFactors
N
时段非高峰期15
高峰期15
路段路段110
路段210
路段310
TestsofBetween-SubjectsEffects
DependentVariable:行车时间
SourceTypeIIISumofSquaresdfMeanSquareFSig.




Error26
Total30
CorrectedTotal29
=.827(AdjustedRSquared=.806)
实验四:一元线性回归;多元线性回归;时间序列预测及对实际数据进行分
析:.
Between-SubjectsFactors
N
时段非高峰期15
高峰期15
路段路段110
路段210
实验日期:2014年11月11第十六教学周

主要实验内容
利用Spss、Excel软件进行一元线性回归、多元线性回归、时间序列预测及对
实际数据进行综合分析。
实验操作记录:
:选择【Analyze】【Correlate-Bivariate】,将两个变量(本例为销售收入和广告费用)
分别选入【Variables】,点击【OK】。
:选择【工具】下拉菜单,并选择【数据分析】选项在分析工具中选择【回归】,选择
【确定】。
:选择【工具】→数据分析。在分析工具中选择【移动平均】,单击确定。
:选择【Analyze-Forecasting】【Createmodels】,进入主对话框,将预测变量选入
【DependentVariables】。在【Method】下选择【ExponentialSmoothing】,点击【Criteria】,
在【ModelType】下选择【Simple】(进行简单指数平滑预测),点击【Continue】返回主
对话框。
实验总结:通过本次实验,我不仅仅是掌握操作步骤完成了实验任务,更重要的是在实
验中验证自己的所学知识的掌握和运用。统计学的学****就是对数据的学****而通过实验可
以加强我们对统计数据的认知和运用,更好的学****统计学的知识。经过了几节课的实验,
我发现做实验有许多需要注意的地方,尤其输入数据时不能出错,只有掌握了这些技巧才
能让实验结果变的更加准确和方便。
教师评语::.
Between-SubjectsFactors
N
时段非高峰期15
高峰期15
路段路段110
路段210

练出勤和

项目预********报告书写实验纪其他

题律
本次实验成程
得分

成绩

计:
教师签字:批改日期:
下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计
数据:(数据略)
(1)绘制散点图,计算相关系数,说明二者之间的关系。
(2)以人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估
计的回归方程,并解释回归系数的实际意义。
(3)计算判定系数和估计标准误差,并解释其意义。
(4)检验回归方程线性关系的显著性。(ɑ=)
(5)如果某地区的人均GDP为5000元,预测其人均消费水平。
(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测
区间。
ModelSummaryb


:(Constant),人均GDP(元):.
ModelSummaryb


:(Constant),人均GDP(元)
:人均消费水平(元)
ANOVAb
ModelSumofSquaresdfMeanSquareFSig.

Residual5
Total6
:(Constant),人均GDP(元)
:人均消费水平(元)
Coefficientsa
Standardized
UnstandardizedCoefficientsCoefficients
.
1(Constant).003
人均GDP(元).
:人均消费水平(元)
ResidualsStatisticsa

PredictedValue7

StandardErrorofPredictedValue7
AdjustedPredictedValue7



DeletedResidual7


Cook'
:.
ModelSummaryb


:(Constant),人均GDP(元)
:人均消费水平(元)
(1)由excel的CORREL函数计算相关系数=,说明人均GDP和人
均消费水平高度相关。
(2)ˆβ1=,ˆβ
回归系数的含义:人均GDP每增加1元,。
(3)判定系数R²
意义:%。
(4)设H0:β1=0,人均消费水平与人均GDP之间的线性关系不显著。
F=,Fɑ=,F>Fɑ,拒绝原假设,即线性关系显著。
(5)y=+×5000=(元)
(6)置信区间为(,)
随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数金子那
个调查,所得数据如下:(数据略)
(1)用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,
并解释其意义。
(2)检验回归系数的显著性。(ɑ=)
(3)如果航班的正点率为80%,估计顾客的投诉次数。
ModelSummaryb


:(Constant),航班正点率(%):.
ModelSummaryb


:(Constant),航班正点率(%)
:投诉次数(次)
ANOVAb
ModelSumofSquaresdfMeanSquareFSig.

Residual8
Total9
:(Constant),航班正点率(%)
:投诉次数(次)
Coefficientsa
Standardized
UnstandardizedCoef