1 / 46
文档名称:

数据的统计分析与描述.ppt

格式:ppt   大小:1,446KB   页数:46页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据的统计分析与描述.ppt

上传人:卓小妹 2022/7/9 文件大小:1.41 MB

下载得到文件列表

数据的统计分析与描述.ppt

相关文档

文档介绍

文档介绍:关于数据的统计分析与描述
第一张,共四十六张,创建于2022年,星期六
目的
2、掌握用数学软件包求解统计问题。
1、直观了解统计基本内容。
第二张,共四十六张,创建于2022年,星期六
*
*
统计的基本概念
十六张,创建于2022年,星期六
3. 未校正平方和(Uncorrected sum of squares)
4. k阶原点矩
其中A1即为均值 。
5. k阶中心矩
第十四张,共四十六张,创建于2022年,星期六
区间估计
1. 点估计和区间估计
参数的估计方法主要有两种:点估计和区间估计。
点估计:用样本的观测值估计总体未知参数的值。
区间估计:在点估计的基础上,给出总体参数的一个范围。
第十五张,共四十六张,创建于2022年,星期六
2. 参数的置信区间和置信水平
置信区间:由样本统计量所构造的总体参数的估计区间。
置信区间是一个随机区间,它依赖与样本。
如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例,称为置信水平。
置信水平为1 – α的含义是随机区间(θ1,θ2)以1 – α的概率包含了参数θ。
置信水平为90% 时α= , 为正态曲线下右侧面积为α/2=。
第十六张,共四十六张,创建于2022年,星期六
3. 正态总体均值和方差的置信区间
正态总体参数的各种置信区间见表5-1。
被估参数
条件
枢轴量及其分布
参数的置信区间
单正态总体
μ
2已知
2未知
2
μ已知
μ未知
第十七张,共四十六张,创建于2022年,星期六
4. 总体比例与比例差的置信区间
实际应用中经常需要对总体比例进行估计,如产品的合格率、大学生的就业率和手机的普及率等。记π和P分别表示总体比例和样本比例,则当样本容量n很大时(一般当nP和n(1 – P)均大于5时,就可以认为样本容量足够大),样本比例P的抽样分布可用正态分布近似。总体比例与比例差的置信区间如表5-2所示。
待估参数
枢轴量及其分布
参数的置信区间
总体比例
π
两总体比例差
π1-π2
其中P1,P2为两个样本比例
第十八张,共四十六张,创建于2022年,星期六
要用到的3个分布:
正态概率分布有以下重要特征:
(1)正态分布是对称分布,对称轴是x=μ。
(2)当x=μ时,正态概率密度最大。
(3)正态分布的图形由μ和σ决定。
(4)当σ为定值时,μ的变化引起正态概率密度曲线在横轴上平行移动。
(5)当μ为定值时,σ的变化将引起正态概率密度曲线的形状变得尖峭或偏平。
第十九张,共四十六张,创建于2022年,星期六
第二十张,共四十六张,创建于2022年,星期六
第二十一张,共四十六张,创建于2022年,星期六
假设检验
1. 假设检验的基本概念和原理
假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。
备择假设:研究者想通过收集证据以支持的假设记为H1
原假设: 研究者想通过收集证据以反对的假设记为H0
a: 当原假设为真时拒绝原假设的概率,为显著性水平。
检验统计量:对原假设和备择假设作出决策的某个样本统计量。
拒绝域:能够拒绝原假设的检验统计量的所有可能值的集合。
第二十二张,共四十六张,创建于2022年,星期六
对总体参数进行假设检验时,首先要给定一个原假设H0,H0是关于总体参数的表述,与此同时存在一个与H0相对立的备择假设H1,H0与H1有且仅有一个成立;经过一次抽样,若发生了小概率事件(),可以依据“小概率事件在一次实验中几乎不可能发生”的理由,怀疑原假设不真,作出拒绝原假设H0,接受H1的决定;反之,若小概率事件没有发生,就没有理由拒绝H0,从而应作出拒绝H1的决定。
第二十三张,共四十六张,创建于2022年,星期六
2. 假设检验的步骤
1) 根据问题确立原假设H0和备选假设H1;
2) 确定一个显著性水平,它是衡量稀有性(小概率事件)的标准,;
3) 选定合适的检验用统计量W(通常在原假设中相等成立时,W的分布是已知的),根据W的分布及的值,确定H0的拒绝域。
4) 由样本观测值计算出统计量W的观测值W0,如果W0落入H0的拒绝域,则拒绝H0;否则,不能拒绝原假设H0。
第二十四张,共四十六张,创建于2022年,星期六
注意:在SAS系统中,是