文档介绍:统计学基础知识统计学基础知识主要内容第一节总体, 样本和随机函数第二节对总体的描述――随机变量的数字特征第三节对样本的描述――样本分布的数字特征第四节随机变量的分布――总体和样本的连接点第五节通过样本, 估计总体(一) ――估计量的特征第六节通过样本, 估计总体(二) ――估计方法第七节通过样本, 估计总体(三) ――假设检验四个基本定义与统计学的逻辑结构总体和个体样本和样本容量随机变量统计量统计学的逻辑结构总体( 集合) 和个体( 构成集合的元素) 研究对象的全体称为总体或母体, 组成总体的每个基本单位称为个体. (1) 按组成总体个体的多寡分为: 有限总体和无限总体; (2) 总体具有同质性: 每个个体具有共同的观察特征,而与其它总体相区别; (3) 度量同一对象得到的数据也构成总体, 数据之间的差异是绝对的, 因为存在不可消除的随机测量误差; (4) 个体表现为某个数值是随机的, 但是, 它们取得某个数值的机会是不同的, 即它们按一定的规律取值,即它们的取值与确定的概率相对应. 样本和样本容量总体中抽出若干个个体组成的集体称为样本. 样本中包含的个体的个数称为样本的容量, 又称为样本的大小. 抽样是按随机原则选取的, 即总体中每个个体有同样的机会被选入样本. 随机变量根据概率不同而取不同数值的变量称为随机变量(Random Variable). 注意: (1) 一个随机变量具有下列特性:RV 可以取许多不同的数值, 取这些数值的概率为 p,p 满足:0<=p<=1. (2) 随机变量以一定的概率取到各种可能值, 按其取值情况随机变量可分为两类: 离散型随机变量和连续型随机变量. 离散型随机变量的取值最多可列多个; 连续型随机变量的取值充满整个数轴或者某个区间. 离散型随机变量与连续型随机变量 10 20 30 40 50 概率概率 xx 离散型随机变量连续型随机变量总体与随机变量的关系表示总体状况的数量特征, 在总体中是参差不齐的, 往往以一定的概率取不同的数值, 显然对于这样的数值我们采用一般的变量是无法加以描述的. 但是. 可以采用一种特殊的变量来表示它们. 这个特殊变量就是随机变量. 因为, 根据随机变量的定义, 随机变量以一定的概率取许多不同的值, 而且概率 p 满足:0<=p<=1. 由于我们主要研究总体的数量特征, 可以直接用随机变量来表示所研究的总体. 总体, 随机变量, 样本间的联系总体就是一个随机变量, 所谓样本就是 n个( 样本容量 n) 相互独立且与总体有相同分布的随机变量 X1, ……, Xn. 每一次具体抽样所得的数据, 就是 n 元随机变量的一个观察值, 记为(X1, ……,Xn). 通过总体的分布可以把总体和样本连接起来. 总体分布是总体和样本的连接点所谓分布, 它是从全局而言的. 通俗地说, 分布就是某个对象在什么地方, 堆积了多少. 任何一个随机变量都有自己的分布, 这个什么地方就是在数轴上取什么值, 堆积多少就是在那里占有的比例是多少或者概率有多大. 总体可以表示为随机变量, 并具有自身的分布. 样本则是相互独立与总体具有相同分布的 n 元随机变量. 因此, 总体分布是总体和样本的连接点. 从而, 可以通过对样本特征的研究达到对总体进行研究的目的. 因为它们具有相同的分布. 统计量设(x1,x2, ……,xn) 为一组样本观察值, 函数 f( x1,x2, ……,xn )若不含有未知参数, 则称为统计量. 统计量一般是连续函数. 由于样本是随机变量, 因而它的函数也是随机变量, 所以, 统计量也是随机变量. 统计量一般用它来提取或压榨由样本带来的总体信息. 样本与总体之间的关系样本是总体的一部分, 是对总体随机抽样后得到的集合. 对观察者而言, 总体是不了解的, 了解的只是样本的具体情况. 我们所要做的就是通过对这些具体样本的情况的研究, 来推知整个总体的情况. …… Xn+1 Xn … X1 样本总体统计学的逻辑结构(1) 总体和样本引入一个随机变量来描述总体(2) 对总体的描述: 随机变量的数字特征(3) 对样本的描述: 样本分布的数字特征(4) 总体与样本的连接点: 随机变量的分布(5) 如何用样本的数字特征估计总体的数字特征及数据生成过程中的各种参数 a 估计量的优良性 b 估计方法 c 对估计量的检验――假设检验 a 估计量的优良性 1, 无偏性 2, 有效性 3, 均方误最小 4, 一致性 b 估计方法矩法最大似然法最小二乘法总体分布未知正态总体一般总体( 大样) 已知方差方差未知一般总体( 大样) 正态总体估计期望单个总体两个总体估计方差( 常用小样本下, 正态总体估计其它参数) 点估计区间估计 c 对估计量的检验――假设检验 1. 对总体分布特征的假设检