文档介绍:知识点总结:(1)基本定义:①总体:在统计中,所有考查对象的全体叫做全体.②个体:在所有考查对象中的每一个考查对象都叫做个体.③样本:从总体中抽取的一部分个体叫做总体的样本.④样本容量:样本中个体的数目叫做样本容量.(2)抽样方法:①简单随机抽样:逐个不放回、等可能性、有限性。=======★适用于总体较少★抽签法:整体编号(1~N)放入不透明的容器中搅拌均匀逐个抽取n次,即可得样本容量为n的样本。随机数表法:整体编号(等位数,如001、111不能是1、111) 从0~9中随机取一行一列然后初方向随机(上、下、左、右)重复,超过范围则忽略不计直至取得以n为样本容量的样本。②系统抽样:,等可能。=======★适用于总体多★用随机方法编号,若N无法被整除,则剔除后再分组,。再用简单随机抽样法来抽取一个个体,设为l,则编号为l,k+l,2k+l……(n-1)k,抽出容量为n的样本。(每组编号相同)。③分层抽样:.=======★适用于由差异明显的几部分构成的总体★总体有几个差异明显的部分构成,经总体分成几个部分,:k=抽样比==:(1)一表二图:①频率分布表——数据详实②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势★注:总体分布的密度曲线与横轴围成的面积为1。(2)茎叶图:①茎叶图适用于数据较少的情况,从中便于看出数据的分布,。②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。(1),就是最高矩形的中点的横坐标。(最多的那个)--忽视其他数据中位数在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。(最中间的,若偶取平均)--对极端值不敏感极差(全距)样本中最大值与最小值的差值平均数频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。--可靠性低在频率分布直方图中,纵轴表示,.=频率,此关系式的变形为=样本容量,也可变形为样本容量×频率=频数。(2)平均数的求法:题目类型有离散型和连续型两种情况PS:加权平均数对一些数据的重要程度作出安排,①算数平均数:②加权平均数:(其中为对应的频率)方差:s2=[(x1-`x)2+(x2-`x)2+…+(xn-`x)2]标准差:s=★注:特别地,对于连续型的随机变量在分好组后,其应该取每一组的组中值近似的表示★注:方差与标准差越小,说明样本数据越稳定。平均数反映数据总体水平;方差与标准差反映数据的稳定水平。①变量之间的两类关系:函数关系(确定性关系)与相关关系(非确定性关系);②制作散点图,判断线性相关关系;︿是估计,如(yi)—是平均,如(yi)yi则是真实值.③线性回归方程:(最小二乘法)注:其中,,称为样本点的中心(回归方程必过此点).残差:ei=yi-yi即真实值-预报值残差平方和相关系数r=相关指数(R2)当r>0时,表明两个变量正相关;R2越大,分母是定值,也可看分子。则残差平方和越小,