文档介绍：该【一二章节绪论】是由【花双韵芝】上传分享，文档一共【17】页，该文档可以免费在线阅读，需要了解更多关于【一二章节绪论】的内容，可以使用淘豆网的站内搜索功能，选择自己适合的文档，以下文字是截取该文章内的部分文字，如需要获得完整电子版，请下载此文档到您的设备，方便您编辑和打印。一二章节、绪论
一二章节、绪论
1/17
一二章节、绪论
一二章、绪论
现代统计学之父:皮尔逊
描述统计与推测统计
描述统计主要研究如何整理、描述数据的特色。
推测统计主要研究如何经过局部数据所供给的信息推论整体特色。
变量种类
定类变量:如,性别、学号、颜色种类、讲课方法。
特色:没有绝对零点,没有丈量单位。变量值之间有“相等”和“不等”的关系,但没有大小之分,不可以比较大小,更不可以进行加、减、乘、除四则运算。
定序变量:程度、等级和水平。如,竞赛名次、质量等级、喜欢程度
特色:既无零点、又无丈量单位。变量的值之间拥有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。
定比变量:除了可以说出名称和排出大小,还可以算出差异大小量的变量。
如温度、测试成绩、智商。
特色:有相等的丈量单位,无绝对零点。考试成绩为零不表示没有一点知识。可进行加减运算,乘除运算则没心义。
定距变量:如身高、重量、学生人数。既有丈量单位,又有绝对零点,可进行计算。
降低偏差:利用随机抽样
降低变异性:用大一点的样本
三、描述统计
一、频数:某一事件在某一种类中出现的次数。
频数分布种类:正态,正(负)偏态,正(反)J形,U形分布。
分布性质;会合(分别)程度,偏度和峰度不一样样。
偏态系数:数据的对称性
峰态系数:数据的峰度
二、会合量数:
包含算术均匀数M、中位数Md、众数M0(用众数代表一组数据,靠谱性较差,
但是,众数不受极端数据的影响,而且求法简单)、加权均匀数MW、几何均匀
数Mg、调停均匀数MH。
组数据中有少量数据偏大或偏小,数据的分布呈偏态时,应用几何均匀数。
算数均匀数的性质(算法必然会):
1)每一个变量加减或乘除一个数此后,均值也相应增添。
2)变量值与均值的离均差之和为零。
3)变量值与均值的离均差平方和为最小值。
三、失散量数:全距R、四分位差Q、均匀差、方差(样本统计量S2,整体参数2)、标准差(s也许SD)、百分位差
全距:所有数据中的最大值与最小值的差,描述了数据分布的范围。
四分位差(Q):样本中间50%的人的全距的一半。是一个距离,Q越大,表示样本中各样品越不整齐.
均匀差:所有数据与均值绝对离均差的均值。
方差:各个数据偏离中心的程度。方差越大,数据颠簸越大。
标准差:方差的算术平方根。
自由度:自由度是指当以样本的统计量来预计整体的参数时,样本中独立或能自由变化的数据的个数。
一二章节、绪论
一二章节、绪论
2/17
一二章节、绪论
标准分数:以标准差为单位表示一个原始分数在集体中所处的相对地点,即原始
分数在均值以上或以下几个标准差的地点。
性质:标准分数的均值为0,标准差为1。没有实质单位。
应用:
1)、比较不一样样性质的观察值在各自数据分布中相对地点的高低。如身高与体重。
2)计算不一样样质的观察值的总和也许均值,以表示在集体中的相对地点。如高考的标准分。
3)做线性变换后,表示标准测试分数。如IQ。
图表
条形图,用于定性数据。
直方图与多边图:用于定量数据
时序图:反响事物变化趋向
饼图:定性数据的多少或构成比率
散点图:两个变量的变化关系和变化方向。
茎叶图:保留小样本连续变量的原貌。
三线表的构成因素包含:表序、表题、项目栏、表体、表注五、随机变量分布
正态分布XN(,2)------------------样本均值的分布
正态分布曲线下的面积:曲线高度是频数(Y),曲线下边积则是积累频数P(也视作随机变量出现的概率)。X轴上的截距为Z。
此中,μ决定曲线的地点,σ决定曲线的“胖瘦”。
无论各分布的均值与标准差的值是多少,x取值以下特定地域的概率(面积)是确立的,即:
一二章节、绪论
一二章节、绪论
3/17
一二章节、绪论
正负一个标准差,占%,两个%,三个%
标准正态分布:均值为0,标准差为1.
整体依照正态分布N~(μ,2)时,来自该整体的所有容量为n的样本的均值
2
X也依照正态分布,X的希望为μ,方差为σ2/n。即X~N(μ,)
n
均匀数的标准误
X
N
标准误衡量了抽样偏差(samplingerror)的大小。所谓抽样偏差是指由抽样引起的样本统计量与整体参数间的差异。
标准误越小,统计量与参数越凑近,样本对整体越有代表性,用统计量推测参数的靠谱度越大,所以,标准误是推测统计靠谱性的重要指标。
卡方分布:变量互相独立,且依照N(0,1)分布的随机变量。称随机变量依照自由
2
2
()
n
度为为n的卡方分布。记做
x
x
,x
2
2
n
xi
i1
卡方分布:样本方差的分布(样本方差的分布)
T分布:随机变量X依照N(0,1),Y依照x2(n),且互相独立,则随机变量依照自
由度为n的t分布,记做tt(n).t
X
.
Y
n
(X)
(X
X)2
来自一个正态整体:t
t(N1),此中,S
1
S
N
N
一二章节、绪论
一二章节、绪论
4/17
一二章节、绪论
来自两个正态整体
一二章节、绪论
一二章节、绪论
5/17
一二章节、绪论
(X1
X2)(12)
N1N2
t(N1
N22),
t
SP
N1
N2
SP为两样本的混杂标准差。
(N11)S12
(N2
1)S22
此中,
SP
N1
N22
T分布的均值为0,方差为n/(n-2).
t统计量是参数预计与假设检验的基础。
特色:当样本容量趋于,t分布为正态分布,方差为1,
随自由度的减少,失散程度(方差)增大,分布中间变低,尾部变高。
F分布:F
S12
F(N11,N21)----------两样本方差的比
S22
统计量主要用于方差剖析、协方差剖析、回归剖析等。
六、参数预计
参数预计:当在研究中从样本获取一组数据后,如何经过这组信息,对整体特色进行预计,也就是如何从局部结果推论整体的情况,称为整体参数预计。整体参数预计问题可以分为点预计与区间预计。
点预计:用某相同本统计量的值来预计相应整体参数的值。
优异的预计量拥有的性质:无偏性、有效性、一致性。
区间预计:按必然概率要求,由样本统计量的值预计整体参数值的所在范围。
原理:抽样分布理论。抽样分布的标准误的大小决定置信区间的长度。
置信区间:指在某一置信度时,整体参数所在的地域长度。
置信度:是作出某种推测时正确的可能性(概率)。平时用(1-a)表示。
明显性水平:即a,是指预计整体参数落在某一区间时可能犯错误的概率。
两个因素:靠谱性(置信水平的高低)和精确度(区间长度)。
一二章节、绪论
一二章节、绪论
6/17
一二章节、绪论
置信水平为95%的置信区间的确切含义:重复抽样N次,所获取的N个置信区间
一二章节、绪论
一二章节、绪论
17/17
一二章节、绪论
中有95%个包含了整体参数。
影响区间预计精确度的因素:
1)置信度(1-a)(反比)
2)样本容量(正比)
3)整体数据的变异程度(反比)
的置信区间:
单整体均值的区间预计:
方差已知,正态分布;Z
X
方差未知,t分布。
N(0,1)
n
两整体均值差其余区间预计:T分布。相关样本与独立样本都为
T分布。
此中,独立样本时用很长很长的那个公式。
整体均值的区间预计:卡方分布N
2
1S2
x2(N1)
七、假设检验
假设检验(明显性检验):开初对整体参数或分布形式作出某种假设,此后利用
样本信息来判断原假设能否建立。
种类:参数检验和非参数检验(包含分布检验和独立性检验)。
假设检验的原理:
(1)逻辑上为反证法(假设检验第一假设虚无假设H0为真,经过否定H0,来检验
备择假设H1的真实性)
(2)统计上为小概率事件(小概率事件在一次实验或观察中,几乎是不可以能发生
的。在一次试验中小概率事件一旦发生,我们就有原由拒绝原假设。小概率由
研究者开初确立,如,,等)。
一二章节、绪论
一二章节、绪论
8/17
一二章节、绪论
假设检验的步骤:
(1)提出原假设和备择假设
x
0
(2)确立合适的检验统计量,检验统计量(方差已知)的基本形式为:z
n
(3)规定明显性水平(或)
(4)计算检验统计量的值
(5)作出统计决策
拒绝域:拒绝原假设的概率。
两类错误:拒真错误型错误;取伪错误
型错误。统计效劳(统计检验力)1
。
两类错误的关系:
(1)
不用然等于1.
2)其余条件不变,二者不可以同时增大也许减小。
3)二者地位不一样样样。我们应尽量防备第一类错误。
4)影响错误的因素有整体标准差(正比)和样本容量(反比)。
单侧检验与两侧检验
单侧检验:重申方向性。
两侧检验:只重申差异,不重申方向性。
单整体均值的假设检验:
方差已知,正态分布;
X
N(0,1)。用这个统计公式,此后查表。
Z
n
方差未知,t分布。t
(X)
(X
X)2
S
t(N1),此中,S
1
N
一二章节、绪论
一二章节、绪论
9/17
一二章节、绪论
N
两整体均值差其余明显性检验:
(1)相关样本,使用t分布统计量
一二章节、绪论
一二章节、绪论
10/17
一二章节、绪论
(2)独立样本,方差已知,使用正态分布统计量;
(X1X2)
(12)
Z
2
2
1
2
N1
N2
(3)独立样本,方差未知,但是齐性,使用
t分布统计量
(X1
X2)(12)
N1N2
t(N1
N2
2),
t
SP
N1
N2
此中,
(N11)S12
(N2
1)S22
SP
N22
N1
整体分布的假设检验(属于非参数检验):卡方检验
设有N个被试,按变量X的取值可以分成k类,第i类有Oi个观察值,则检验统
计量为:x2
k(Oi
Ei)2
x2(K1)
i1
Ei
八、方差剖析
方差剖析的逻辑:把观察值的总变异分解为两个或多个部分,除随机偏差外,其余各部分变异可由某个或某几个因素或它们的交互作用来解说。F分布的统计推测可说明某一或某些因素或因素间交互作用能否对观察值有影响。
单因素方差剖析的逻辑与步骤:
1)模型与假设
2)平方和的分解与F检验
3)关系强度与效应值
4)多重比较
5)前提假设
方差剖析的前提条件:整体依照正态分布;变异可加性;方差齐性;独立性。
单因素完满随机设计的方差剖析:
关系强度与效应值:
一二章节、绪论
一二章节、绪论
11/17
一二章节、绪论