1 / 65
文档名称:

数据统计分析.ppt

格式:ppt   页数:65页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据统计分析.ppt

上传人:xxj16588 2016/7/9 文件大小:0 KB

下载得到文件列表

数据统计分析.ppt

文档介绍

文档介绍:数据统计分析数据统计分析初级统计及回归分析初级统计及回归分析顾世梁 生物统计是关于试验的设计、实施,数据的收集、整理、分析和结果推论的科学。从事试验研究,需要对处理(措施、技术)的效应给出一个明确的结论(显著与否)。推论是先对研究对象的总体提出一种假设(hypothesis) ,再对该假设进行测验(test) —以计算在假设总体中抽得实际样本(统计数)的概率来判断。 二项总体分布(0, 1 分布) 若一个总体由 0,1两种元素组成, 这样的总体称 0,1总体。若取 1的概率为 p,记为 P(1)=p ,则 P(0)=1-p=q , p+q=1. 1 几种常见的分布概率计算比较复杂,生物统计中所用的概率计算主要利用变数分布进行。 2 (1 ) p p pq ?? ?? p??(1 ) p p pq ?? ?? 二项分布(binomial distribution) 二项分布是指在μ=p 的二项总体中,以样本容量 n进行抽样,样本总和数 k (0≤k≤ n)) 的概率分布。 2 npq ?? n p ?? npq ??( ) k k n k n P k C p q ??2/ pq n ??p??/ pq n ?? 普松分布(poisson distribution) 若n很大, p很小,其 np=m ,二项概率分布趋于普松分布。( )! kmm P k e k ??2m?? m??m?? 正态分布(normal distribution) 若p接近 ,n很大,二项概率分布趋于正态分布。 22 2 1 ( ) ( ) exp( ) 22 x f x ?????? ? 2 2 ? ??? ??? ?? 21 ( ) exp( ) 22 x f x ?? ? 21 ? ?? ? 0??正态分布是最重要的连续性变数的分布,原因有 3: 1、试验研究中很多变数(性状)服从正态分布; 2、一些间断性变数在一定条件下趋于正态分布; 3、一些变数本身不服从正态,但其统计数(如平均数)在一定条件下(样本容量增大时)趋于正态分布。这第 3点是一个很重要的性质,因为我们将来对处理效应的推断,往往是以平均数(或其它统计数)进行的。在对样本容量较大的统计数进行统计推断时,可不必考虑原变数服从何种分布,统计假设测验均可在正态分布的基础上进行。了解一个变数(或一个统计数)服从某种分布,其目标是为了计算该变数(统计数)落在某一区间的概率。 P(a ≤x≤ b)=? ?( ) ? P a b ?? ?? 学生氏 t 分布( t distribution) ( ) ( ) , x x x u u ? ?? ?? ?? ?标准正态离差服从正态分布。~ (0,1) u N 上述 u分布在实际应用中存在问题,最主要的是无法得到σ,人们自然想到用样本标准差 s 代替σ计算 u值,进而计算概率(假设测验)。但经抽样试验发现, 这种替代是有问题的,尤其是在小样本情况下, s 的变异度较大(而σ是常量)。它直接的效果是由此算出的值比 u 的变异度大。后经 WS Gosset (1908) 导出了该统计数( t)的概率密度函数 f(t) 。 1221 ( ) 2 ( ) (1 ) ( / 2) t f t ????? ?????? ?? 10 ( ) x x e dx ???? ?? ??