1 / 18
文档名称:

matlab中数据的统计描述与分析.docx

格式:docx   大小:61KB   页数:18页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

matlab中数据的统计描述与分析.docx

上传人:565369829 2022/7/19 文件大小:61 KB

下载得到文件列表

matlab中数据的统计描述与分析.docx

文档介绍

文档介绍:第十章数据的统计描述和分析
数理统计研究的对象是受随机因素阻碍的数据, 以下数理统计就简称统计,统计是
以概率论为基础的一门应用学科。
数据样本少那么几个, 多那么成千上万,人们希望能用少数几个包括其最多相关信
息的数值来表现数据样a(:,1:2:9);high=high(:)
weight=data(:,2:2:10);weight=weight(:)
(ii )作频数表及直方图
用hist命令实现,其用法是:
[N,X] = hist(Y,M)
数组(行、列都可) Y的频数表。它将区间[min(Y),max(Y)] 等分为M份(缺省时M设 定为10), N返回M个小区间白频数,X返回M个小区间的中点。
hist(Y,M)
数组Y的直方图。
关于例1的数据,编写程序如下:
load ;
high=data(:,1:2:9);high=high(:);
weight=data(:,2:2:10);weight=weight(:);
[n1,x1]=hist(high)
%不面语句与hist命令等价
%n1=[length(find(high<),…
% length(find(high>=&high<),…
% length(find(high>=&high<),…
% length(find(high>=&high<),…
% length(find(high>=&high<),…
% length(find(high>=&high<),…
% length(find(high>=&high<),…
% length(find(high>=&high<180)),…
% length(find(high>=180&high<),…
% length(find(high>=)]
[n2,x2]=hist(weight)
subplot(1,2,1)
hist(high) subplot(1,2,2) hist(weight)
计算结果略,直方图如以下图所示:
从直方图上能够看出,身高的散布大致呈中间高、两头低的钟形;而体重那么看不 出什么规律。要想从数值上给出更确切的描述,需要进一步研究反映数据特点的所谓“统 计量”。直方图所展现的身高的散布形状可看做正态散布,固然也能够用这组数据对散 布作假设查验。
例2 统计以下五行字符串中字符 a、g、c、t显现的频数
解 把上述五行复制到一个纯文本数据文件中, 放在matlab\work子目录下,编写
如下程序:
clc
fid1=fopen( '' ,'r');
i=1;
while (~feof(fid1))
data=fgetl(fid1);
a=length(find(data==97));
b=length(find(data==99));
c=length(find(data==103));
d=length(find(data==116));
e=length(find(data>=97&data<=122));
f(i,:)=[a b c d e a+b+c+d];
i=i+1;
end
f
he=[sum(f(:,1)) sum(f(:,2)) sum(f(:,3)) sum(f(:,4))
sum(f(:,5)) sum(f(:,6))]
fid2=fopen( " , 'w');
fprintf(fid2, '%8d %8d %8d %8d %8d %8d\n' 力;
fclose(fid1);fclose(fid2);
咱们把统计结果最后写到一个纯文本文件中, 在程序中多引进了几个变量,是为了
查验字符串是不是只包括 a、g、c、t四个字符。
统计量
假设有一个容量为n的样本(即一组数据),记作x (x1,x2, ,xn),需要对它进
行必然的加工,才能提出有效的信息,用作对整体(散布)参数的估量和查验。 统计量 确实是加工出来的、反映样本数量特点的函数,它不含任何未知量。
下面咱们介绍几种经常使用的统计量。
(i )表示位置的统计量一算术平均值和中位数
算术平均值(简称均值)描述数据取值的平均位置,记作 x ,
(1)
_ 1 n
x — xi
n i 1
中位数是将数据由小到大排序后位于中间位置的那个数值。
Matlab中mean(x)返回x的均值,median(x)返回中位数。
(ii )表示变异程度的统计量一标准差、
方差和极差
标准差s概念为
1
(2)
2 x)2
它是各个数据与均值偏离程度的气宇,这种偏离不妨称为变异。
方差是标准差的平方s2。
极差是x (x1 ,x2, ,xn)的最