1 / 5
文档名称:

用python进行数据分析.docx

格式:docx   大小:81KB   页数:5页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

用python进行数据分析.docx

上传人:guoxiachuanyue014 2022/6/4 文件大小:81 KB

下载得到文件列表

用python进行数据分析.docx

文档介绍

文档介绍:用python进行数据分析
一、样本集
本样本集来源于某高中某班78位同学的一次月考的语文成绩。因为每位同学的成绩都
是独立的随机变量,遂可以保证得到的观测值也是独立且随机的
样本如下:
grades=[131,131,127,:花密雷
liyi='center'};
fig={fig5i2e=(9r6});
plt,bar{miihj'dtes,width=,facet□!or='lightskyblue'I'edgecolor='white'jaforxryinziplmidsd「日IzesJ:
(x++D.%i'"*y,ha='center1Fva='bottom1):±(x4--?%xrha=center',va=:'”[也出出,乩比比靳0]m目「破「=n;
pit,title!'frequencydistributionlinehistogran']j
&l(d"points"Ffontproperties='SinkHel'』size='15');^(d"frequency"rfontproperties-1SiinHei1xsLz15'};
(midsrrates);
运行程序可得到如下折线图:
A*・nCJcp」
2
2
通过折线图我们可以更加清楚的明白这个班级的成绩分布,高于一百分的同学占绝大多数而低于一百分的也占有一定的比例。

中位数:113
上四分位数:Q1=124
下四分位数:Q2=105
四分位数差:IQR=19
此时可以绘制该班的箱须图进行成绩分析,这里使用Matplotlib中的boxplot绘制关于身高的箱形图,程序如下:
21令绘树篷恶图
defdrauBox(heights):
井闵建篷旳图
赵第一个爲数为卷掘卷哉左星馥据
并篦—十卷数为轴射丈字说砥
([heights],labels=[1heights1]}
(1PointsOfMaleStudents1)pyplot・5how(}
29
3QdrawBax(grades)
运行程序后可以得到该班关于成绩的箱须图:
]龍PointsOfM^IaStudents
110
120
110
iao
=1=
+
-
w
TO
60Heights
从该箱须图也可以清楚的看出本班的成绩分布,以及中位数所在的位置所在。由于箱须图的主要目的用来比较,而这里只有一组数据,就不进行比较了。但是仍要注意的是在下边缘以外的异常值点,这些同学的成绩在本班处于垫底,应格外注意这些同学的学习习惯,积极引导和教育。
。经验累积分布函数利用样本来估计和推断总体的分布函数F(x).
这里主要利用我利用python的Matplotlib编写了drawCumulativeHist函数进行经验累积分布图的绘制,程序如下:
defdrawCjmulativeHist(heigh1s)