1 / 31
文档名称:

大数据挖掘与机器学习.doc

格式:doc   大小:3,480KB   页数:31页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据挖掘与机器学习.doc

上传人:beny00001 2019/7/22 文件大小:3.40 MB

下载得到文件列表

大数据挖掘与机器学习.doc

文档介绍

文档介绍:数据挖掘与机器学****什么是数据挖掘数据挖掘的实际工作是对大规模数据进行自动或半自动的分析,以提取过去未知的有价值的潜在信息特点:数据挖掘需要用到大部分机器学****方法有了机器学****之后,可以在金融、教育、医疗、城市、电商等等各个领域更好的进行挖掘图像识别等领域数据挖掘的流程CONDA环境安装conda:datasciencepackage&environmentmanager创建环境: condacreate--namepython3python=3切换环境: windows:activatepython3 linux/macos:sourceactivatepython3官方地址:https://nload/国外网络不好,可以指定国内镜像。工具介绍jupyternotebookjupyternotebook:一款编程/文档/笔记/展示软件启动命令:jupyternotebook安装:condainstalljupyterjupyternotebook简单操作演示matplotlib数据可视化工具1、什么是matplotlib2、matplotlib架构3、matplotlib画图演示4、matplotlib的散点图、直方图、柱状图5、matplotlib案例演示6、,、更具说服力可视化是在整个数据挖掘的关键辅助工具,可以清晰的理解数据,从而调整我们的分析方法。什么是matplotlibmatplotlib是专门用于开发2D图表(包括3D图表)的使用起来及其简单以渐进、交互式方式实现数据可视化安装:condainstallmatplotlibmatplotlib架构matplotlib的整体架构由位于三个不同层级的三层组成。各层之间单向通信,即每一层只能与下一层通信。Backend层matplotlibAPI即位于该层,这些API用来在底层实现图形元素的一个个类FigureCanvas对象实现了绘图区域这一概念Renderer对象在FigureCanvas上绘图Artist层图形中所有能看到的元素都属于Artist对象,即标题、轴标签、刻度等组成图形的所有元素都是Artist对象的实例Figure:对应整个图表示Axes:每个Axes对象只属于一个Figure对象,由两个ArtistAxis对象组成Axis:定义数值范围等Scripting层主要用于数据分析和可视化pyplot操作或者改动Figure对象,例如创建Figure对象大部分工作是处理样本文件的图形与坐标的生成matplotlib基本要点API介绍:(x,y)#()更多的效果设置图片大小(想要一个高清无码大图)保存到本地调整x或者y的刻度的间距描述信息,比如x轴和y轴表示什么,这个图表示什么线条的样式(比如颜色,透明度等)标记出特殊的点(比如告诉别人最高点和最低点在哪里)给图片添加一个水印(防伪,防止盗用)(figsize=(),dpi=)figsize:指定图的长宽dpi:("")调整X或者Y轴上的刻度那么问题来了:如果列表a表示10点到12点的每一分钟的气温,如何绘制折线图观察每分钟气温的变化情况?a=[(20,35)foriinrange(120)]注意:可以设置刻度上显示的中文字体及字体大小My_font=(fname=””,size=”larger”)