文档介绍:该【Python数据分析与可视化教案1.2 认识Python 】是由【1660287****】上传分享,文档一共【6】页,该文档可以免费在线阅读,需要了解更多关于【Python数据分析与可视化教案1.2 认识Python 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。课题
课型
讲练
授课班级
大数据
授课时数
1
教学目标
了解Python语言的特点
了解Python常用库的名称及作用
教学重点
教学难点
学情分析
学生之前一般都是上过Pyhon课,但是不一定学过Python中的一些第三方库,比方Pandas、Numpy等,但是这些库在数据分析中很重要。
教学效果
本次课是Python的导入课,通过本次课的学习,能够对于Python的各种库有一个基本了解。
苏州工业职业技术学院SuzhouInstituteOfIndustriaITechnology
教师备课首页
教后记
第1页
一、Python的开展趋势
Python是一种跨平台的计算机程序设计语言,是由GuidovanRossum在八十年代末和九十年代初,在荷兰国家数学和计算机科学研究所设计出来的。自从20世纪90年代初Python语言诞生至今,已被逐渐被广泛应用于系统管理任务处理。自从2004年以后,Python的使用率呈线性增长。目前,Python已经成为最受欢迎的程序设计语言之一。Python2于2000年10月16日发布,,不完全兼容Python2。
二、Python的特点
.易于学习
Python有相对较少的关键字,结构也比拟简单,与其他程序语言相比,学习起来更加简单,比方在Python变量不需要声明可以直接使用,再比方一些第三方库集成了很多计算功能,大大简化编程的难度。
,易于阅读
Python代码定义清晰,比方语句的组织依赖于缩进而不是用符号标记,如循环结构的“开始/结束”可直接用缩进而不需要使用其他的符号。
.开发效率高
Python是一种面向对象的解释型计算机程序设计语言,具有丰富和强大的库。高级数据结构可以在一个单独的语言中表达出很复杂的操作,比方调用第三方库中的很多方法,就可以防止写很多循环。
.可移植性强
基于其开放源代码的特性,Python已经被移植(也就是使其工作)到许多平台。
三、Python的常用库
.numpy
NumPy是NumericalPython的简称,是Python语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy的前身Numeric最早是由JimHugunin与其它协作者共同开发,2005年,TravisOliphant在Numeric中结合了另一个同性质的程序库Numarray的特色,并加入了其它扩展而开发了NumPyo
NumPy支持高级大量的维度数组与矩阵运算,底层是C语言实现的,由于针对数组运算提供大量的数学函数库,计算速度比拟快,运算效率极好,是机器学习框架的基础类库。
SciPy是构建在numpy基础之上的数据计算库,它提供了许多的操作numpy的数组的函数。SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包,它包括了统计、优化、整合以及线性代数模块、傅里叶变换、信号和图像图例,常微分方差的求解等。
Scipy的子模块包括:
模块名
功能简介
向里里化
数学常量
快速傅里叶变换
积分
插值
数据输入输出
线性代数
空间数据结构和算法
特殊数学函数
统计函数
.pandas
表格容器pandas是基于NumPy的一种工具,该工具是为了解决数据分析任务而创立的。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量快速便捷地处理数据的函数和方法,使得Python成为强大而高效的数据分析环境的重要因素之一。
pandas使用一个二维的数据结构DataFrame来表示表格式的数据,同时使用NaN来表示缺失的数据,而不用像Numpy需要手工处理缺失的数据,并且pandas使用轴标签来表示行和列。同时,pandas可以对数据进行导入、清洗、处理、统计和输出,所以pandas库就是一个数据分析库。
.matpoltlib
Matplotlib是Python在绘制2D图形领域中使用最广泛的套件,它能让使用者很轻松地将数据图形化,并且提供多样化的输出格式。通过Matplotlib,用户可以仅需要几行代码,便可以生成绘图。一般可绘制折线图、散点图、柱状图、饼图、直方图、子图等等。Matplot使用Numpy进行数组运算,并调用一系列其他的Python库来实现硬件交互。
,该模块为matplotlib提供的一套和MATLAB类似的绘图API,以方便快速绘图。将众多绘图对象所构成的复杂结构隐藏在这套API内部。我们只需要调用pyplot模块所提供的函数就可以实现快速绘图以及设置图表的各种细节。,其内部实际保存了当前图表以及当前子图等信息。
.Seaborn
Seaborn是一种基于matplotlib的图形可视化Pythonlibratyo它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。
Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。同时它能高度兼容numpy与pandas数据结构以及scipy与statsmodels等统计模式。掌握seaborn能很大程度帮助我们更高效的观察数据与图表,并且更加深入了解它们。
Seaborn主要包括如下特点:
(1)基于matplotlibaesthetics绘图风格,增加了一些绘图模式(2)增加调色板功能,利用色彩丰富的图像揭示您数据中的模式
(3)运用数据子集绘制与比拟单变量和双变量分布的功能(4)灵活运用处理时间序列数据
(5)利用网格建立复杂图像集
-leam
skiearn是Scipy的扩展,建立在Numpy和matplolib库的基础上。利用这几大模块的优势,可以大大地提高机器学习的效率。scikit-learn简称sklearn,支持包括分类,回归,降维和聚类四大机器学习算法。还包括了特征提取,数据处理和模型评估者三大模块。sklearn拥有着完善的文档,上手容易,具有着丰富的API,skleam已经封装了大量的机器学习算法。同时sklearn内置了大量数据集,节省了获取和整理数据集的时间。
感谢您的支持与使用如果内容侵权请联系删除
仅供教学交流使用