1 / 44
文档名称:

python数据分析过程示例.docx

格式:docx   大小:696KB   页数:44页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

python数据分析过程示例.docx

上传人:63229029 2017/4/14 文件大小:696 KB

下载得到文件列表

python数据分析过程示例.docx

文档介绍

文档介绍:引言几年后发生了。在使用 SAS 工作超过 5 年后, 我决定走出自己的舒适区。作为一个数据科学家, 我寻找其他有用的工具的旅程开始了! 幸运的是,没过多久我就决定, Python 作为我的开胃菜。我总是有一个编写代码的倾向。这次我做的是我真正喜欢的。代码。原来,写代码是如此容易! 我一周内学会了 Python 基础。并且,从那时起,我不仅深度探索了这门语言,而且也帮助了许多人学习这门语言。 Python 是一种通用语言。但是, 多年来, 具有强大的社区支持, 这一语言已经有了专门的数据分析和预测模型库。由于 Python 缺乏数据科学的资源,我决定写这篇教程来帮助别人更快地学习 Python 。在本教程中, 我们将讲授一点关于如何使用 Pytho n 进行数据分析的信息,咀嚼它,直到我们觉得舒适并可以自己去实践。目录 1. 数据分析的 Python 基础 o 为什么学 Python 用来数据分析 o Python v/s o 怎样安装 Python o在 Python 上运行一些简单程序 2. Python 的库和数据结构 o Python 的数据结构 o Python 的迭代和条件结构 o Python 库 Python 中使用 Pandas 进行探索性分析 o 序列和数据框的简介 o 分析 Vidhya 数据集——贷款的预测问题 Python 中使用 Pandas 进行数据再加工 5. 使用 Python 中建立预测模型 o 逻辑回归 o 决策树 o 随机森林让我们开始吧 Python 基础为什么学 Python 用来数据分析很多人都有兴趣选择 Python 作为数据分析语言。这一段时间以来, 我有比较过 SAS 和R 。这里有一些原因来支持学习 Python : ?开源——免费安装?极好的在线社区?很容易学习?可以成为一种通用的语言,用于基于 Web 的分析产品数据科学和生产中。不用说,它仍然有几个缺点: ?它是一种解释性的语言, 而不是编译的语言, 因此可能占用更多的 CPU 时间。然而, 由于它节省了程序员的时间(由于学习的方便),它可能仍然是一个很好的选择。 Python v/s 这是关于 Python 的一个最具争议的话题。你可能总是不能避免遇到, 尤其是如果你是一个初学者。这里没有正确/ 错误的选择。它完全取决于具体情况和你的需要。我会尝试给你一些建议, 以帮助你做出明智的选择。为什么选择 Python 1. 极好的社区支持! 这是你在初期需要的东西。 Python 2 发行于 2000 年末, 已经被使用超过 15 年。 2. 很多第三方库!虽然许多库已经提供了 的支持,但仍然有大量的模块只工作在 。如果你计划将 Python 用于具体的应用,如 Web 开发这种高度依赖外部模块的,你选择 可能会更好。 3. 版本的一些特性有向后兼容性,可以使用 版本。为什么选择 Python 1. 更整齐和更快! Python 开发者修正了一些固有的问题和小缺点,以此为未来建立一个强大的基础。这些可能不是很相关,但最终会很重要。 2. 这是未来! 是2 .X 族发布的最后一个版本,并且最终每个人都要转移到 版本。 Python 3 在过去 5 年已经发布的稳定版本,并将继续。没有明确的赢家, 但我想, 底线是, 你应该专注于学习 Python 语言。版本之间的转换应该只是一个时间问题。敬请期待, 不久的将来一个专门对比 Python 和3X 的文章! 怎样安装 Python 有两种方法安装 Python ?你可以直接从项目网站下载 Python ,然后单独安装你想要的组件和库?或者,你可以下载并安装一个包,它附带了预装的库。我建议您下载 Anaconda 。另一种选择是 Enthought Canopy Express 。第二种方法提供了一个避免麻烦的安装, 因此我会推荐给初学者。这种方法是你必须等待整个包进行升级, 即使你只是对一个单一的库的最新版本感兴趣。它应该不重要, 直到和除非, 直到和除非, 你正在做的尖端统计研究。选择开发环境一旦你已经安装了 Python ,选择环境可以有很多种选择。这里是 3 个最常见的选择: ?终端/ 基于 Shell ? IDLE( 默认环境)? iPython notebook ——类似于 R的 markdown 而环境权取决于你的需要, 我个人更喜欢 iPython notebook 一点。它提供了许多良好的功能, 编写代码的同时还可以用于记录, 你可以选择在上面运行代码块(而不是一行一行的执行)。我们在整个教程中将使用 Ipython 环

最近更新

创意绿色商业创业计划书PPT模板 24页

励志大气团队意识培训PPT模板 22页

立克次氏体和衣原体专家讲座 104页

贵州省实验幼儿园小班提升训练试卷-含答案 4页

赣南版2020年六年级数学下学期期中考试试题-附.. 5页

脉冲波形产生和整形 31页

辽宁省2019年小升初数学强化训练试题-附答案 4页

辽宁省重点小学一年级语文下学期综合检测试题.. 4页

配电房管理制度 18页

2025年度生态农业示范区空地租赁合同协议书 10页

采购经理的个人年终总结与采购试用期工作总结.. 12页

《孔子游春》公开课一等奖课件赛课获奖课件 38页

商务渐变办公室主任岗位竞聘PP 27页

销售助理2018年工作总结及2019年工作计划与销.. 6页

2025年度班组分包施工安全责任合同 8页

商务风详细新员工入职培训PPT模板 27页

长春版2022年一年级语文下学期开学考试试卷C卷.. 4页

团队建设效率提升培训PPT 31页

GPS技术在智能交通系统中的应用分析 10页

进口业务的基本程序 31页

中国生活垃圾中转站行业市场分析报告 4页

某电动汽车主减速器总成设计 7页

《基于PIC单片机的胰岛素泵硬件电路的设计与实.. 16页

2025年度塑料膜课程设计端盖设计 24页

北京丹灵云科技有限责任公司手持机使用操作说.. 1页

严重创伤急救早期救治流程图 2页

二十一度母修持仪轨 8页

雨水设计控制雨量计算书 3页

《共同侵权行为》PPT课件 70页