1 / 44
文档名称:

python数据分析过程示例.docx

格式:docx   大小:696KB   页数:44页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

python数据分析过程示例.docx

上传人:63229029 2017/4/14 文件大小:696 KB

下载得到文件列表

python数据分析过程示例.docx

文档介绍

文档介绍:引言几年后发生了。在使用 SAS 工作超过 5 年后, 我决定走出自己的舒适区。作为一个数据科学家, 我寻找其他有用的工具的旅程开始了! 幸运的是,没过多久我就决定, Python 作为我的开胃菜。我总是有一个编写代码的倾向。这次我做的是我真正喜欢的。代码。原来,写代码是如此容易! 我一周内学会了 Python 基础。并且,从那时起,我不仅深度探索了这门语言,而且也帮助了许多人学习这门语言。 Python 是一种通用语言。但是, 多年来, 具有强大的社区支持, 这一语言已经有了专门的数据分析和预测模型库。由于 Python 缺乏数据科学的资源,我决定写这篇教程来帮助别人更快地学习 Python 。在本教程中, 我们将讲授一点关于如何使用 Pytho n 进行数据分析的信息,咀嚼它,直到我们觉得舒适并可以自己去实践。目录 1. 数据分析的 Python 基础 o 为什么学 Python 用来数据分析 o Python v/s o 怎样安装 Python o在 Python 上运行一些简单程序 2. Python 的库和数据结构 o Python 的数据结构 o Python 的迭代和条件结构 o Python 库 Python 中使用 Pandas 进行探索性分析 o 序列和数据框的简介 o 分析 Vidhya 数据集——贷款的预测问题 Python 中使用 Pandas 进行数据再加工 5. 使用 Python 中建立预测模型 o 逻辑回归 o 决策树 o 随机森林让我们开始吧 Python 基础为什么学 Python 用来数据分析很多人都有兴趣选择 Python 作为数据分析语言。这一段时间以来, 我有比较过 SAS 和R 。这里有一些原因来支持学习 Python : ?开源——免费安装?极好的在线社区?很容易学习?可以成为一种通用的语言,用于基于 Web 的分析产品数据科学和生产中。不用说,它仍然有几个缺点: ?它是一种解释性的语言, 而不是编译的语言, 因此可能占用更多的 CPU 时间。然而, 由于它节省了程序员的时间(由于学习的方便),它可能仍然是一个很好的选择。 Python v/s 这是关于 Python 的一个最具争议的话题。你可能总是不能避免遇到, 尤其是如果你是一个初学者。这里没有正确/ 错误的选择。它完全取决于具体情况和你的需要。我会尝试给你一些建议, 以帮助你做出明智的选择。为什么选择 Python 1. 极好的社区支持! 这是你在初期需要的东西。 Python 2 发行于 2000 年末, 已经被使用超过 15 年。 2. 很多第三方库!虽然许多库已经提供了 的支持,但仍然有大量的模块只工作在 。如果你计划将 Python 用于具体的应用,如 Web 开发这种高度依赖外部模块的,你选择 可能会更好。 3. 版本的一些特性有向后兼容性,可以使用 版本。为什么选择 Python 1. 更整齐和更快! Python 开发者修正了一些固有的问题和小缺点,以此为未来建立一个强大的基础。这些可能不是很相关,但最终会很重要。 2. 这是未来! 是2 .X 族发布的最后一个版本,并且最终每个人都要转移到 版本。 Python 3 在过去 5 年已经发布的稳定版本,并将继续。没有明确的赢家, 但我想, 底线是, 你应该专注于学习 Python 语言。版本之间的转换应该只是一个时间问题。敬请期待, 不久的将来一个专门对比 Python 和3X 的文章! 怎样安装 Python 有两种方法安装 Python ?你可以直接从项目网站下载 Python ,然后单独安装你想要的组件和库?或者,你可以下载并安装一个包,它附带了预装的库。我建议您下载 Anaconda 。另一种选择是 Enthought Canopy Express 。第二种方法提供了一个避免麻烦的安装, 因此我会推荐给初学者。这种方法是你必须等待整个包进行升级, 即使你只是对一个单一的库的最新版本感兴趣。它应该不重要, 直到和除非, 直到和除非, 你正在做的尖端统计研究。选择开发环境一旦你已经安装了 Python ,选择环境可以有很多种选择。这里是 3 个最常见的选择: ?终端/ 基于 Shell ? IDLE( 默认环境)? iPython notebook ——类似于 R的 markdown 而环境权取决于你的需要, 我个人更喜欢 iPython notebook 一点。它提供了许多良好的功能, 编写代码的同时还可以用于记录, 你可以选择在上面运行代码块(而不是一行一行的执行)。我们在整个教程中将使用 Ipython 环

最近更新