1 / 44
文档名称:

python数据分析.doc

格式:doc   大小:779KB   页数:44页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

python数据分析.doc

上传人:幻影 2020/9/9 文件大小:779 KB

下载得到文件列表

python数据分析.doc

相关文档

文档介绍

文档介绍:python数据分析(pandas)几年后发生了。在使用SAS工作超过5年后,我决定走出自己的舒适区。作为一个数据科学家,我寻找其她有用的工具的旅程开始了!幸运的就是,没过多久我就决定,Python作为我的开胃菜。 我总就是有一个编写代码的倾向。这次我做的就是我真正喜欢的。代码。原来,写代码就是如此容易! 我一周内学会了Python基础。并且,从那时起,我不仅深度探索了这门语言,而且也帮助了许多人学****这门语言。Python就是一种通用语言。但就是,多年来,具有强大的社区支持,这一语言已经有了专门的数据分析与预测模型库。 由于Python缺乏数据科学的资源,我决定写这篇教程来帮助别人更快地学****Python。在本教程中,我们将讲授一点关于如何使用Python进行数据分析的信息,咀嚼它,直到我们觉得舒适并可以自己去实践。目录1、数据分析的Python基础为什么学Python用来数据分析Python2、7v/s3、4怎样安装Python在Python上运行一些简单程序2、Python的库与数据结构Python的数据结构Python的迭代与条件结构Python库3、在Python中使用Pandas进行探索性分析序列与数据框的简介分析Vidhya数据集——贷款的预测问题 4、在Python中使用Pandas进行数据再加工5、使用Python中建立预测模型逻辑回归决策树随机森林让我们开始吧1、数据分析的Python基础为什么学Python用来数据分析 很多人都有兴趣选择Python作为数据分析语言。这一段时间以来,我有比较过SAS与R。这里有一些原因来支持学****Python:开源——免费安装极好的在线社区很容易学****可以成为一种通用的语言,用于基于Web的分析产品数据科学与生产中。 不用说,它仍然有几个缺点:它就是一种解释性的语言,而不就是编译的语言,因此可能占用更多的CPU时间。然而,由于它节省了程序员的时间(由于学****的方便),它可能仍然就是一个很好的选择。Python2、7v/s3、4 这就是关于Python的一个最具争议的话题。您可能总就是不能避免遇到,尤其就是如果您就是一个初学者。这里没有正确/错误的选择。它完全取决于具体情况与您的需要。我会尝试给您一些建议,以帮助您做出明智的选择。为什么选择Python2、7极好的社区支持!这就是您在初期需要的东西。Python2发行于2000年末,已经被使用超过15年。很多第三方库!虽然许多库已经提供了3、X的支持,但仍然有大量的模块只工作在2、X。如果您计划将Python用于具体的应   用,如Web开发这种高度依赖外部模块的,您选择2、7可能会更好。3、X版本的一些特性有向后兼容性,可以使用2、7版本。为什么选择Python3、4更整齐与更快!Python开发者修正了一些固有的问题与小缺点,以此为未来建立一个强大的基础。这些可能不就是很相关,但最终会很重要。这就是未来!2、7就是2、X族发布的最后一个版本,并且最终每个人都要转移到3、X版本。Python3在过去5年已经发布的稳定版本,并将继续。 没有明确的赢家,但我想,底线就是,您应该专注于学****Python语言。版本之间的转换应该只就是一个时间问题。敬请期待,不久的将来一个专门对比Python2、X与3X的文章!怎样安装Python有两种方法安装Python您可以直接从项目网站下载Python,然后单独安装您想要的组件与库或者,您可以下载并安装一个包,它附带了预装的库。我建议您下载Anaconda。另一种选择就是EnthoughtCanopyExpress。第二种方法提供了一个避免麻烦的安装,因此我会推荐给初学者。这种方法就是您必须等待整个包进行升级, 即使您只就是对一个单一的库的最新版本感兴趣。它应该不重要,直到与除非,直到与除非,您正在做的尖端统计研究。选择开发环境 一旦您已经安装了Python,选择环境可以有很多种选择。这里就是3个最常见的选择:终端/基于ShellIDLE(默认环境)iPythonnotebook——类似于R的markdown 而环境权取决于您的需要,我个人更喜欢iPythonnotebook一点。它提供了许多良好的功能,编写代码的同时还可以用于记录,您可以选择在上面运行代码块(而不就是一行一行的执行)。我们在整个教程中将使用Ipython环境热身:跑第一个Python程序 您可以使用Python作为一个简单的计算器来开始:有一些事情需要注意:您可以在您的终端/CMD键入“IPythonnotebook”来启动IPythonnotebook,这取决于您的工作在操作系统您可以通过简单地点击上面截图中的名字来对IPythonnotebook命名界面显示In[*]代表输入与Out[*]代表输出。您可以通过按“Shift+Ent