文档介绍:引言
  几年后发生了。在使用SAS工作超出5年后,我决定走出自己舒适区。作为一个数据科学家,我寻求其它有用工具旅程开始了!幸运是,没过多久我就决定,Python作为我开胃菜。
  我总是有一个编写代码倾向。这次我做是我真正喜爱。代码。原来,写代码是如此轻易!
  我一周内学会了Python基础。而且,从那时起,我不仅深度探索了这门语言,而且也帮助了很多人学****这门语言。Python是一个通用语言。不过,多年来,含有强大小区支持,这一语言已经有了专门数据分析和估计模型库。
  因为Python缺乏数据科学资源,我决定写这篇教程来帮助她人愈加快地学****Python。在本教程中,我们将讲授一点相关怎样使用Python进行数据分析信息,咀嚼它,直到我们认为舒适并能够自己去实践。
目录
1. 数据分析Python基础
为何学Python用来数据分析
Python v/s
怎样安装Python
在Python上运行部分简单程序
2. Python库和数据结构
Python数据结构
Python迭代和条件结构
Python库
3. 在Python中使用Pandas进行探索性分析
序列和数据框介绍
分析Vidhya数据集——贷款估计问题 
4. 在Python中使用Pandas进行数据再加工
5. 使用Python中建立估计模型
逻辑回归
决议树
随机森林
让我们开始吧
为何学Python用来数据分析
  大家全部有爱好选择Python作为数据分析语言。这一段时间以来,我有比较过SAS和R。这里有部分原因来支持学****Python:
开源——无偿安装
极好在线小区
很轻易学****br/>能够成为一个通用语言,用于基于Web分析产品数据科学和生产中。
  不用说,它仍然有多个缺点:
它是一个解释性语言,而不是编译语言,所以可能占用更多CPU时间。然而,因为它节省了程序员时间(因为学****方便),它可能仍然是一个很好选择。
Python v/s
  这是相关Python一个最具争议话题。你可能总是不能避免碰到,尤其是假如你是一个初学者。这里没有正确/错误选择。它完全取决于具体情况和你需要。我会尝试给你部分提议,以帮助你做出明智选择。
为何选择Python
极好小区支持!这是你在早期需要东西。Python 2发行于末,已经被使用超出。
很多第三方库!,。假如你计划将Python用于具体应       用,如Web开发这种高度依靠外部模块,。
,。
为何选择Python
更整齐和愈加快!Python开发者修正了部分固有问题和小缺点,以此为未来建立一个强大基础。这些可能不是很相关,但最终会很关键。
这是未来! .X族公布最终一个版本,。Python 3在过去5年已经公布稳定版本,并将继续。
  没有明确赢家,但我想,底线是,你应该专注于学****Python语言。版本之间转换应该只是一个时间问题。敬请期待,很快未来一个专门对比Python X文章!
怎样安装Python
有两种方法安装Python
你能够直接从项目网站下载Python,然后单独安装你想要组件和库
或,你能够下载并安装一个包,它附带了预装库。我提议您下载Anaconda。另一个选择是 Enthought Canopy Express。
第二种方法提供了一个避免麻烦安装,所以我会推荐给初学者。这种方法是你必需等候整个包进行升级,   即使你只是对一个单一库最新版本感爱好。它应该不关键,直到和除非,直到和除非,你正在做尖端统计研究。
选择开发环境
  一旦你已经安装了Python,选择环境能够有很多个选择。这里是3个最常见选择:
终端/基于Shell
IDLE(默认环境)
iPython notebook ——类似于Rmarkdown
  而环境权取决于你需要,我个人更喜爱iPython notebook一点 。它提供了很多良好功效,编写代码同时还能够用于统计,你能够选择在上面运行代码块(而不是一行一行实施)。
我们在整个教程中将使用Ipython 环境
热身:跑第一个Python程序
  你能够使用Python作为一个简单计算器来开始:
有部分事情需要注意:
你能够在你终端/ CMD键入“IPython notebook”来开启IPython notebook,这取决于你工作在操作系统
你能够经过简单