文档介绍:Python大数据开发讲义
Python大数据开发讲义
第1页
4
数据
分析
3
数据
描述
1
数据
搜集
2
数据
整理
大数据处理过程
2
Python大数据开发xt', u'bryant-', u'burgess-', u'carroll- ', u'chesterton-', u'chesterton-', u'chesterton-', u'edgeworth-', u'melville-', u'milton-', u'shakespeare-', u'shakespeare-', u'shakespeare-', u'whitman-']
>>> texts = ('shakespeare-')
[u'[', u'The', u'Tragedie', u'of', u'Hamlet', u'by', ...]
Source
brown
()下载某一个或多个包,若下
载失败,能够在官网(/) •
单独下载后放到当地python目录nltk_data\corpora下
Python大数据开发讲义
第11页
Python大数据开发讲义
第12页
数据准备
Python大数据编程
Python大数据开发讲义
第13页
数据形式
30支成份股(dji) 股票数据逻辑结构
企业代码
企业名
最近一次成交价
美国运通企业
(quotes)股票详 细数据逻辑结构
日期
开盘价
收盘价
最高价
最低价
成交量
Python大数据开发讲义
第14页
数据整理
quotes数据加属性名
File
# Filename: from import quotes_historical_yahoo_ochl from datetime import date import pandas as pd
today = ()
start = (-1, , )
quotes = quotes_historical_yahoo_ochl('AXP', start, today)
fields = ['date','open','close','high','low','volume'] quotesdf = (quotes, columns = fields) print quotesdf
Python大数据开发讲义
第15页
数据整理
dji数据:加属性 名
code
AXP
name
lasttrade
BA
CAT
…
XOM
quotes数据:加
属性名
date
open
close
high
low
volume
…
Python大数据开发讲义
第16页
数据整理
用1,2,…作为索引
quotesdf = (quotes, columns = fields)
quotesdf = (quotes, index = range(1,len(quotes)+1),columns = fields)
Python大数据开发讲义
第17页
数据整理
假如能够直接用date作为索引,quotes时间能否转换成常
规形式(以下列图中效果)?
Source
>>> f