1 / 2
文档名称:

python爬虫入门教程.doc

格式:doc   大小:15KB   页数:2页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

python爬虫入门教程.doc

上传人:wz_198614 2017/10/31 文件大小:15 KB

下载得到文件列表

python爬虫入门教程.doc

文档介绍

文档介绍:python爬虫入门教程
Python爬虫入门三之Urllib库的基本使用
Python 崔庆才 5个月前(02-12) 13660℃ 13评论
那么接下来,小伙伴们就一起和我真正迈向我们的爬虫之路吧。
怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服。所以最重要的部分是存在于HTML中的,下面我们就写个例子来扒一个网页下来。
执行如下命令查看运行结果,感受一下。
共 191 页
看,这个网页的源码已经被我们扒下来了,是不是很酸爽?
那么我们来分析这两行代码,第一行
度首页,协议是HTTP协议,当然你也可以把HTTP换做FTP,FILE,HTTPS 等等,只是代表了一种访问控制协议,urlopen一般接受三个参数,它的参数如下: 共 191 页
个timeout是设置超时时间。
第二三个参数是可以不传送的,data默认为空None,timeout默认

第一个参数URL是必须

最近更新

大班语言保护地球市公开课获奖教案省名师优质.. 5页

给的建议书作文400字 (1) 3页

基于WEB的在线考试系统 开题报告 5页

造型设计app的项目融资计划书 7页

过桥米线项目商业计划书 7页

2024年人生警句语录 104页

大班太空市公开课获奖教案省名师优质课赛课一.. 4页

大班半点市公开课获奖教案省名师优质课赛课一.. 5页

2024年人物描写片段摘抄 32页

大树绘画市公开课获奖教案省名师优质课赛课一.. 4页

基本笔画书法市公开课获奖教案省名师优质课赛.. 5页

地球年龄官司市公开课获奖教案省名师优质课赛.. 4页

吹画市公开课获奖教案省名师优质课赛课一等奖.. 4页

吃饭不挑食的市公开课获奖教案省名师优质课赛.. 4页

肾发育不良的转录组学研究 34页

装修类店铺项目商业计划书 7页

蜂蜜大学生商业计划书 7页

营养厨房商业计划书 6页

动作描写的市公开课获奖教案省名师优质课赛课.. 4页

刺猬幼儿园美术市公开课获奖教案省名师优质课.. 6页

智能轮椅项目商业计划书 40页

AEI-W1(智辆)设备维修工岗位巡检作业指导书 17页

2024年质量员继续教育题库附完整答案【全国通.. 281页

优秀焊工工匠的主要事迹 9页

预应力压浆料详解与计算方法 5页

PPK计算表格 5页

中国保险行业从业人员基础职业素养课(远程测.. 19页

餐厨垃圾处理国家标准文件 3页

大班社会性活动:小熊生病了 3页

GBT520-1995电解铜箔国家标准(13页) 13页