1 / 10
文档名称:

饿了么外卖数据集.docx

格式:docx   大小:1,304KB   页数:10页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

饿了么外卖数据集.docx

上传人:weizifan339913 2019/3/21 文件大小:1.27 MB

下载得到文件列表

饿了么外卖数据集.docx

文档介绍

文档介绍:饿了么外卖数据采集本文介绍使用八爪鱼采集饿了么商家外卖数据的方法。采集网站:https://ce(不换外卖配送地址的采集网址)https://e/(换外卖配送地址的采集网址)采集的内容包括:店名,起送价,配送费,平均送达速度,月售,综合评价,商家地址,营业时间,服务态度,菜品评价。使用功能点:——AJAX点击和翻页教程orialdetail-1/:创建饿了么外卖数据任务进入主界面,选择“自定义采集” 采集步骤1将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址”。打开网页之后,打开右上角的流程按钮,使制作的流程可见状态。此时网页会迅速定位到当前地址,网址也会变成地址附近的商家。如果想要修改成其他地址,在网址栏输入https://e/,在首页的选项中选择“输入文字”,在文字框中输入“深圳软件园一期”(离八爪鱼公司较近),点击确定。在页面中显示出来的下拉框中点击一个你要采集的地址,比如我点击了第一个地址,则地址更换完成。步骤2:创建翻页循环1)如图所示,饿了商家信息没有下一页,需要向下滚动刷新,并且在最下方是“点击加载更多商家”,因此需要做两个操作。此操作涉及到AJAX点击和翻页教程,具体请看:操作1:点击上一步已做好的“点击元素”,进行“滚动页面”设置。在右侧高级选项里勾选滚动页面,设置滚动4次,每次间隔3秒,滚动方式直接滚动到底部。点击“确定”。没有修改地址的用户可以直接在第一步“打开网页”中进行设置,设置方式相同。操作2:点击最下方的“点击加载更多商家”,在选项框中选择“循环点击单个元素”,翻页循环步骤就在左上角流程里了。在流程的点击翻页右侧高级选项里,勾选滚动页面,设置滚动4次,每次间隔3秒,滚动方式直接滚动到底部。勾选ajax加载,超时5秒。设置执行前等待2秒,点击“确定”。步骤3:创建列表循环1)鼠标先点击商品列表中第一个商品(注意要包括该商品全部子元素,如果只选择了标题或者配送费,可点击提示框最右下角的正方形加小斜线的图标,扩大选项范围),再点击第二个商品,此时所有商品已经全都选中,鼠标点击提示框中的“循环点击每个元素”,列表循环就创建完成,并进入到第一个循环项的详情页面。2)数据提取,接下来采集具体字段,分别选中页面店名,起送价,配送费,平均送达速度,月售,综合评价,商家地址,营业时间,服务态度,菜品评价,再分别鼠标点击“点击该元素的文本”,再修改字段名称,数据提取完毕。3)可在流程各个步骤的高级选项里设置“执行前等待”几秒时间,可减少访问页面较快出现防采集问题。设置后点击“确定”。步骤4:饿了么外卖数据采集及导出点击左上角的“保存”,然后点击“开始采集”。 选择“启动本地采集”采集完成后,会跳出提示,选择“导出数据”,选择“合适的导出方式”,将采集好的数据导