1 / 12
文档名称:

《电子商务应用》实验报告.doc

格式:doc   大小:24KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

《电子商务应用》实验报告.doc

上传人:WonderW 2022/1/7 文件大小:24 KB

下载得到文件列表

《电子商务应用》实验报告.doc

相关文档

文档介绍

文档介绍:
《电子商务应用》实验报告
验 实验 3《 《及 搜索引擎及 SEO 实验》 》 实验学时:
2 每组人数:
1 实验类型:
2 (1:基础性 2:综合性 3:设计性 4:研究性) 实验要求:
1 (1:必修 2:选修 3:其它) 实验类别:
3 (1:基础 2:专业基础 3:专业 4:其它) 一、实验目的 1.研究并学****几种常见的搜索引擎算法,包括网络蜘蛛爬行策略、中文分词算法、网页正文提取算法、网页去重算法、PageRank 和 MapReduce 算法,了解它们的基本实现原理;
2.运用所学 SEO 技术对网页进行优化。
二、实验内容 1.
研究常用的网络蜘蛛爬行策略,如深度优先策略、广度优先策略、网页选择策略、重访策略和并行策略等,了解其实现原理;
2.
研究至少两种中文分词算法,了解其实现原理;
3.
研究至少两种网页正文提取算法,了解其实现原理;
4.
研究至少两种网页去重算法,了解其实现原理;
5.
研究 Google 的 PageRank 和 MapReduce 算法,了解它们的实现原理;
6.
使用所学的 SEO 技术,对实验二所设计的网站静态首页实施 SEO,在实施过程中需采用如下技术:

(1) 网页标题(title)的优化;
(2) 选取合适的【关键词】:^p 并对【关键词】:^p 进行优化;
(3) 元标签的优化;
(4) 网站结构和 URL 的优化;
(5) 创建 文件,禁止蜘蛛抓取网站后台页面;
(6) 网页内部链接的优化;
(7) Heading 标签的优化;
(8) 图片优化;
(9) 网页减肥技术。
7.
使用 C++、C#和 等任意一种编程语言,设计并实现一个简单的网络蜘蛛爬行程序,要求在输入【关键词】:^p 、设置爬行深度和初始网页 URL 之后能够实现网页搜索,输出包含【关键词】:^p 的网页的 URL 和网页标题。
【注:实验 7 为补充实验,不要求每个同学都完成,感兴趣者可自行实现该程序,不计入实验报告评分。】
三、实验要求 1.
研究几种常用的网络蜘蛛爬行策略,填写相应的表格,表格必须填写完整;
2.
研究两种中文分词算法,填写相应的表格,表格必须填写完整;
3.
研究两种网页正文提取算法,填写相应的表格,表格必须填写完整;
4.
研究两种网页去重算法,填写相应的表格,表格必须填写完整;
5.

研究 PageRank 算法和 MapReduce 算法,填写相应的表格,表格必须填写完整;
6.
提供实施 SEO 之后的网站静态首页界面和 HTML 代码,尽量多地使用所学 SEO 技术;
7.
严禁大面积拷贝互联网上已有文字资料,尽量用自己的理解来阐述算法原理,必要时可以通过图形来描述算法;
8.
使用任意一种编程语言实现一个简单的网络蜘蛛程序,需提供网络蜘蛛程序完整代码及实际运行结果。
四、实验步骤 1.
通过使用搜索引擎并查阅相关资料,研究并整理几种常用的网络蜘蛛爬行策略相关资料,填写相应的表格;
2.
通过使用搜索引擎并查阅相关资料,研究并整理两种中文分词算法的基本原理,填写相应的表格;
3.
通过使用搜索引擎并查阅相关资料,研究并整理两种网页正文提取算法的基本原理,填写相应的表格;
4.
通过使用搜索引擎并查阅相关资料,研究并整理两种网页去重算法的基本原理,填写相应的表格;
5.
通过使用搜索引擎并查阅相关资料,研究并整理 PageRank 算法和 MapReduce 算法的基本原理,填写相应的表格;
6.
对实验二所设计的网站静态首页实施 SEO;

7.
使用任意一种编程语言,设计并实现一个简单的网络蜘蛛爬行程序。
五、实验报告 1.完成本项目实验后,学生应提交实验报告。
2.实验报告格式与要求见附件。
《电子商务应用》 实验报告 项目名称 专业班级 学 号 姓 名 实验成绩:良 良 批阅教师:
20__ 年 1 月 9 日
验 实验 3《 《及 搜索引擎及 SEO 实验》 》 实验学时:
实验地点:
实验日期:
一、实验目的 研究并学****几种常见的搜索引擎算法,包括网络蜘蛛爬行策略、中文分词算法、网页正文提取算法、网页去重算法、PageRank 和 Map