1 / 94
文档名称:

基于层次的聚类.ppt

格式:ppt   大小:2,827KB   页数:94页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于层次的聚类.ppt

上传人:lily8501 2020/12/28 文件大小:2.76 MB

下载得到文件列表

基于层次的聚类.ppt

相关文档

文档介绍

文档介绍:网络信息收集、索引与信息检索、聚类
信息科学技术学院
马永芳 张旭东 张涵
Agenda
网络爬虫是什么?
怎样爬?
预备知识
整体框架
核心算法
算法改进
Web Crawler是。。。
软件,系统
“A web crawler is one type of bot, or software agent. “
搜集对象是什么?
整个Web?
部分Web?哪一部分?
Web是不断更新的,哪些要re-crawl?
Agenda
网络爬虫是什么?
怎样爬?
预备知识
整体框架
核心算法
算法改进
Distributed Crawling
怎样搜集?
<href …>
<href …>
<href …>
<href …>
<href …>
<href …>
<href …>
网页为节点
网页中的HyperLink为有向边
Crawl == 图遍历, right?
链接是哪些?
Refer to HTML Specification
系统框图