1 / 3
文档名称:

搜索引擎算法.docx

格式:docx   大小:11KB   页数:3页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

搜索引擎算法.docx

上传人:baba 2022/6/8 文件大小:11 KB

下载得到文件列表

搜索引擎算法.docx

相关文档

文档介绍

文档介绍:搜索引擎算法
HITS 算法是由康奈尔高校( Cornell University ) 的Jon Kleinberg 博士于1997 年首先提出的,为IBM 公司阿尔马登探讨中心( IBM Almaden Research Cen搜索引擎算法
HITS 算法是由康奈尔高校( Cornell University ) 的Jon Kleinberg 博士于1997 年首先提出的,为IBM 公司阿尔马登探讨中心( IBM Almaden Research Center) 的名为―CLEVER‖的探讨项目中的一部分。
详细说明
一个网页重要性的分析的算法。
算法对返回的匹配页面计算两种值,一种是枢纽值(Hub Scores),另一种是权威值(Authority Sc ores)这两个值是相互依存、相互影响的。所谓枢纽值,指的是页面上全部导出链接指向页面的权威值之和。权威值指的是全部导入链接所在的页面的枢纽值之和。
通常HITS算法是作用在肯定范围的,比如一个以程序开发为主题网页,指向另一个以程序开发为主题的网页,则另一个网页的重要性就可能比较高,但是指向另一
个购物类的网页则不肯定。
在限定范围之后依据网页的出度和入度建立一个矩阵,通过矩阵的迭代运算和定
义收敛的阈值不断对两个向量Authority和Hub值进行更新直至收敛。
Hits算法
HITS(Hyperlink –Induced Topic Search) 算法是利用HubPAuthority的搜寻方法,详细算法如下:
将查询q提交给基于关键字查询的检索系统,从返回结果页面的集合总取前n个网页(如n=200),作为根集合(root set),记为S,则S满意:


(Authority)网页
通过向S 中加入被S 引用的网页和引用S 的网页,将S 扩展成一个更大的集合T. 以T 中的Hub 网页为顶点集V1 ,以权威网页为顶点集V2 。
V1 中的网页到V2 中的网页的超链接为边集E ,形成一个二分有向图.

最近更新

超高频RFID小区车辆管理系统 4页

哈尔滨工业大学MBA开题报告范文 6页

合工大高职学院(JAC校区)毕业论文实施细则 4页

发加班朋友圈文案 5页

单位年度考核中的绩效评估与企业文化 5页

医疗风险管理自查报告(精选16) 4页

语言测试的试后效度研究及其启示 3页

函授本科《汉语言文学》毕业论文范文(二) 4页

共同委托律师委托书(3) 4页

公司车辆委托书模板(精选5) 4页

论小学体育游戏教学和技能教学的关系及应用 3页

伴性遗传公开课 31页

会计个人简历范文大全 5页

蛋白酶体抑制剂硼替佐米增强CIK细胞杀伤HBV感.. 3页

葛根芩连汤及其拆方对UC大鼠结肠平滑肌线粒体.. 3页

荧光高分子探针与DNA分子的作用研究 3页

苜蓿银纹夜蛾核型多角体病毒ac130(gp16)和ac1.. 3页

船舶油污水中油滴电动操控和检测技术研究 3页

中外学前教育的比较思考论文(共3) 7页

膜下滴灌栽培条件玉米品种筛选及灌溉方式对其.. 3页

脐周八穴治疗单纯性肥胖的临床研究 3页

胡家河矿采掘工作面强矿压防治与监测综述报告.. 3页

股份制商业银行个人理财规划系统的设计与实现.. 3页

聚多巴胺复合非织造布强化铁活化过硫酸盐氧化.. 3页

个人简历中的专业特长范文 4页

职业院校信息化课堂教学情况调查分析 3页

世界足球历史十大门将 4页

上课说话检讨书范文750字(通用8) 4页

农业机械运输保障协议6篇 99页

2025年建设工程节后复工安全检查表 1页