文档介绍:基于多核技术的搜索结果聚类算法研究硕士学位论文林烁论文答辩日期康学位授予日期愕墨旦分类号密级瘛瘛海篒『■■●■■『
指导教师签名:毒%论文作者签名:‘眦篔㈣必电子邮箱:仪协躡唬甿作者联系电话:谢。’I颍日强≥.瘂日期:沙琁\广西大学学位论文原创性和使用授权声明槐C堋本人声明所呈交的论文,是本人在导师的指导下独立进行研究所取得的研究成果。除已特别加以标注和致谢的地方外,论文不包含任何其他个人或集体已经发表或撰写的研究成果,也不包含本人或他人为获得广西大学或其它单位的学位而使用过的材料。与我一同工作的同事对本论文的研究工作所做的贡献均已在论文中作了明确说明。本人在导师指导下所完成的学位论文及相关的职务作品,知识产权归属广西大学。本人授权广西大学拥有学位论文的部分使用权,即:学校有权保存并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或其它复制手段保存、汇编学位论文。本学位论文属于:口保密,在年解密后适用授权。朐谝陨舷嘤Ψ娇蚰诖颉啊獭
基于多核技术的搜索结果聚类算法研究摘要网络聚类引擎将聚类技术融入到搜索引擎中,对搜索结果进行聚类,以主题簇的形式返回给用户,用户只需在少量的主题簇中筛选出感兴趣的主题,继而再深入查看内容是否有价值,这样可以极大地减轻用户的查找任务,是当前搜索引擎的研究热点。影响网络聚类引擎的用户体验有两点:一是主题簇的最终显示方式,二是响应用户请求的效率。本文对上述问题进行了研究,具体包括:缇劾嘁娉氏种魈獯氐男问街饕J俏募惺骰蚱渌耐夹问图。只有客观地评价一个簇的重要性,才能使簇的排列合乎用户的期望。基于惴ǎ岢隽艘恢指慕扑愦胤种档姆椒ǎ唤隹悸谴乇昵┑姆值和簇内文档的数量,还利用文档在搜索结果中的原有排名和在簇中的分值。实验结果表明,改进后的簇分值可以客观反映簇的相关性和权威性。劾嗨惴ㄊ潜冉虾氖钡墓蹋枰L岣咚惴ǖ男室月阌没Ф在线聚类的时间容忍度。随着多核处理器的快速发展和广为使用,针对惴ǖ氖奔湫饰侍猓谔岢龅腖改进算法的基础上,运用多线程技术,使用并行程序设计来实现其并行化,以利用多核的资源优势,从而提高改进算法的性能。实验表明所设计的并行惴ㄓ薪虾玫男阅堋关键词:搜索结果聚类网络聚类引擎惴ù胤种刀嗪舜砥
籸瓹甌甌甌—琲,甎,;瑆.,痳.
.;;籱—
目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..本文的组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一第二章相关技术基础⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一网络聚类引擎框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯∷┗.墒踊蚪椤蚣艿慕峁埂挠诺恪向量空间模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.蛄靠占淠P偷亩ㄒ濉权值⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...蛄靠占淠P偷牟蛔恪潜在语义索引技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯奇异值分解⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯多核多线程技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.嗪舜砥鳌⋯⋯......⋯.....⋯⋯⋯⋯....⋯⋯........⋯........⋯.....⋯..⋯⋯..........⋯⋯..........⋯⋯⋯.....⋯⋯.
.⑿谐绦蛏杓啤与本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第三章惴ǖ母慕引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.ù⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯并行化建立矩阵操作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⒕卣蟮墓獭.⑿谢杓啤优化向量相乘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⒕.
.铀俦刃阅