文档介绍:华中科技大学
硕士学位论文
基于社会标注的主题分类及排序优化方法研究
姓名:夏静
申请学位级别:硕士
专业:计算机软件与理论
指导教师:文坤梅
2011-01-17
华中科技大学硕士学位论文
摘要
伴随着 概念对信息技术的影响,网络更注重与用户的交互。社会标注正
是用户与网络交互而产生的新兴网络数据。而用户利用社会标注的主要目的是对其
感兴趣资源进行描述,来提高分类、检索和发现网络资源的效率。在学术领域中,
由于学术用户的专业性,该领域中的社会标注相比通用领域具有更强的准确性。在
学术检索中,学术资源的主题类别信息可以从一定程度上指导用户的检索,帮助用
户快速发现其感兴趣的学术资源。主题类别信息还可以融入到检索系统中,用于初
始结果的主题过滤,可在一定程度上改进结果排序的效果。与此同时,在任何一个
检索系统中,相关度排序是提高检索结果质量的关键技术之一。
以学术检索为平台,基于社会标注的主题分类方法主要是利用学术会议的社会
标注作为补充的数据源,连同会议的内容共同来构建会议的表示模型,基于会议的
表示模型,利用朴素贝叶斯分类算法思想对会议进行主题分类。基于社会标注的排
序优化方法的主要思想是,在基于“查询-内容”的初始排序策略中,融入“查询-
标注”相关性的排序策略,以优化学术检索排序方法。因此,随着学术领域中社会
标注的涌现和标注数量的增加,将基于社会标注的主题分类和排序优化方法应用于
学术检索系统中,以优化检索结果的质量。
将学术领域中的社会标注这一新型的网络资源属性信息,融入到学术检索中,
达到改进学术检索结果质量的目的。并通过与其他方法的对比实验,验证了社会标
注对于主题分类和排序方法的优化作用。
关键词:学术检索,主题分类,排序方法,社会标注,优化
I
华中科技大学硕士学位论文
Abstract
With the concept of ’impact on the information technology, work pays
more attention to interaction with the web users. The social annotation is the emerging
new data arising from the user’s interaction with work. The main purpose of
utilization of social annotation is to improve the efficiency of the classification, retrieval
and discovery work resources by describing the interesting resources. In academic
field, the precision of social annotation is higher than mon field due to the
professional of academic users. Therefore, in academic field, the topic classification of
resource can guide the user’s retrieval and help user find out their interested resources.
Meanwhile, topic classification can also be integrated into the retrieval system by filtering
the topic of initial results, which can improve the efficiency of ranking method. In any
retrieval system, relevance ranking method is the key technology to improve the quality of
search results.
In this paper, academic retrieval system is used as the platform. The first proposed
method in this paper is to make use of social annotations as plementary data source,
as we