文档介绍:北京师范大学
硕士研究生学位论文开题报告
论文题目基于概念语义的个性上下文研究
立论依据
选题的研究意义
随着互联网知识的指数倍增长,知识服务越来越受到人们的重视,知识服务的相关研究和探索已经成为热点。在服务方式和服务特点上,知识服务更加强调面向用户目标驱动、面向知识内容的服务,强调用户问题的解决和知识增值,因此其提供的服务是专业化和个性化的服务、是自主和创新的服务、是动态集成的服务。Error! Reference source not found.]然而,传统的知识服务在用户交互过程中存在着“服务语义缺失”和“服务个性缺失”的问题,采用一对多的模式,缺乏针对特定用户的个性化服务。
高质量的知识分类体系和针对用户个性化信息的建模研究是解决知识服务中存在的“服务语义缺失”和“服务个性缺失”问题的关键。此方面理论和实践研究已经取得了一定成果:在国外,面向知识服务的智能推荐系统目前己被广泛研究和应用于电子商务、远程教育、Web网站建设、信息检索等领域[2];国内学术界自2000年以来对个性化服务技术的研究也逐渐成为热点,国内也已出现了一些个性化推荐原型系统,一些信息服务数据库产品也推出了简单的推荐服务功能。虽然形成了较为丰富的研究积累,但还有许多问题有待深入研究和解决:1)高质量的知识分类体系(如本体)存在着构建成本高、不易维护、动态扩张性差等缺点;2)概念间语义关系大多要手动添加,自动获取的语义关系种类有限;3)目前用户个性化信息仍是以采用非结构化数据为主,在应用上也还处于比较浅显的层面,主要以用户显式定制和资源简单加工为主,用户个性化信息的描述大多采用关键词列表或关键词向量的字面处理方式,缺乏语义处理机制,无法处理用户多个方面的个性化特点,匹配处理和推荐反馈效果不佳;4)用户个性化模型刻画的过于简单笼统并且自适应性差,不能及时跟踪用户的变化;
如何借鉴知识本体和语义方面的研究成果,从领域知识和概念语义的层面来更为规范、细致的描述用户个性化信息及资源内容,并基于此实现概念级的个性化匹配和资源组织模式,无疑对于提高个性化服务的应用效果和寻求个性化信息服务技术的突破具有重要的意义。
鉴于现有个性化知识服务的不足,本研究以国内外近几年来有关信息检索语义化、知识服务个性化和大众分类与本体结合的知识分类体系等方面的研究进展为基础,提出了“基于概念语义的个性上下文研究”。它对构建结构化资源组织方式和为用户提供个性化推荐服务具有重要意义。
(1)提出大众分类(Folksonomy)与本体优势互补新框架,提供一种构建轻量级本体的新方式
大众分类和本体是目前主流的知识分类体系。大众分类的优势在于门槛低、易掌握、有利于个人知识管理、知识共享、鲜活动态,然而它的词汇自由不规范、缺乏语义关系,给资源组织和利用带来一些问题。本体的优势在于强大的表达性,能够支持自动推理、基于概念的检索和知识发现。它降低模糊性提高标准性并促进分享,但是本体的代价高使得推广难度大。[3]研究证明利用二者优势互补生成资源分类方式是可行的。本研究拟利用大众分类和本体的优势并结合数据计算研究的新进展,提出一种新框架为概念增加语义并自动生成轻量级本体。由此,弥补大众分类的语义欠缺和本体生成难的问题。
(2)丰富了个性上下文研究的理论成果
个性上下文研究主要包含对用户兴趣、角色、使用习惯等的研究。本研究拟提出与概念语义分类相映射的用户动态兴趣模型,是对基于知识本体进行用户兴趣建模的丰富与发展。在用户角色研究中,本研究拟在提出一种基于用户兴趣模型中细粒度兴趣概念的角色划分方式。这种方式将用户角色划分更细致准确,弥补了传统角色基于统计信息划分的死板和模糊。
关键概念界定
概念语义(concept and semantic)一词近年来被广泛用于人工智能、情报学、图书管理等领域,但是目前并没有对此词的明确定义。这里所说的概念在形式上的表现是词,但并不是所有的词都是概念。概念是从语料中抽取出来的用于表明一类文档特征的标识词,一类文档可能有不同的概念来标识。概念语义就是概念的含义以及这些含义之间的关系,提取概念语义的关键是建立概念语义空间。
2概念语义空间
概念语义空间,或称概念空间,到目前为止,并没有明确的定义,不同的学者根据其研究目的的不同给出了不同的解释。
概念空间这一概念是由武汉大学邓路华于1983年在美国康奈尔大学教授G,索顿的信息检索系统代数模型的基础上,在《图书情报数学》一书中提出的。概念空间[4]的主要内容是:
(1)概念及其之间的联系是空间的,多维的,一个复杂概念可由简单概念组配而成。我们将每个简单概念用一根坐标轴表示,那么任何一个复杂概念,例如一篇文献,一个提问,都可用这些坐