文档介绍:第 31卷第 6期 计算机应用与软件 Vol31No.6
201theexpandedqueryto
obtaintheoptimalqueryvector,thencarryoutquadraticsearchfordocumentsinthetestsuite.Experimentresultsshowthatthealgorithmis
superioratretrievalperformancetoeitherlocalcontextanalysisalgorithmaloneorlocalclassificationanalysisalgorithmalone.
Keywords Informationretrieval Queryexpansion Localanalysis Geneticalgorithm
此遗传算法被引入到全文检索领域[1,2]。文献[3,4]提出一种
0 引 言 基于局 部 类 别 分 析 的 查 询 扩 展 优 化 算 法 (简称 LCLA)。在
LCLA算法中,重点研究了如何选择扩展词对初始查询进行扩
全文检索是一种非常有效的信息检索技术,它能帮助人们 展,但并没有进一步讨论如何更为有效地对扩展后的查询进行
快速地从海量数据中获得所需的信息。但由于用户通常在初次 权重分配,因此本文结合 LCLA算法的优点和基于遗传算法的
检索信息时输入的关键词不够具体或所能够反映的信息量有 权重分配方法,提出一种基于局部类别分析和遗传算法的查询
限,从而导致检索效率的低下。查询效率成为全文检索系统的 优化算法(简称 LCAGA)。
一个突出瓶颈。查询优化的目的是提高信息检索的查全率和查
准率。 2 LCAGA算法
1 研究现状
2.1 LCAGA算法基本思想
上世纪 70年代至今已提出多种查询优化技术,比较流行的 该算法对