1 / 12
文档名称:

基于特征选择的网页排名算法.doc

格式:doc   大小:29KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于特征选择的网页排名算法.doc

上传人:wxc6688 2020/2/2 文件大小:29 KB

下载得到文件列表

基于特征选择的网页排名算法.doc

相关文档

文档介绍

文档介绍:?软件技术与数据库?文章编号:loo0_3428(201o)l3__o037__03文献标识码:A莉—i基于特征选择的网页排名算法李慧,李存华,王霞(淮海工学院计算机工程学院,连云港222002)摘要:为提高网页排名满意度,,,:排名;特征选择;-(puterEngineering,HuaihaiInstituteofTechnology,Lianyungang222002)[AbstractlToimprovethesatisfactiondegreeofWebpageranking,'S~~[Keywordslranking;featureselection;informationretrieval1概述排名问题是信息检索应用中的核心问题之一,在传统排名方法中,,[21等监督学****算法的发展,,,,,可以在训练之前对特征词进行选择,,但目前还没有将特征选择直接应用到页面排名中的技术,以前对特征选择的研究集中在分类中_j】.,,,对特征集的特征进行评估,使每个特征都获得一个评估分,然后对所有特征按其评估分大小进行排序,(InformationGain,率(DocumentFrequency,DF),信息增益IO),互信息(MutualInformation,MI){.,,…,1中选择t个(1?,?),代表其重要度,再为任意2个特征词与之间定义一个相似度,最后用一个高效的算法来求解一组特征集,(MultiFeatureAlternation,.每种特征选择方法都对原始空间进行MFA)的权值计算方法评估,通过选取合适的阈值,可以得到一个特征子集,,可以先综合多种特征选择方法的优点,选择出最佳特征子集,然后使用特征子集对样例进行排名,并使用MAP(MeanAveragePrecision)和NDCG(NormalizedDiscountCumulativeGain)作为测量标准(具体定义将在第3节中给出),对排名结果进行测量,:输入原始特征空间;t种特征选择方法,,…,,对应的阈值,,?一,输出特征子集S中每个特征词的权值(1)任意的特征选择方法o根据其评估函数,计算原始特征空间中每个