1 / 4
文档名称:

Web 用户聚类中访问路径差异性度量方法的研究.pdf

格式:pdf   页数:4
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Web 用户聚类中访问路径差异性度量方法的研究.pdf

上传人:你是我的全部 2013/8/11 文件大小:0 KB

下载得到文件列表

Web 用户聚类中访问路径差异性度量方法的研究.pdf

文档介绍

文档介绍:第 30卷第 3期计算机应用与软件 Vol
2013年 puterApplicationsandSoftware
Web用户聚类中访问路径差异性度量方法的研究
牛晓晨王劲松邢高峰
(西安邮电大学计算机学院陕西西安 710121)
摘要用户访问路径是 Web用户聚类时度量用户兴趣度的参数之一。结合日志记录的特点,从参数的数学特征出发,设计一
种基于二进制数表示的访问路径矩阵来度量用户的兴趣度,并给出新的相异度矩阵构造法。实验表明,所提出的访问路径矩阵是可
行的,生成的相异度矩阵在表现用户访问路径差异上是准确的。
关键词 Web用户聚类访问路径矩阵相异度矩阵日志文件
中图分类号 TP311 文献标识码 A DOI:.1000
ESSPATHS’DIFFERENCEMETRICINWEB
USERCLUSTERING
NiuXiaochen WangJinsong XingGaofeng
(puterScienceandTechnology,Xi’munications,Xi’an710121,Shaanxi,China)
Abstract User’esspathisoneoftheparametersformeasuringuser’,in
combinationwithlogrecorders’featuresandproceedingfrommathematicalcharacteristicsofparameter,esspathmatrixre
presentedbythebinarytomeasureuser’sinterestdegree,
esspathmatrixproposedinthepaperisfeasible,urateinrepresentingthedifferenceofus
er’esspath.
Keywords Webusersclustering Accesspathmatrix Dissimilaritymatrix Logfiles
无固定生成模式。通常,过程型参数的形式化表示方式是“有
0 引言向图”。本文结合日志记录的特点,从参数的数学特征出发,设
计了一种基于二进制数表示的访问路径矩阵来度量用户的兴趣
对用户聚类就是通过聚类的方法把用户按照兴趣是否相似度,并给出了新的相异度矩阵构造法。
聚成一个个的类别,每一类中的用户具有相似的兴趣背景。因
此在 Web日志用户聚类中,能否准确反映出用户实际的访问兴 1 一种新的相异度矩阵构造方法
趣将对用户聚类算法挖掘结果的有效性产生直接的影响。目
前,一些典型的 Web用户聚类算法已得到一定程度的应用,如 Web日志数据格式
文献[1]将 Web日志数据转换成一组连续的访问页面序列,并 Web服务器日志记录着用户访问该站点时对页面的请求信
通过找