1 / 4
文档名称:

基于变精度粗糙集的Web用户聚类方法.pdf

格式:pdf   大小:414KB   页数:4页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于变精度粗糙集的Web用户聚类方法.pdf

上传人:q1188830 2022/2/25 文件大小:414 KB

下载得到文件列表

基于变精度粗糙集的Web用户聚类方法.pdf

相关文档

文档介绍

文档介绍:第 36 卷 第 3 期 计 算 机 工 程 2010 年 2 月
V o 内容长度等,进而得到用户原始的登录信息矩阵:
计算方法。在硬聚类方法中,根据相似度将对象划分到不同 ⎛⎞Infor(1,1) K Infor(1, n )
⎜⎟
的聚类中,不同的聚类之间没有交集。在软聚类方法中, AccessRmn× = ⎜⎟MOM
⎜⎟
一个对象可以被分配到 2 个或者 2 个以上的聚类中。软聚类 ⎝⎠Infor(,1) mL Infor (,) m n
可能具有模糊或粗糙的边界域。在模糊聚类方法中,通过隶 其中,矩阵的行数 m 代表用户数;矩阵的列数 n 代表网页数;
属函数刻画对象的特征,需要专门的领域知识来定义模糊隶 Infor(, i j )表示第 i 个用户useri 浏览第 j 个网页 page j 时的统计
属函数并且需要先验统计信息。粗糙聚类无需提供数据集合 信息。
之外的任何先验信,处理结果比较客观。 用户兴趣矩阵的建立
近些年来,粗糙集理论已被广泛地应用于聚类。文献[1] 聚类的目的是为了将兴趣相似的用户分到一个聚类中,
提出一种利用粗糙近似的概念对登录日志中的 Web 事务进行 本文使用点击率和相对浏览时间来定义用户的兴趣度[5]。既
聚类的算法。文献[2]提出一种基于受限的上近似,在上近似 考虑了用户的点击率、浏览时间,又考虑了网页内容的长度。
的迭代过程中引入相对相似度作为聚类合并标准的对序列化 定义 1 点击率:
数据进行聚类的方法。但已提出的方法大多需要区分用户会