1 / 14
文档名称:

基于K_means的企业网用户行为分析方法.doc

格式:doc   页数:14
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于K_means的企业网用户行为分析方法.doc

上传人:1006108867 2013/7/16 文件大小:0 KB

下载得到文件列表

基于K_means的企业网用户行为分析方法.doc

文档介绍

文档介绍:
基于 K_means 的企业网用户行为分析方法
李春梅,何刚**
(北京邮电大学信息与通信工程学院,北京 100876)
5
10
15
20
25
30
35
40
摘要:随着互联网的高速发展与普及,越来越多的企业进行了局域网建设。对企业网的用户
行为进行分析,有利于优化局域网内的带宽资源分配,提高企业的办公效率。本章主要介绍
一种基于 K_means 的企业网用户行为分析方法,详细介绍了数据采集、处理和 K_means 聚
类的实现过程,并对结果进行了分析。企业管理者可以利用此方法得出的分析结果作为参考
依据,对局域网实施有效的管理。
关键词:局域网;K_means;数据采集;用户行为分析
中图分类号:
The work User Behavior Analysis Method
Based on K-means
LI Chunmei, HE Gang
(School of Information munication Engineering, Beijing University of Posts and
munications, Beijing 100876)
Abstract: With the rapid development and popularization of the , more and more
enterprises engage on the local work construction. User behavior analysis on the enterprise
network, can help to optimize the allocation bandwidth of the LAN, and improve the business
office efficiency. This easy proposes an work user behavior analysis technique based
on K_means, including the implementation process of data acquisition, processing and K_means
clustering , and the analysis of corresponding results. Business managers can use the analysis of
obtained results as a reference, and conduct effective management of the LAN.
Key words: LAN; K_means; Data Acquisition; user behavior analysis
0 引言
截止 2011 年 6 月,我国网民规模已达 亿,其中有 33%左右的网民的上网地点是在
工作单位[1]。随着网络建设快速发展和网络应用的日益丰富,互联网已成为人们工作生活必
不可少的工具。为了更好地进行信息获取、管理、发布和资源共享,越来越多的政府机关、
企事业单位、学校、酒店、宾馆等机构纷纷进行了局域网建设。局域网优点突显的同时也带
来了一些弊端,比如在一个企业局域网内,员工使用 P2P 下载会占用大量的企业带宽,这
不仅影响员工的工作效率,还会影响企业正常网络业务的进行;另外,如果员工上网行为不
规范,有可能会将网络上病毒或者木马引入,这有可能导致整个内网无法运行或者是泄露企
业内部机密;这些都给企业带来巨大的潜在威胁[2]。
针对上述的情况,本文从企业局域网用户行为管理的角度研究了一种利用 K_means 聚
类算法来对局域网用户行为进行分析的方法,并设计实现了其中数据采集和数据处理的算
法,最后利用 SPSS 分析工具对处理后的数据进行了分析,得出一些企业网用户网络行为的
模式,这些模式有助于企业网管理者更好地管理企业局域网和员工的上网行为。
作者简介:李春梅(1986-),女,硕士研究生,主要研究方向:网络流量监控
通信联系人:何刚(1971-),男,副教授,主要研究方向:网络流量监控. E-mail: heg@
-1-

1 K_means 聚类算法介绍
聚类是数据挖掘的一个重要组成部分。聚类的过程是将物理或抽象对象进行分组,将相
似的对象归为一类的过程。它可以作为一个单独的工具用于获取数据对象的分布情况,在对
45
50
象集内部,对象的之间的相似度较高,而不同对象集的用户相似度较低。目前,已经提出的
聚类方法很多,主要有以下的几种聚类分析方法:基于划分的