文档介绍:硕士学位论文
基于基站数据的用户移动行为挖掘
MINING USER MOBILITY BEHAVIOR
BASED ON BASE STATION
安战超
哈尔滨工业大学
2011 年 12 月
国内图书分类号: 学校代码:10213
国际图书分类号: 密级:公开
工学硕士学位论文
基于基站数据的用户移动行为挖掘
硕士研究生: 安战超
导师: 丁宇新副教授
申请学位: 工学硕士
学科: 计算机科学与技术
所在单位: 深圳研究生院
答辩日期: 2011 年 12 月
授予学位单位: 哈尔滨工业大学
Classified Index:
:
Thesis for the Master Degree in Engineering
MINING USER MOBILITY BEHAVIOR
BASED ON BASE STATION
Candidate: An zhanchao
Supervisor: Associate Prof. Ding Yuxin
Academic Degree Applied for: Master of Engineering
Speciality: Computer Science&Technology
Affiliation: Shenzhen Graduate School
Date of Defence: December , 2011
Degree-Conferring-Institution: Harbin Institute of Technology
哈尔滨工业大学工学硕士学位论文
摘要
近年来,随着计算技术和硬件技术不断革新,电子设备不断的智能化而且更
加便携,像无线传感器,PDA,智能手机等电子设备都拥有了强大的计算能力。
这些小型智能设备为基于位置的服务提供了方便,有很多的应用都可以从用户的
位置数据中获得有用的信息。比如广告,基于位置的服务(LBS),路径规划与预
测等。
然而,这些应用所需要的用户移动路径信息无法直接从手机中获取。手机捕
获到的移动信息只是一些底层的位置信息,比如由 GPS 获取到的经纬度信息,或
者是基站信息等,无法直接被其他应用使用。因此本课题要解决的主要问题是如
何从利用手机采集到的底层用户位置数据来挖掘用户的移动模式,为路径预测等
应用提供方便。本课题的主要研究内容包括几个方面:
首先,解决信号漂移现象对构造路径的影响。在分析基站数据时,发现手机
记录的基站数据同样会出现 Wi-Fi 网络中的信号漂移问题。即在数据采集过程中,
用户并没有移动,但是记录到的基站信息却发生变化,产生多条记录。这样就会
对路径的构造产生影响,使得原本应该成为终点的记录没有被正确的划分。针对
信号漂移的问题本课题采用了层次图聚类的方法对记录中的基站进行聚类,将记
录中的基站数据变成相应的地点,从而解决了信号漂移的问题。
其次,本课题采用改进的序列模式挖掘算法挖掘用户的频繁模式。针对用户
路径数据的特点,采用构造有向路径拓扑图的方法,消除了大量无用的候选项集,
提高了算法执行的效率。同时,本课题针对群体的移动特征进行了挖掘,分析特
征发现同一群体内的用户会存在相似性。
最后,对如何预测用户位置进行了分析,给出了预测方法。通过实验表明,
利用挖掘出的用户频繁模式,以及模式的时间分布概率,能够很好的预测用户的
位置。
通过本文内容的研究,从原始的基站数据挖掘出了单个用户和群体用户的频
繁移动模式,为基于位置的服务以及路径规划与预测等应用提供了支持。
关键词:序列模式挖掘;基站漂移;图聚类;路径预测
I
哈尔滨工业大学工学硕士学位论文
Abstract
In recent years, with the development puting technology and hardware
technology, the development of electronic equipment is headed in the direction of the
miniaturization and intellectualization. Wireless sensors, PDA, smart p