文档介绍:摘要诜治鱿钟械腤使用数据预处理过程的基础上,对预处理中的一个关键问题——会互联网技术的迅速发展,实现了全球的资源共享和信息交换。然而互联网上的信息量呈指数级速度增长所导致的“信息过载”和“信息迷航”问题已日益制约用户高效地使用各种信息资源。网站通过提供鲂曰窨梢蕴岣哂没У姆梦市屎吐舛取J迪諻个性化推荐所面临的关键问题是需要对大量匿名用户的行为模型进行深层理解,传统的个性化方法很难处理匿名用户的情形,把褂猛诰蛴糜趙个性化推荐是解决上述问题的有效途径。作为萃诰虻囊桓鲋匾W槌刹糠郑琖使用挖掘就是利用数据挖掘技术分析用户访问留下的日志文件,挖掘用户浏览模式的过程。褂猛诰蚩捎糜诶斫庥没г谕镜姆梦市形#从而可以主动为用户提供网站导航服务。蚁群算法虺艫魑H体智能算法的一个分支,是受真实蚁群觅食行为的启发而逐步发展起来的一种模拟蚂蚁群体智能行为的算法。由于其在求解复杂优化问题方面的优势,在许多领域都得到了应用。因此,将蚁群算法引入褂猛诰颉⒎⑾钟没У匿滥J健⑽S没峁┑己酵萍龇瘢哂兄匾5理论意义和应用价值。本文首先对蚁群算法的收敛性和褂檬莸脑ご斫辛搜芯浚诖嘶∩希直将蚁群算法应用于用户导航模式和用户聚类的挖掘。所做的主要工作及创新性研究成果如下:谕妓阉髀煲舷低车氖樟残苑治龌∩希曰疽先核惴ń辛烁慕⒍哉庵指慕的蚁群算法构造全局最优解的概率等收敛性问题进行了研究。首先对岢龅幕本蚁群算法中的P妥髁巳愀慕浩湟皇墙鲎钣判懵煲鲜头判畔⑺兀丛诘趂步迭代结束之后,仅对前降兴业降淖钣沤馍系幕〗行畔⑺氐募忧浚庋凸睦煲在至今发现的最好路径的邻近区域去搜索路径,使蚂蚁对解空间的探索更有方向性;其二是对残留信息素数量进行限幅控制。为了避免算法过早收敛于非全局最优解,在算法的迭代过程中。对任意弧上的残留信息素设定了下界;其三是信息素挥发系数自适应变化。通过挥发系数的自适应变化使蚁群在算法的前面阶段增加搜索的随机性,避免搜索过度集中,有利于搜寻更优解;在算法的后期,减小随机程度,增加收敛速度,使算法在已经搜索到较优解的情况下,逐渐收敛到全局最优解。在此基础上,对该算法的收敛性进行了证明。在仅需满足两个基本假设条件的前提下,证明了算法能以接近于母怕适樟灿谧钣沤狻J笛榻峁砻鳎与基本蚁群算法相比,本文算法的全局搜索能力与收敛速度都有所提高,是一种有效的算法。话识别问题进行了研究,并提出了一种基于自适应时间阈值的会话识别方法。传统的面向时间的方法只根据一个固定的时间阈值参数来识别会话的方法是具有局限性的,本文利用动态的时间阈值参数进行会话识别,分析每个用户的平均页面访问时间,并结合固定的时间阈值得到一个动态的自适应时间阈值,从而实现会话访问时间参数的个性化。实验结果表明,通过该方法获得的用户会话能够更加准确地描述用户的实际浏览行为,对模式发现阶段能够产
生好的影响,从而可以提高基于褂猛诰虻挠没У己酵萍鼋峁闹柿俊诼煲厦偈承形S胗没т劳承形5南嗨菩裕裌用户看成是人工的蚂蚁,利用蚁群算法中的概念“外激素”来反映用户的访问兴趣,提出了一个蚁群导航模型来挖掘用户的兴趣导航模式。首先考虑了页面访问次数、页面访问顺序、网站结构和页面访问时间等因素对用户导航路径模式挖掘的影响,其次,考虑了早期访问者与现有访问者对导航路径模式发现的不同影响,提出了基于蚁群算法的群体用户导航模型,并应用蚁群算法来发现用户偏好的导航路径模式。实验结果表明,与传统算法相比,蚁群算法应用于用户导航推荐的准确性较高,说明蚁群算法揭示的是群体用户的兴趣路径,更能反映用户的浏览偏好。先核惴ㄓτ糜赪使用聚类挖掘领域,提出了一种蚁群算法与惴ㄏ嘟合的方法对访问网站的用户进行聚类。首先介绍了基于群体智能的蚁群聚类算法的四种模型,然后将基于蚁群觅食行为的蚁群算法引入褂镁劾唷R先核惴ǖ囊桓鲋匾L卣魇嵌猿跏过程不敏感,在满足一定的条件下总是能收敛到全局最优解,但是收敛速度较慢;与蚁群算法相对照,甿聚类收敛速度较快,但很可能收敛到一个局部最优解,并且由于初始聚类是随机生成的,其结果受到初始过程的影响。本文提出一种将甿·算法嵌入到蚁群算法中的混合算法,充分利用蚁群算法的全局搜索能力和甿算法的局部搜索能力,并将该算法应用到没Ь劾辔侍獾那蠼庵校笛榻峁砻鞲梅椒ㄊ怯行У模隟聚类算法相比,该方法显著地改善了用户导航推荐的准确性。上述研究在理论上对于蚁群算法的发展具有积极的推动作用,同时也为褂猛诰虻研究提供了一个新的很有前景的方法,在实践上对于提高网站导航推荐的有效性、改善客户服务具有重要的意义。关键词:网站导航推荐;褂猛诰颍灰先核惴ǎ皇樟残裕换峄笆侗穑挥没巳さ己铰肪模式;没Ь劾
瑃..,.瑃,“瓵痭甒瑃瓾痓瑆.,珹瓵簍,.,琣琻,.瑆甇...篢瑃,,’
.甌.,痭猰痠..,瑆琣甌—甌,.,,..’
篧;;;.;籹;
表格