文档介绍:中文摘要随着姆⒄梗瞎何铩⒌缱诱瘛⑼闲畔⒓焖鞯然疃找嫫捣保人们对网络服务的需求成为网络发展的巨大动力。但面对网上巨大的数据量和众多的网站,人们在选择网络服务二检索信息时往往感到无从下手,如何使网络服务适应不同用户的个性化需求已成为网络服务提供者急切关心的问题。要满足用户的个性化需求,关键的问题是如何发现用户的访问模式,对惺萃掘的目标之一就是要发现用户的访问模式。萃诰蚩煞治H掷嘈停矗篧使用挖掘、峁雇诰蚝蚖内容挖掘,而挖掘用户的频繁访问序列是发现用户的访问模式的主要方法,也是褂猛诰虻囊幌钪匾H挝瘛使用挖掘可以从罩净蚍梦收叩男形中发现知识,并且可以从不同用户的访问中发现不同用户的行为之间的内在关系。挖掘的结果可以用于改进镜愕纳杓坪拖蛴没峁┓竦姆绞剑跃可能地满足不同用户的需求。本文在深入研究了、数据库的设计特点和罩就诰虻囊延兴惴ḿ捌湎喙刂J兜幕∩希栽瑼惴ń了改进。在罩就诰蚬讨校ü訵日志数据按“用户维’’进行切片,不仅可以将所有用户看作一个整体进行挖掘,而且还实现了对不同的用户个体的行为进行独立地挖掘,从而使挖掘出的结果能够满足对用户个性化使用的需求。这一改进同时实现了对罩镜脑隽客诰颍苟訵日志的动态挖掘成为可能。实验表明,改进后的算法较原算法减少了挖掘过程中候选集的大小和对数据库的扫描次数,使时空效率得以提高。针对表示和存储挛褚U加么罅磕诖妫约癆类算法在挖掘过程中要产生大量候选集和对数据库进行频繁扫描的缺点,本文提出了挛癖码技术和逆一惴ā事务编码技术使用一个数字表示一个挛瘢可以对挛袷菘饨醒顾酰跎倌诖娴恼加茫欢嬉籄算法可以反向获取用户的最大频繁访问序列,并在此基础上发现关联规则,避免了类算法逐次产生候选频繁项集的烦琐过程。通过分析用户浏览网页的行为和网站对用户请求的反应,本文还提出了利用用户访问网页的驻留时间进行罩就诰虻姆椒āWち羰奔浞从沉擞没т网页的行为,通过在挖掘前设定用户访问网页的驻留时间的区间值,使挖掘者可以选择和缩减挖掘的范围,提高了挖掘算法与使用者之间的交互能力。基于这一思想的新算法,首先通过对罩镜脑ご恚凶ち羰奔涞腤访问记录集,然后以驻留时间为限制条件,构建驻留时间频繁访问序列树,用以存储Ⅱ
则,推导出用于模糊神经网络分类算法的交叉熵函数准则,同时构建了新的激活局部极小点。新的激活函数的优点在于不仅可以取到值,而且还具有根据总误差调节函数曲线斜率的能力,加快了算法的收敛速度,提高了算法的效率,噪声与扭曲并不敏感,从而使该方法具有鲁棒性的特点;另一方面该匹配方法简化了预处理过程,具有较高的效率。通过准确识别用户,克服了现有逑和压缩带有驻留时间的数据库,并记录网页的支持数量。最后以驻留时间频繁访问序列树为挖掘对象,在最小支持度的限制下,通过采用深度优先的方法对驻留时间频繁访问序列树进行遍历,发现用户访问网站的驻留时间最大频繁访问序列,对比实验表明该算法对罩就诰蛴薪细叩男省模糊神经网络是数据挖掘研究领域的又一大热点问题。本文依据最大似然原函数。基于交叉熵准则和新的激活函数的模糊神经网络分类算法与基于误差平方和准则的算法相比,有更快的学习速率而又不致使学习过程失稳,不易陷入改善了算法的动态性能。最后,本文提出了引入生物信息技术解决诰蛑械挠没侗鹞侍獾纳想,并提出了基于隐马尔科夫模型构建虹膜识别系统的方法,该方法仅需要虹膜的方向域作为输入参数,与需要许多虹膜细节的常规方法相比,它对虹膜图像的无状态的缺陷,可以实现对罩臼莅础坝没星衅虼瞬唤隹以将所有用户看作一个整体进行挖掘,而且还可以对不同用户的个体行为进行独立地挖掘,从而使挖掘出的结果能够满足对用户个性化使用的需求。这一设想实施后,还能够实现对脑隽客诰颍佣苟訵日志的动态挖掘成为可能。关键词:用户维,罩颈嗦耄妫瓵惴ǎ匙ち羰奔洌徊骒函数准则,激活函数,生物信息识别●
,琫..,.瓸,..痶琤.,,,,
淘宝网购物商城淘宝网购物/
,..瑆甌狝琒痯‘痳,,痳,瓸,‘,.瑃.,.瑃.,.,琤甋疭,,
淘宝网购物商城淘宝网购物/
硒篣。,.瑃瑂琤..珽,‘,,,,Ⅵ
淘宝网购物商城淘宝网购物
力年沙弓月口/独创性声明学位论文版权使用授权书或撰写过的研究成果,也不包含为获得墨鲞盘堂或其他教育机构的学位或证δ昕诠耾/日鑫洼盘堂特授权鑫鲞盘堂可以将学位论文的全部或部分内容编入有关数据库进行检口夕年护多月∥/同本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中学位论文作者签名:有关保留、使用学位论文的规定。索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘