文档介绍:华东师范大学
硕士学位论文
基于关联规则的六度分隔系统设计与实现
姓名:潘玲琳
申请学位级别:硕士
专业:计算机应用技术
指导教师:黄国兴
20070101
摘要以┛、标签缁嵬服务蛞仔畔⒕酆、。。疽谰萘确隔理论建立,以认识的朋友欢裙叵等为基础,在已有朋友的基础上扩展自己的关系网恢亮裙叵,从而得到强大而有效的社会资源。六度分隔系统是旧系囊桓鲇τ茫镏没г赟网站的用户群中寻找、建立稳固的一至六度关系,使用户在六度关系之上进行广泛的社会及商业应用。由于是新事物,目前国内外对六度关系的建立采取传统的关键字搜索,所建立的六度关系“脆弱”,不能体现母鲂曰蜕缁峄枨螅皇沟昧裙叵翟诠δ苌喜针对实际应用需求,本文将数据挖掘领域中最重要的两个技术:关联规则挖掘技术和分类技术,结合权重的思想,开创性地应用到确指舻氖迪稚来。这个系统工作在客户端,利用关联规则技术挖掘用户的潜在交友模式,综合使用“系统评级”和“个性化评级”对属性进行加权,提高了挖掘规则的准确性;使用了规则加权的分类技术对规则进行修剪。为用户提供了:腥ㄖ氐囊欢裙叵等耍沽裙叵蹈陆⒃诳煽康囊欢裙叵抵希莶煌掷喙嬖蚨酝灸吧没Ы蟹掷啵褂没Э梢曰谡庋姆类群发针对性的邮件,实现社会目的挥和商业目的乒闵唐。本文的主要研究工作和创新包括:诙杂没Щ拘畔⒌拇砩希悸堑酵诰虻耐暾裕岢隽苏攵员鞠低特点的文本属性概化、数值属性聚类及关联度加权补齐空缺值的方法;诩尤ɡ喙亓9嬖虻耐诰蛏希悸堑酵诰虻淖既沸裕褂谩跋低称兰丁和“个性化评级”综合反馈用户信息,提出属性加权的类关联规则挖掘算法,以提高类关联规则的精确性;谟没Х掷嗟氖迪稚希褂眉尤ǚ掷嗉际醵岳喙亓9嬖蚪屑尤ㄐ藜簦改进了传统的惴ǎ唇ㄕ攵愿鋈擞没У姆掷嗥鳎诰虼腥ㄖ的一度关系人;擞靡陨霞际跎杓撇⑹迪至嘶诠亓9嬖虻牧确指粝低场与传统的六度分隔系统相比,基于关联规则的六度分隔系统具有智能程度高和针对性强的特点,适应了用户个性化需求,有着很好的实际应用价值。能发挥应有的强大作用。华东师范大学计算机科学技术系年硕士毕业论文.
关键词:确指簦亓9嬖颍掷啵呕劾啵珻华东师范大学计算机科学技术系年硕士毕业论文Ⅱ
.啪瓸琓,琖鷈.,..,;·“’’皌甒痵”,瑃琲瑃·】【.瓹:甌,;甊“痶甀緂:.
啪:珻珻,.,.,,华东师范大擎计算杌科学技术系年硕士毕业论文瓺.,.
日期:,除文中已经注明引用的内容外,,:学位论文授权使用声明本人完全了解华东师范大学有关保留、使用学位论文的规定,:日期:
第引言随着信息技术革命的进行,.诔晌5毕碌娜鹊恪;チM谋硐中式和后台技术架构的重构,使得传统的互联网门户网站已经跟不上发展的脚步,。ǔ晌;,但是大多体现在给整体用户提供一类的方案,而不能针对每个用户。。不难发现,⒘看蠖稚ⅲ个性化的需求成为数据挖掘应用的绝佳机会。。疽匀鲜兜呐笥盐;。自己的人脉:分享共同的兴趣爱好拱晖、拓展商务人脉B缂、为求职做准备肆M等。从社会和商业需求的角度来看,呛枚鳎拦虺芕公司谀诘男矶喙谕夥缦胀蹲公司,均表示出对镜那苛彝蹲市巳ぁ尽А5谴邮迪纸嵌榷裕鯯网站的难度也不小,大致集中在以下三个方面:“廉价的六度关系”;目前窘⒑糜训哪J接辛街郑渲幸恢是静态地将用户与用户认识的人建立维度关系。单纯地把认识的人的认识的人变成自己的朋友,这样简单地串联起来,而不是通过挖掘其兴趣、工作、背景等相关信息建立强而有效的维度关系,忽略了钪匾5特征,将具备相关兴趣的人聚集在一起。“单纯的关键字搜索”:目前窘⒑糜训牡诙帜J绞枪丶搜索。如果一个银行信贷员想在局兴阉饕恍┣痹诳突С晌:友,他只能通过搜索关键字:如杖、拔等属性来寻找满足条件的客户。但是,、等属性都属于个人隐私属性,一般用户不予以公开;如果网站予以公开,搜