1 / 59
文档名称:

基于社交网络的数据挖掘的研究.pdf

格式:pdf   页数:59页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于社交网络的数据挖掘的研究.pdf

上传人:gd433 2016/6/21 文件大小:0 KB

下载得到文件列表

基于社交网络的数据挖掘的研究.pdf

文档介绍

文档介绍:西安电子科技大学学位论文创新性声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切的法律责任。本人签名: 日期西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。(保密的论文在解密后遵守此规定) 本人签名: 日期导师签名: 日期万方数据摘要摘要随着计算机技术的快速发展,我们生活在一个数据快速增长的年代。每天都有来自商业、科学等各个不同领域以及我们日常生活的数千兆兆字节存储于计算机网络、万维网和各种数据存储设备。数据爆炸式的增长、巨大的数据量使得当今的时代成为一个真正的数据时代。信息技术自然进化促发了数据挖掘技术的产生。数据挖掘可从海量数据中挖掘出有趣的模式和知识。数据挖掘可应用与金融数据分析、零售业、电信业、生物学数据分析以及其他科学应用。在互联网上,用户使用的最多的就是社交网络。人们在社交网络上分享信息, 海量的数据为数据挖掘提供了前提条件,采用数据挖掘技术,可挖掘出数据之间存在的潜在信息。数据挖掘中的聚类分析可以将相似度较高的用户数据聚成一个类。本文先用Python从社交网络新浪微博上提取热门话题和参与话题的用户信息,然后采用分级聚类算法对提取的热门话题进行聚类。本文还采用另外一种算法:协作型过滤算法对提取的数据进行分析。最后将两种算法的结果进行分析比较。通过得出的结果可对用户推荐属于同一类的话题,或者推荐经过分析得出的用户最感兴趣的话题,从而可以使得新浪微博的话题功能使用率更广。关键词:数据挖掘社交网络数据提取聚类分析Python 万方数据 Abstract Abstract With the rapid development of computer technology, we are living in an era of large amounts of data, which is still increasing. There are several petabytes from business, science, social, medical, and our daily lives inject puter networks, data storage devices, and the World Wide Web. Explosive growth and the huge amount of data make this era e a true data era. Data mining can be looked as the result of natural evolution of information technology. Data mining can dig out interesting patterns and knowledge form massive data. It can be applied to financial data analysis, retail, munications, data analysisin biology and other scientific applications. In the , one of the most use of field is social network. People share information with friends in social network, vast amounts of data provide conditions to data mining. Using data mining technique candig out the potential information. The clustering analysis in