1 / 12
文档名称:

数据挖掘课程论文.doc

格式:doc   大小:205KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘课程论文.doc

上传人:d9ljze6 2017/2/21 文件大小:205 KB

下载得到文件列表

数据挖掘课程论文.doc

文档介绍

文档介绍:中南林业科技大学课程论文院系理学院专业信息与计算科学课程名称数据挖掘论文题目面向社会网络分析的数据挖掘方法姓名王磊学号 20104255 指导教师孙玉荣 2013 年 10月面向社会网络分析的数据挖掘方法摘要随着信息技术的发展,越来越多的社会关系数据被收集。如果能够有效地对它们进行分析,必将加深人们对社会学的理解,促进社会学的发展。但是数据量的增大同时对分析技术提出了巨大的挑战。如今社会网络的规模早已超出了原有分析手段的处理能力,必须借助更为有效的工具才能完成分析任务。数据挖掘作为一种帮助人们从海量数据中发现潜在有用的知识的工具,在很多领域发挥了重要的作用。社会网络分析又称为链接挖掘,是指用数据挖掘的方法处理社会网络中的关系数据。本文对数据挖掘和社会网络分析中的一些方法进行了介绍并对数据挖掘算法在社会网络分析的应用进行了概括。关键词:设会网络分析;数据挖掘;链接挖掘 ,这些数据实例往往可以用一个包含多个属性值的向量来表示,同时这些数据实例之间假设是统计上独立的。例如要训练一个疾病诊断系统,它的任务是诊断一个被试者是否患有某种传染病。传统的学习算法用一个向量来表示一个被试者,同时假设两个被试者之间的患病情况是相互独立的,即知道一个确诊病人对于诊断其他被试者是否患病不能提供任何帮助。直观经验告诉我们这种假设是不合理的。直到二十世纪 30年代, Jacob Moreno 和哈佛大学的一组研究人员分别提出了社会网络模型来分析社会学中的现象和问题。现代社会学主要研究现代社会的发展和社会中的组织性或者团体性行为。社会学家发现社会实体之间存在着相互的依赖和联系,并且这种联系对于每个社会实体有着重要的影响。基于这样的观察,他们通过网络模型来刻画社会实体之间的关系,并进一步用来分析社会关系之间的模式和隐含规律。为了更好的研究这个问题,他们试图用图结构来刻画这种社会网络结构。一个社会网络由很多节点( node ) 和连接这些节点的一种或多种特定的链接( link ) 所组成。节点往往表示了个人或团体,也即传统数据挖掘中的数据实例,链接则表示了他们之间存在的各种关系( relation ),如朋友关系、亲属关系、贸易关系、性关系等。由于数据收集方式的限制,早期的社会网络局限于一个小的团体之内,往往仅包含几十个结点。借助于图论和概率统计的知识,人工处理可以从中分析出一些简单的性质和模式。但是,随着现代的通信技术的发展,越来越多的数据被收集和整合在一起,建立一个大的社会网络成为可能。例如,可以通过电子邮件的日志来建立使用者之间的联系网络,或者通过网络日志及网络通讯录等方式将用户提交的联系人信息建立社会网络。所以,现在的社会网络规模比早期网络庞大, 通常包含几千或者几万的结点,甚至有多达百万个结点的网络。面对这样庞大复杂的网络,简单的数学知识和原始的人工处理已经不可能进行有效的分析。数据挖掘是从巨量数据中发现有效的、新颖的、潜在有用的并且最终可理解的模式的非平凡过程。数据挖掘就是为了解决当今拥有大量数据,但缺乏有效分析手段的困境而出现的研究领域。目前,已经在包括生物信息学,自然语言处理等许多方面发挥了巨大的作用。与传统的数据挖掘只关注数据实例不同,社会网络分析对链接同样关注。从数据挖掘角度,社会网络分析又称为链接挖掘( link mining )。通过对链接的挖掘我们可以获得关于实例更丰富(如某个实例在整个网络中的重要性)、更准确(如预测某个实例所属的类别)的关系数据( relational data )。社会网络分析是关系数据挖掘的主要应用。关系数据挖掘的发展为社会网络分析提供了更有力的工具,促进了社会网络分析的发展。本文分析了社会网络分析数据的方法以及任务和需求,介绍了几类适于社会网络分析的数据挖掘算法。 2. 社会网络和数据挖掘方法介绍 社会网络分析方法社会网络分析是一套用来分析多个个体通过相互联系构成的网络的结构,性质以及其他用于描述这个网络的属性的分析方法的集合。如社会网络分析方法提供了根据网络中节点的联系紧密情况将网络分层的方法,网络中节点相互作用模式识别,将网络分块,给用户评级,信息扩散,对社会网络提供图形描述,中心度的分布等。下面我们介绍社会网络分析最重要的两个模型,用户——用户网络模型和用户——事件网络模型 数据挖掘方法数据挖掘(Data Mining) 就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与数据挖掘相近的同义词有数据库中的知识发现(KDD Knowledge Discovery inDatabase) 、数据分析、数据融合以及决策支持等。这个定义包括好几层含义:数据

最近更新

2025年度茶楼茶具定制与转让合同 9页

尘彯一以绝-招隐溪足言—钱选戾家思想对其绘画.. 1页

2025年度绿色环保土地大棚租赁服务协议 10页

2025年度电子设备安全操作个人协议 8页

金融体系的构成 27页

2025年度热水器产品环保标准认证合同 9页

2025年度汽车维修店环保设施与技术改造转让合.. 11页

2025年度服装经销商返点奖励协议书 7页

重症病人营养支持 69页

2025年度新型钢结构材料研发与推广合作协议 9页

2025年度数据中心冷却系统电工临时用工合同 7页

2025年度手设备快充技术许可与市场推广合同 8页

2025年度房产买卖合同争议解决机制范本 8页

2025年度应收账款质押登记及税务筹划服务协议.. 7页

2025年度小产权房买卖合同三方房产租赁及买卖.. 9页

2025年度安防消防展览会现场服务合同 9页

酶促反应动力学 31页

2025年度回迁房屋买卖风险评估与资金监管合同.. 8页

2025年度合作社流转土地农业节水灌溉项目合同.. 9页

对支架模板早拆体系的试验研究及有限元分析 2页

2025年度办公楼电梯及公共区域保洁服务合同 8页

部编版二年级语文上册第五单元复习资料 8页

2025年度公司股权激励与绩效考核协议模板 8页

2025年度健康养生中心会员消费合同协议书 7页

最新个人担保合同草案 6页

2025年度互联网金融服务商业合同 10页

智能化系统安装合同范本全能版 6页

旅游合同新趋势:这些变化你必须知道 6页

新进员工培训服务合同 6页

通用质量管理分析 19页