文档介绍:同济大学软件学院
硕士学位论文
海量互联网数据挖掘系统的设计与实现
姓名:雷鸣
申请学位级别:硕士
专业:软件工程
指导教师:穆斌;才洪恩
20090901
摘要随着互联网应用的普及,网络生活已经成为一种新的生活方式融入到人们的日常行为中。特别是互联网本身具有联系成本便宜、联系方式多样、并且网络犯罪形式更隐蔽、手段更高明,犯罪证据难以掌握,不易监管的特性,使互联网成为近年来犯罪分子利用的一个主要通道。如何打击日益增加的网络犯罪活动已成为部门面临的严峻课题,为此部门通过不断加大科技投入,提高技术装备的科技含量,及时掌握最先进的数字化信息技术和手段,特别是把对海量互联网数据信息的处理分析工作作为部门新的业务发展方向之一,目的就是为了更好的提高打击互联网上违法犯罪的力度和破案的效率。本论文首先对所研究问题的背景、设计思想进行了论述,阐述了该项目的设计目的、设计原则和应用前景,以及本文所做的主要工作内容。之后论文围绕本系统开发所采用的基本方法和技术进行了讨论,对多层分布式系统开发、技术、数据仓库和数据挖掘技术、际酢⑺阉饕婕际醯幕靖拍詈原理做了简明扼要的论述。接下来在海量互联网数据挖掘系统的分析与设计中,重点对该系统的用户需求、详细设计、系统网络结构、系统功能结构、系统逻辑结构等方面进行了论述,并对该系统的数据库层、应用程序层和客户端层进行了分析、设计,并给出了具体的系统实现方法、系统部分模块的功能说明及详细设计、接口模块的代码实现等。随后讨论了系统数据挖掘的数学模型和多元搜索引擎的实现。最后对论文取得的研究成果进行了全面的总结,强调了海量互联网数据挖掘系统在实际应用与理论结合方面的特色和创新之处,并提出了实际应用系统目前存在的缺陷与今后改进的研究方向。本文的特色是从如何发挥海量互联网数据在监管与执法部门日常业务中的应用,有力打击网络犯罪,提高监管与执法部门的工作效率入手,引入数据挖掘、智能搜索引擎等多种先进的计算机与互联网技术,自动实现对海量互联网数据的查询分析、二次比对、扩线联想、统计分析功能。文中对海量互联网数据挖掘系统涉及的理论基础、具体技术、设计原则、功能模块等方面均有详细的介绍和论述。其创新这处在于提出了概念搜索的观点,并给出了具体的实现方法。
关键词:网络犯罪多层分布式应用数据挖掘阉饕摘要
甌,琩,,.,痙,琣琣琲’.,.,.瑃
猶,,;籗琫:痺.,甌瑂,篒籑—籎籇
学位论文版权使用授权书本人完全了解同济大学关于收集、保存、使用学位论文的规定,同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存论文:学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。学位论文作经指导教师同意,本学位论文属于保密,在年解密后适用本授权书。指导教师签名:学位论文作者签名:年月日
同济大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均己在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。签名:年月日
。众所周知网络以其信息传播速度快,传播方式灵活,传播范围广泛等诸多优势给传统媒体以强烈的冲击。也正是因为网络具有的这些优势,使违法犯罪分子有了更加方便的工具从事犯罪活动。同时网络犯罪也给执法和监管部门增加了打击犯罪的难度,因为网络是一个虚拟的传播媒体,在网络上活动的人都可以有一层神秘的面纱,增强了犯罪分子的隐蔽性。如何在互联网上有效的控制、打击网络犯罪,已成为部门面临的严峻课题,为此部门通过不断加大科技投入,提高技术装备的科技含量,及时掌握最先进的数字化信息技术和手段,特别是把对海量互联网数据信息的处理分析工作作为部门新的业务发展方向之一,目的就是为了更好的提高打击互联网上违法犯罪的力度和破案的效率。海量互联网数据挖掘系统是一个可以有效发现网络犯罪线索、获取网络犯罪证据、搜集利用互联网进行危害国家安全、公共社会安全以及社会政治稳定的预警性情报信息的一种侦察办案工具。它通过从互联网上透明采集原始网络数据,实时加以还原分析,并根据执法部门的业务需要,进行情报分析、案件侦察、深度数据挖掘等方面的工作,从而有效打击各种互联网犯罪活动。为有效监管和打击各种互联