1 / 287
文档名称:

日本土木工程手册 钢结构.pdf

格式:pdf   页数:287页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

日本土木工程手册 钢结构.pdf

上传人:精品库 2016/1/12 文件大小:0 KB

下载得到文件列表

日本土木工程手册 钢结构.pdf

文档介绍

文档介绍:ISSN1009-puterKnowledgeAndTechnologym..M~,,November2008,—793文本挖掘研究及发展胡冰,胡东军,马文超E-.CBeh+86—55l一56909635690964(;,周口鹿邑477262)摘要:文本挖掘是对具有丰富语义的文本进行分析从而发现隐含的,令人感兴趣的,有潜在使用价值知识的过程,是数据挖掘的一个新兴主题本文首先介绍数据挖掘的定义及其发展,进而叙述文本挖掘的含义,回顾国内外文本挖掘的研究现状,着重论述文本分类与文本聚类的一般过程并指出它们的区别之处。最后指出中文文本挖掘的特点,展望了今后的研究目标。关键词:数据挖掘;文本挖掘;文本分类;文本聚类中图分类号:TP31文献标识码:A文章编号:1009—3044(2008)31—0792--—chao(puterDepa~ment,HenanUniversity,Kai~i475004,China;,Zhoukou477264,China)Abstract:TextMiningisanew'topicofDataMining,,itintroducetheconceptanddevelopingofDataMiningThenpointoutTextMininganditsstatus,,:datamining;text1tuning;textclassification;textclusteringl引言数据挖掘(DataMining)(这一词由UsamaFayaadg,于1995年在加拿大蒙特利尔召开的第一届“知识发现和数据挖掘”国际学术会议上第一次提出)是一门很广泛的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。数据挖掘或数据库中的知识发现KDD(KnowledgeDiscoveryinDatabases1比较公认的定义是由WilliamJFrawley,GregoryPiatet—sky—Shapiro和UssmaMFayyad等人提出的数据挖掘就是从大型数据库中提取出人们感兴趣的知识。这些知识是隐含的、先前未知的、对决策有潜在价值的,提取的知识表示为概念(Concepts)、规~(Rules)、规律(Regularities)、和模式(Patterns)等形式。随着数据挖掘研究的发展,数据挖掘的对象己远远超出了数据库的范围,数据源还可以是数据仓库、文本数据集合,数据集、文档或任意数据集合等。互联网的普及和飞速发展,成为世界上最大的信息积聚地,积聚的信息不同与以往的数据挖掘源,其内容大多是半结构化或非结构化的文本。如何有效的对半结构化或非结构化的文本信息进行挖掘即文本挖掘已成为当今热门的研究方向。,引起了人们的极大兴趣,同时,它也是一个富于争议的研究方向,目前其定义尚无统一的结论,需要国内外学者开展更多的研究以便进行精确的定义。般来说,文本挖掘(TextMining,TM)和文本数据库巾的知识发~(KnowledgeDiscoveryinTextualDatabase,简称KDrI’1被认为是具有相同含义的两个词,最早由RonenFeldman等人提出[11:TheProcessofextractinginterestingPatternsfromvcrylargetextco11ec—tionsforthepurposeofdiscoveringknowledge”,50年代末,,提出了词频统计思想用于自动分类。1960年,MaronE】发表了关于自动分类的第一篇论文,随后,众多学者在这一领域进行了卓有成效的研究工作。研究主要有围绕文本的挖掘模型j、文本特征抽取与文本中间表示、文本挖掘算法(如关联规则抽取、语义关系挖掘、文本聚类与主题分析、趋势分析1、文本挖掘工具等,其中l引首次将KD