1 / 186
文档名称:

知识管理和文本挖掘的若干问题的研究(可复制毕业论文).pdf

格式:pdf   页数:186
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

知识管理和文本挖掘的若干问题的研究(可复制毕业论文).pdf

上传人:mkt365 2013/12/5 文件大小:0 KB

下载得到文件列表

知识管理和文本挖掘的若干问题的研究(可复制毕业论文).pdf

文档介绍

文档介绍:中文摘要
在当今的知识经济时代,如何更有效地提高企业的知识管理水平,成为了
管理学界的一个研究热点。围绕上述问题,本文对知识管理和文本挖掘的若干
问题进行了深入研究,主要包括以下几个方面的内容
通过对以往知识链模型和知识成长模式的分析,从多种角度提出了新的知
识链模型,使知识链更加完善同时也提出了新的知识成长模式并可以应用
等方法对知识管理系统进行分析、评价,为企业的知识管理提供了一定的
理论基础和实施准则。
提出了一种基于自组织神经网络的文本聚类方法,常用的文本聚类方法一
一平面划分法如均值方法,必须确定聚类种子的个数,且种子选取的好
坏对聚类效果有较大影响。该方法不必预先指定聚类种子数,可以根据聚类的
精度,自动生成合适的新类别,有效地克服了平面划分法的缺陷。并可以通过
调节输入参数来调节聚类的精度。
分别提出了一种基于和网络的文本聚类和文本分类方法,
该方法在构造向量空间模型的过程中引入了理论,这样向量空间中每一维
的含义发生了很大的变化、它反映的不再是词条的简单出现频度和分布关系,
而是强化的语义关系同时向量空间的维数大大降低。基于上述原因该方法可
以有效地提高文本集的聚类或分类的精度和速度。
提出一种基于理论和理论的文本特征降维方法,模式聚合理论从
分类贡献的角度出发,将具有相同分类贡献的特征词条聚合为同一个模式,从
而大大降低了向量维数,提高了分类速度,同时增强了稀有词的作用,提高了
分类精度。隐含语义分析理论的应用,使特征向量维数降低的同时,又在向量
空间模型中引入了语义成分,使向量更能体现文本的内容,从而进一步提高了
文本分类的速度和精度。
关键词知识管理,知识链,文本挖掘,文本分类,文本聚类,特征降维
独创性声明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的
研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表
或撰写过的研究成果,也不包含为获得‘玉建大兰吏或其他教育机构的学位或证
书而使用过的材料一。与我一同工作的同志对本研究所做的任何贡献均己在论文中
作了明确的说明并表示了谢意。
学位论文作者签名朴挪、签字日期少。年子月分日
学位论文版权使用授权书
本学位论文作者完全了解达生叁全有关保留、使用学位论文的规定。
特授权‘玉生大主可以将学位论文的全部或部分内容编入有关数据库进行检
索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校
向国家有关部门或机构送交论文的复印件和磁盘。
保密的学位论文在解密后适用本授权洗明
学位论文作者签名导师签名
签字日期夕“年了月日签字日期声必年月沙日
第一章绪论
第一章绪论
本章首先阐明了本文所选课题的研究背景及其所具有的研究价值,对知识
管理和文本挖掘的基本概念进行了简要介绍,然后着重评述了目前该领域的研
究进展,最后综述了本文的主要研究工作和创新点。
本文的选题背景与研究意义
人类从工业社会向知识社会演进时,政治经济中心正从“生产”转向“发
现、发明和创新”。知识正在成为创新的核心,知识创新成为知识经济发展的最
主要的动力源泉。特别是世纪年代以来,随着和信息技术的
出现和迅猛发展,人类生产和生活中的信息量越来越大,昔日的有形资源和资
产的竞争已经转换为知识资源和资产的竞争,智慧资本取代金融资本成为社会
进步的最主要的动力,人类社会已跨入了知识经济时代。知识经济对物质文明
的发展能够发挥巨大的推动作用,依靠无形资产的投入来实现可持续发展,推
动经济全球化发展。因为经济发展中知识含量的增加,知识管理便成为知识经
济时代的一个不可回避的问题,并成为管理学的一个前沿领域。研究知识管理对
于提高企业的管理水平和核心竞争力具有重要的现实意义。因此,提高企业的
知识管理水平是当前国际社会共同关注的问题。
当前,随着文本信息的快速增长,特别是互联网上文本信息的增加,文本
网页挖掘显得越来越重要文本挖掘己成为一个日益重要的研究领域。由于
挖掘可以在较大程度上解决目前互联网上信息杂乱的现象,方便用户准确地定
位所需的信息和分流信息。因此,文本挖掘已成为一项具有较大实用价值的关
键技术,是组织和管理数据和知识的有力手段,可用于信息检索和知识管理等
领域。文本挖掘已经成为知识管理中知识创建的一个重要部分,主要是处理半
结构化和无结构化的知识,而另一个重要部分是数据挖掘,主要是针对结构化
的知识。
文本挖掘是一项综合技术,涉及、数据挖掘、计算机语言、信息学等
第一章绪论
第一章绪论
本章首先阐明了本文所选课题的研究背景及其所具有的研究价值,对知识