文档介绍:硕士学位论文而簧宦手料技戈孥.№咀蝇艘啦.№且孕∷;⋯⋯.一唧望:堡⋯⋯.学科门类⋯一王学⋯一学科、专业⋯⋯一一垫域剑婆墨基旦动垡⋯⋯一学号⋯⋯.唧熨删题小⒂⑽模俊昏坊閒:品萎吐虫堕堕凰⋯⋯⋯⋯⋯⋯作者姓名⋯⋯扬嚷⋯.指导教师姓名、职务⋯一一赵一一真⋯教援⋯⋯⋯⋯⋯⋯⋯⋯⋯三圭年隆⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯荨代号⋯⋯⋯⋯密级⋯⋯⋯坌一一五⋯⋯⋯面向领域自然语言的文本自动分类
摘要系统将自然语言理解应用于产品设计中,使用自然语言作为产品设计的人机界面,自然语言理解系统对以自然语言形式表达的用户需求进行理解和分析,将最终的分析结果转化成产品设计要求,为后续设计提供支持。在面向领域的自然语言处理系统的前端部分,设置一个面向领域的文本自动分类模块,则后续模块在一个狭义的语义环境中进行分析,意义是显而易见的。首先,根据文本自动分类的功能要求,了解相关的现有的模型和算法。在充分比较它们优点及其存在的不足之后,结合各方面因素,提出了一种串联结构的文本自动分类模型。串联结构的文本分类模型又是由三个基于不同机理的相对独立的文本分类器组成,它们分别是基于概念、基于词频、基于最大熵模型的文本分类器,三种分类器的串联使用,提高了系统的分析效果。它们之间又有一定的关联,基于最大熵模型的分类器使用了基于词频分类器的分析结果,这样则提高了信息的使用率。其次,结合具体的测试领域,将系统应用在机械产品设计的用户需求分析中,并进一步说明面向领域的文本自动分类模块如何融入系统。最后,从理论和工程角度,阐述了面向领域的文本自动分类模块的优点,也指出了一些不足之处,以及在研究中遇到的困难。关键词:领域自然语言理解文本自动分类概念词频特征最大熵目前计算机辅助设计技术对产品设计的早期阶段支持并不充分,本文提到的
..篋醓瑆.,.琭,,,·.—.,
日期』型旦掣日期竺:■日期沙汐声明其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做创新性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或的任何贡献均已在论文中做了明确的说明并表示了谢意。本人签名:关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。C艿穆畚脑解密后遵守此本人签名导师签名
第一章绪论引言如今,我国的经济取得了很大成就,而且增长势头也很猛。为了更进一步增加我国企业的竞争力,我国企业必须加大企业产品附加值,增加其科技含量,使产品更具竞争力。产品设计是生产制造的第一步,是生产制造的基础,后续生产必须根据设计的结果,进行生产产品的活动。产品设计也是生产制造的至关重要的一步,而产品总成本的%以上以及所有的产品性能在产品设计阶段就可以确定,所以说,一个产品设计的好坏直接影响着企业的竞争能力【俊6飞杓剖腔谥J丁⒒信息的设计。产品制造过程中主宰产品竞争力的决定因素是信息和知识要素的增值。因此设计过程就是获取知识、获取信息和应用知识、利用信息的过程。如何快速获取知识、准确及时地获取信息枨笮畔ⅰ⒊杀拘畔ⅰ⒕赫畔⒌、高效率地进行协作交流以及如何快速进行设计成果转化等都是迫切需要解决的问题。然而当前计算机系统对产品设计、制造过程中所需知识、信息的获取、组织、传递及运用仍停留在低水平,这是制约产品创新的瓶颈。人类生命存在的一项基本诉求【俊H艘I妫鸵=猩又谢竦蒙钭柿稀生产不是孤立的个人能够进行的,而是要靠分工和协作。人们要协作就必须保持经常的联系,经常地交换意见、交流思想,而要实现这一点,就必须有合用的交际工具。人类的交际工具有许多种,而其中最重要的就是语言。自然语言是人类社会活动的产物,人类智慧的结晶。它是人类进行信息交流最直接、最重要,也是最有效的一种信息载体。自然语言最直接的表现是语音和文字。计算机诞生至今,其硬件功能不断完善和升级。随着社会的益信息化,计算机的运用也已经非常广泛了。人们自然而然的想法是使用计算机对自然语言处理。用自然语言与计算机进行通信,这也是人们长期以来所追求的。计算机对自然语言处理既有明显的实际意义,同时也有重要的理论意义:人们可以用自己最习惯的语言来使用计算机,而无需再花大量的时间和精力去学习不很自然和习惯的各种计算机语言;人们也可通过它进一步了解人类的