1 / 47
文档名称:

机器学习的英汉字典模糊查询研究与设计开发.doc

格式:doc   大小:5,786KB   页数:47页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

机器学习的英汉字典模糊查询研究与设计开发.doc

上传人:久阅文学 2024/5/16 文件大小:5.65 MB

下载得到文件列表

机器学习的英汉字典模糊查询研究与设计开发.doc

相关文档

文档介绍

文档介绍:该【机器学习的英汉字典模糊查询研究与设计开发 】是由【久阅文学】上传分享,文档一共【47】页,该文档可以免费在线阅读,需要了解更多关于【机器学习的英汉字典模糊查询研究与设计开发 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。机器学****的英汉字典模糊查询研究与设计开发○A基础理论●B应用研究○C调查报告○D其他本科生毕业设计(论文)基于机器学****的英汉字典模糊查询二级学院:信息科学与技术学院专业:计算机科学与技术年级:2010级学号:2010344369作者姓名:苏家辉指导教师:蔡广基副教授完成日期:2014年5月24日基于机器学****的英汉字典模糊查询专业名称:计算机科学与技术作者姓名:苏家辉指导教师:蔡广基论文答辩小组组长:蔡广基成员:王晓晔关心论文成绩:’sfuzzyquerydataandfindsouttheconnectionsbetweenthedata,recordingtheminingmodels,appliesthemtothefuzzyquerysetduringanon-accuratesearching,ordingtothestatisticsatfrequenciesofuser,:Machinelearning。dynamicprogrammingalgorithm。fuzzyquery。、发展的重要领域,它通过研究计算机如何模拟或实现人类的学****行为,通过分析、归纳、综合建立人类学****过程的计算模型或认识模型,基于已有数据识别复杂模式,做出智能化的决策,并将其应用于实际问题中,为解决问题提供可行决策和方案支持[1]。自1980年在卡内基梅隆大学召开第一届机器学****研讨会以来,机器学****的研究工作发展迅猛,已成为人工智能领域研究的中心课题之一。随着机器学****的蓬勃发展,人们在工作中累积了大量可供测试算法的数据集或者超大数据集,机器学****工作者在此基础上可以进行更精准的研究。目前机器学****已经广泛应用于智能搜索、数据分析等领域,如许多大型的搜索引擎网站的智能化的用户体验都是基于机器学****等研究成果实现的。在大数据时代,机器学****研究将会得到更大的发展。,构建机器学****的模型,将其应用到英汉字典模糊查询中。第2节介绍机器学****和模糊查询中的基本思路和实现方法,第3节具体介绍算法实现的设计和数据的处理,第4节编码实现构想,第5节通过一些测试用例验证、完善算法的基本功能,最后一节对本研究做出总结并提出新展望。[2],并将其应用到问题的决策中,其基本过程为:,即获取的数据;,从中提取有趣的模式;,生成知识库,制定决策;,修改、完善知识库。在步骤1中获取的知识是原始的数据或材料,他们看起来可能是杂乱无章的,因此在步骤2需要对数据进行分析,挖掘复杂的隐藏的模式,使用朴素的贝叶斯分类、噪声处理等方法对数据进行分离、提取,然后在将来的决策(步骤3)中使用这些模式去提供方案。但是提取出来的模式也可能是无效的,这就需要步骤4不断地学****新的知识,判定模式是否有效,修改完善知识库。,挖掘那些隐藏的有趣知识?分类是数据分析的一种重要的形式,通过它可以提取重要的数据类型。分类首先要基于现有数据建立一个分类模型,然后根据模型对数据进行分类。分类模型有决策树分类器、贝叶斯分类器和基于规则的分类器等[3]。在英汉字典模糊查询系统,使用的是基于规则的分类器--形如IF-THEN的分类器。规则的IF部分是前提条件,THEN部分是结论。假如用户的某些输入满足特定的条件则可认为是有趣模式。一般情况下,如果用户本次输入的数据在上一次模糊查询的结果集中,则可认为上一次为用户提供的结果集中的对应项是有趣的。如果不满足这一条件则可认为上一次的模糊结果集对用户没有帮助,即为无效数据,丢弃之。英汉字典模糊查询系统的规则分类器实现大体如下:本次是否为精确查询?YESNO上一次是否有模糊结果集?非有趣模式YESNO