1 / 39
文档名称:

多语种规范子集翻译系统的研究-课件·PPT.ppt

格式:ppt   页数:39页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多语种规范子集翻译系统的研究-课件·PPT.ppt

上传人:aidoc1 2015/10/21 文件大小:0 KB

下载得到文件列表

多语种规范子集翻译系统的研究-课件·PPT.ppt

相关文档

文档介绍

文档介绍:多语种规范子集翻译系统的研究
上海师范大学数理学院
05通信王清
选题依据
机器翻译(machine translation,简称MT)是应用计算机实现从一种自然语言文本到另一种自然语言文本的翻译。它是由计算机来模拟人工翻译的智能过程,是受程序指令控制的一种自动化的翻译系统.
本文研究的多语种子集翻译系统采用一种全新的globlish(Global English)全球语和对应的汉语建立翻译系统的双语词典。由于globlish可以看做是英语的一个子集,所以它简化了很多英语的语法规则,对于专用的翻译系统而言,提高了翻译质量。
本论文主要解决的问题一是建造三个基于globlish的数据库,二是使用顺序混合策略来实现翻译功能。
选题介绍
应用背景

系统实现
研究意义
JUMP
应用背景
自中国加入世界贸易组织后,国际交流日益广泛。如今全球语种多达179种,为了克服交流时的语言障碍,我们常常需要携带专门的翻译人员同行,但这是一种成本颇高,不太便捷的方法。全世界好几个国家已经开始研究机器翻译。然而计算机并不是人脑,机器翻译要实现:实时性强、多语种、整句翻译、多领域等这些强大功能目前还是无法实现的。因此我们的目标是能实现一种领域受限的子语言应用,在这样的子语言环境下(比如旅游系统),要获得高质量的MT是完全有可能的。
系统实现
语言模型
规则库
实例库
词典
知识库子系统
翻译子系统
用户界面
研究意义
近年来,自然语言处理的研究已经成为热点,而机器翻译作为自然语言研究领域的一个重要分支,同时也是人工智能领域的一个重要课题。由于对语言规律本身认识仍然存有不足以及计算机对语言理解的局限性,再加上不同语言之间存在着语法结构、构造方式、语言****惯、社会背景等等的不同,机器翻译的效果与大家所期待的仍有非常大的差距。
本文提出的多语种子集翻译系统,正好是采用globlish语言这种语法规则简单,通俗易懂的特点来克服自然语言的歧义问题这个机器翻译中的大障碍,并采用混合策略的机器翻译方法,从而使得自动机器翻译在某些受限领域有所突破,比如旅游翻译、信息检索、移动电话的短信翻译、电视的字幕翻译、各种信息的多语发布等。
机器翻译的历史发展
MT初创期(从最初MT设想到第一个MT系统的诞生)
第一代MT繁荣期(以直接翻译方法为基础,直到ALPAC报告发表)
低潮期( ALPAC报告发表之后)
第二代MT复苏到繁荣(MT系统大量研制)
第三代新方法(基于统计的技术广泛应用,并与传统的基于规则方法相结合)
国内外研究现状与水平
国外研究现状与水平
国内研究现状与水平
JUMP
国外研究现状与水平
世界上第一台电子计算机问世不久,美国科学家韦弗()和英国工程师布斯()就提出利用计算机进行语言自动翻译的想法。
1954年美国乔治敦大学(etown University)在IBM公司的协同下进行了世界上第一次计算机翻译系统的公开演示,该系统是英俄语机器翻译系统。虽然只有250条俄语词汇、6条语法规则以及49个俄语翻译句,但它向世人展示机器翻译的可行性。
美国的一个专门的组织于1966年发表的ALPAC(语言自动处理咨询委员会)报告使机器翻译完全遭到否定。理性主义(以乔姆斯基为代表)与经验主义的理论之争使语料库的研究停滞了约2O年的时间。
ALPAC报告之后,加拿大TAUM系统采用了典型的转换方法,以天气预报广播为翻译内容的METEO系统正式投入运行,使MT研究者开始重视子语言的实际应用,MT进入新的发展时期。
计算机软硬件技术的飞速发展,计算机语言学的高度重视,统计方法成为解决诸多问题的利器。整个MT研究呈现了基于统计,基于规则,基于语料库多种方法并存、互相结合及补充的局面。
国内研究现状与水平
中国是继美国、苏联、英国之后的第四个开展机器翻译研究工作的国家。在1956年,国家便把机器翻译研究列入了我国科学工作的发展规划。中国最早的机器翻译系统是1959年中国科学院语言研究所和计算技术研究所合作在全国仅有的一台苏联帮助制造的104型电子管计算机上的一个俄汉翻译系统。
中国第二套机器翻译系统仍然是俄汉翻译系统,主要用在机床制造领域。这个系统的词典、语法规则都比较详细,几乎涵盖了俄语所有的语法现象,可惜的是这套系统还没来得及从文档材料变为应用程序,文革就开始了。文革开始后,机器翻译研究就一直处于搁置状态,
1972年中国科学院、北京外国语学院、中国科技情报所以及各部委的情报部门共同参与完成了国内第一套英汉翻译系统的开发(这套系统主要用于翻译国外的文献题录,但限于水平效果并不理想)。
我国于1983年5月由中国中文信息学会组建了自然语言处理专业委员会,主要研究机器翻译。
19