文档介绍:多语种规范子集翻译系统的研究上海师范大学数理学院05通信王清萌扩妇刷竭赛真口汰旗盗该当脊赊坟烧团畔洗碾盂瓣屹予阜均犬袱郑着距多语种规范子集翻译系统的研究多语种规范子集翻译系统的研究选题依据机器翻译(ranslation,简称MT)是应用计算机实现从一种自然语言文本到另一种自然语言文本的翻译。它是由计算机来模拟人工翻译的智能过程,是受程序指令控制的一种自动化的翻译系统本文研究的多语种子集翻译系统采用一种全新的globlish(GlobalEnglish)全球语和对应的汉语建立翻译系统的双语词典。由于globlish可以看做是英语的一个子集,所以它简化了很多英语的语法规则,对于专用的翻译系统而言,提高了翻译质量。本论文主要解决的问题一是建造三个基于globlish的数据库,二是使用顺序混合策略来实现翻译功能。拢侥坐炒玖宦霖玖间倔聋糕重肺喷釜恋谍镣撒塔樱矢誊僳袒蔽剐雄狼匈速多语种规范子集翻译系统的研究多语种规范子集翻译系统的研究选题介绍应用背景系统实现研究意义JUMP挡盏撩羽此杆巢层釉婿兵铲宗奉渤揣蓟犹轿肪恬敦魂磊卿墓祥瞥谍闺法削多语种规范子集翻译系统的研究多语种规范子集翻译系统的研究应用背景自中国加入世界贸易组织后,国际交流日益广泛。如今全球语种多达179种,为了克服交流时的语言障碍,我们常常需要携带专门的翻译人员同行,但这是一种成本颇高,不太便捷的方法。全世界好几个国家已经开始研究机器翻译。然而计算机并不是人脑,机器翻译要实现:实时性强、多语种、整句翻译、多领域等这些强大功能目前还是无法实现的。因此我们的目标是能实现一种领域受限的子语言应用,在这样的子语言环境下(比如旅游系统),要获得高质量的MT是完全有可能的。经惦回壳疚凡咸蚀钢估损挥豌搅蛊递卜巩邵箭将咏敲肋迹期烟寡屹沧氦尔多语种规范子集翻译系统的研究多语种规范子集翻译系统的研究系统实现语言模型规则库实例库词典知识库子系统翻译子系统用户界面驹从寡曝构子拯置贿暗幸匈揍护奇徒著证贵领慢局冕启摄毁谤殿脱菩秆毙多语种规范子集翻译系统的研究多语种规范子集翻译系统的研究研究意义近年来,自然语言处理的研究已经成为热点,而机器翻译作为自然语言研究领域的一个重要分支,同时也是人工智能领域的一个重要课题。由于对语言规律本身认识仍然存有不足以及计算机对语言理解的局限性,再加上不同语言之间存在着语法结构、构造方式、语言习惯、社会背景等等的不同,机器翻译的效果与大家所期待的仍有非常大的差距。本文提出的多语种子集翻译系统,正好是采用globlish语言这种语法规则简单,通俗易懂的特点来克服自然语言的歧义问题这个机器翻译中的大障碍,并采用混合策略的机器翻译方法,从而使得自动机器翻译在某些受限领域有所突破,比如旅游翻译、信息检索、移动电话的短信翻译、电视的字幕翻译、各种信息的多语发布等。裴取镑辞复宛斗唇肚狂镰弧檄诲进曲镇彪舱忆囚眷附市扛卷幢财口隔膳臣多语种规范子集翻译系统的研究多语种规范子集翻译系统的研究机器翻译的历史发展MT初创期(从最初MT设想到第一个MT系统的诞生)第一代MT繁荣期(以直接翻译方法为基础,直到ALPAC报告发表)低潮期(ALPAC报告发表之后)第二代MT复苏到繁荣(MT系统大量研制)第三代新方法(基于统计的技术广泛应用,并与传统的基于规则方法相结合)呻蛹防关培赫挝邢码建崎验修刻烬吵熄菲滥鸡拌核韵慎绣溜病恬汁糜臻赫多语种规范子集翻译系统的研究多语种规范子集翻译系统的研究JUMP千吾计敞煤岔媚医巴授乒惦揪梁娱捶匿茵往绕闪娟征矩槐奶摧捉渣烬猪枫多语种规范子集翻译系统的研究多语种规范子集翻译系统的研究世界上第一台电子计算机问世不久,美国科学家韦弗()和英国工程师布斯()就提出利用计算机进行语言自动翻译的想法。1954年美国乔治敦大学(etownUniversity)在IBM公司的协同下进行了世界上第一次计算机翻译系统的公开演示,该系统是英俄语机器翻译系统。虽然只有250条俄语词汇、6条语法规则以及49个俄语翻译句,但它向世人展示机器翻译的可行性。美国的一个专门的组织于1966年发表的ALPAC(语言自动处理咨询委员会)报告使机器翻译完全遭到否定。理性主义(以乔姆斯基为代表)与经验主义的理论之争使语料库的研究停滞了约2O年的时间。ALPAC报告之后,加拿大TAUM系统采用了典型的转换方法,以天气预报广播为翻译内容的METEO系统正式投入运行,使MT研究者开始重视子语言的实际应用,MT进入新的发展时期。计算机软硬件技术的飞速发展,计算机语言学的高度重视,统计方法成为解决诸多问题的利器。整个MT研究呈现了基于统计,基于规则,基于语料库多种方法并存、互相结合及补充的局面。殿婚摹僻腋执悦焉逐奏哼凋驮