1 / 56
文档名称:

人工智能课件.ppt

格式:ppt   大小:72KB   页数:56页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

人工智能课件.ppt

上传人:qiang19840906 2020/9/23 文件大小:72 KB

下载得到文件列表

人工智能课件.ppt

相关文档

文档介绍

文档介绍:第3章机器翻译方法机器翻译的处理对象是自然语言,而人类对于语言认知的过程还未研究清楚,因此,要实现理想、高质量的机器翻译至少目前还有较大的距离。机器翻译是21世纪要解决的科技难题之一,主要困难是自然语言在各个层次上的歧义性。解决歧义问题很难从根本上突破,它将涉及到处理的难度和翻译的速度,翻译的复杂性,因此,寻求简单的翻译方法是一个重要课题,它可以降低歧义处理难度,增加解决这一科技难题的希望。自然语言的机器翻译目前一般以句子为翻译单位。句子又分为句、短语、词三个层次。分析阶段一般分为词法分析、句法分析、语义分析、语境分析、语用分析等,其中以词法分析和句法分析为主。面对这么多而复杂的分析模块(机器翻译中,每一种分析组成一个软件模块),面对这么庞大的软件系统,研究者必须有清晰的思维、正确的切入点,才可能把翻译软件设计得好一些,再好一些。基于这样的认识,本章将首先讨论现有的机器翻译方法,并把重点放在基于实例的机器翻译上。,把一个源语言句子译成目标语言句子,涉及到四个基本操作:目标语言单词的检索、调序、删词、增词;机器翻译系统的操作过程也不例外,有检索、分析、转换和生成的主要四个阶段。这被称为基于分析和转换的机器翻译系统。也被认为是模拟人类翻译活动最恰当的机制。基于分析和转换的机器翻译方法就是自动实现源语言到目标语言的转换,它采取了一系列的分析和转换的生成层次,使一个源语言句子经过不同的中间表达形式,最终达到目标语言句子的表示。其目的是尽可能地加深对源语言的理解,生成尽可能恰当的目标语言形式。这种方法比较全面地体现了语言学知识在机器翻译中的应用,是了解机器翻译实现过程的非常合适的模式。在“机器翻译的常规步骤”实际上已经慨略的介绍了这一方法的全过程,这里再补充阐述一些内容:句子经过分析阶段之后,进入转换和生成阶段。这两者一般联系得比较紧密,有时无法严格区分,因为转换到目标语言也就是要生成目标语言的词汇、短语、句子。可以把句子结构的转换也就是源语言的句法树转换长合适的目标语言对应形式当作转换,而后续的许多处理都当作生成阶段的处理步骤看待。实质上,机器翻译方法对语言的处理就是在两种语言之间搭一座桥,实现一种语言到另一种语言意义等价的转换。它并非象自然语言理解那样只是对一种语言的操作,只需作针对一种语言的分析。作为一个机器翻译系统,它既要考虑源语言的语法和语义规律,也要考虑目标语言的这方面规律,忽略了任何一方都是不行的。也就是说,对于双语互译规律的发现和应用才是机器翻译最本质的特征。所以,在词、短语和句子这三个层次上寻找源语言的目标语言翻译的等价物是机器翻译中转换与生成的任务。通常,机器翻译的研究中将转换看做整个翻译过程中的一个阶段。然而,在语义结构上进行转换却是一种好的方式。语义结构可以是跨语言的,有能力同时应用于分析和生成。另一方面,当机器翻译系统的翻译语言对扩展时,还可以应用于多种不同的语言。但要注意,大规模的自然语言语义描述相当复杂,因而在机器翻译系统中的应用往往会受到限制,难以采用这样的语义表示作为转换的基本结构。一般情况下,分析以句法为主、语义为辅,正确的句法结构转换加正确的词汇译文可以从源语言向目标语言传递完整的正确信息。因此,以句法结构转换附加上一定的语义信息,能够构成转换的基本层次。不足之处是:因为句法分析的结果是面向源语言的,而要生成合适的目标语言译文,转换部分常常引入许多目标语言方面的约束,使得转换规则变得复杂了。就标准的机器翻译系统来说,句子和短语层次的结构转换是机器翻译转换部分的研究重点。通常使用转换规则,就可以实现源语言句法结构到目标语言句法结构的转换。这方面一般采用产生式方式的转换规则形式:S:S1+S2+…+Si<C1C2…CK>→T1+T2+…+Tj:T上式理解为:S是SL(源语言)的某个待翻译单位(句子、短语等等),S1~Si是S中的下一级组成单位;对于S,如果满足条件<C1C2…Ck>,则TL(目标语言)中有T1~Tj译文构成了相应的等价物T。这样的方法有两个特点:一是面向源语言分析,因为源语言中的一个句子已经由句法、语义分析等阶段分析完毕,生成了关于源语言句子的某种中间表示,转换以这种源语言中间表示作为输入;二是直接转换,即对于S表示,直接给出译文形式,一般不需要在目标语言内再作进一步转换,T1~Tj可以直接包括目标语言的词汇,也可以是对应于S1~Si的译文组块。上述方法称为基于句法的转换方法,因为S1+S2+…+Si一般来说就是源语言的的句法结构表示;也可以称为直接转换方法,因为对于每个源语言的翻译组块,都马上给出一个目标语言组块与之对应。应该说,这种转换方法符合人的直觉认识,也能够实现。