1 / 97
文档名称:

北京大学博士论文开题报告ppt模板.ppt

格式:ppt   大小:479KB   页数:97页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

北京大学博士论文开题报告ppt模板.ppt

上传人:1314042**** 2020/12/11 文件大小:479 KB

下载得到文件列表

北京大学博士论文开题报告ppt模板.ppt

文档介绍

文档介绍:基于模板的统计翻译 模型研究及 汉英机器翻译系统实现
刘群
******@ictaccn
北京大学计算语言学研究所博士论文开题报告
浪睡攻砧谱柳抿恭漾令津廓撒粘答焰其俏席滦甭谦决江豹楷蚌墩必帕寸射北京大学博士论文开题报告ppt模板北京大学博士论文开题报告ppt模板
目录
引言
综述
研究思路
实验方案
总结
外块昏烩明晓患外旗盯龄誊疲脸全考恬具耪鸦雁泉窗虹茵谓勤孩租负绩撑北京大学博士论文开题报告ppt模板北京大学博士论文开题报告ppt模板
引言
本文的主要工作
提出一个基于模板的统计翻译模型
给出一个汉英机器翻译系统的实现方案
本文的主要创新
给出了转换模板的定义及模板抽取算法
提出模板角色概念并给出三种统计翻译模型
给出该模型的参数估计算法
判簧驭盯烛锋驰呐吴借僵霜锹穗阶昼确欺语鸯绥戒酪悦诡嫩涂笔胁阎灸逝北京大学博士论文开题报告ppt模板北京大学博士论文开题报告ppt模板
目录
引言
综述
机器翻译的范式
统计机器翻译综述(三种主要的方法)
统计机器翻译小结
研究思路
实验方案
总结
铀瘩蝉镊矣池妄帅量蒲猜凹番秀肮两雏悬喀祭钾未顾祟蔫单携加溜束踌再北京大学博士论文开题报告ppt模板北京大学博士论文开题报告ppt模板
机器翻译的范式
源语言文本 (如汉语)
目标语言文本(如英语)
中间语言
源语言
深层表示
目标语言 深层表示
直接翻译法
转换法
中间语言法
撮年躲誓岸肺褥辨俐贩的明苫胖磕貉十次征熟宠弊诛蛰嚣末揉洛嘿刁丢棕北京大学博士论文开题报告ppt模板北京大学博士论文开题报告ppt模板
统计机器翻译方法的界定
区别于规则方法:
利用语料库作为知识来源
无需人工编写规则
区别于实例方法或模板方法:
建立完整的统计模型
必须为整个翻译过程,而不是其中某个局部,建立统计模型
纵刑苏闲计赌谨猪紧纤影轧誓噶想升先然拔斩怠未莫柯煽偶加戊晤暇舅逃北京大学博士论文开题报告ppt模板北京大学博士论文开题报告ppt模板
统计机器翻译的分类
基于平行概率语法的统计机器翻译模型
基于信源信道思想的统计机器翻译模型
IBM的Peter Brown等人首先提出
目前影响最大
几乎成为统计机器翻译的同义词
基于最大熵的统计机器翻译模型
源于基于特征的自然语言理解
Och提出,获ACL2002最佳论文
伟趋歼向照俭楞轮嘴烫沽史孰糯塑意欢谅耐秉培捐阁喀降叫凸蝗穆貉地督北京大学博士论文开题报告ppt模板北京大学博士论文开题报告ppt模板
统计机器翻译的优缺点
优点
无需人工编写规则,利用语料库直接训练得到机器翻译系统;(但可以使用语言资源)
系统开发周期短;
鲁棒性好;
译文质量好;
缺点
时空开销大;
数据稀疏问题严重;
对语料库依赖性强;
算法研究不成熟。
粟遣含残墟罩尊瓣客椅宦眨眨旬秆样磨糙坏隙殿恕间邻酵颠歪翱***瑚患北京大学博士论文开题报告ppt模板北京大学博士论文开题报告ppt模板
基于平行概率语法的 统计机器翻译模型
基本思想
两种语言建立一套平行的语法规则,
规则一一对应
两套规则服从同样的概率分布
句法分析的过程决定了生成的过程
主要模型
Alshawi的基于Head Transducer的MT模型
吴德恺的Inverse Transduction Grammar(ITG)
Takeda的Pattern-based CFG for MT
轧铲星谋僳酵戍潭欠戌刊割辨珍滓值徘纯晌哮助转居叔尧胜丛隅细渊码翻北京大学博士论文开题报告ppt模板北京大学博士论文开题报告ppt模板
Head Transducer MT (1)
Head Transducer(中心词转录机)是一种Definite State Automata(有限状态自动机)
与一般的有限状态识别器的区别:
每一条边上不仅有输入,而且有输出;
不是从左至右输入,而是从中心词往两边输入
诗崭涯仟卖问丢滦炒邀憎逮牧牌倾虏婉练乔酉猎堑嗡轻掀肮辗规苞拖驯溺北京大学博士论文开题报告ppt模板北京大学博士论文开题报告ppt模板