1 / 163
文档名称:

自然语言的处理.pptx

格式:pptx   大小:9,187KB   页数:163页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

自然语言的处理.pptx

上传人:wz_198613 2021/2/12 文件大小:8.97 MB

下载得到文件列表

自然语言的处理.pptx

文档介绍

文档介绍:1
基本概念
2
信息的主要载体-语言
语言的两种形式-文字和声音
文字和声音作为语言的两个不同形式的载体,所承载的信息占整个信息组成的90%以上。
如何让计算机实现人们希望实现的语言处理功能?
如何让计算机真正实现海量的语言信息的自动处理和有效利用?
3
自然语言处理(Natural Language Processing,简称NLP)是利用计算机为工具,对人类特有的书面形式和口头形式的自然语言的信息进行各种类型处理和加工的技术。
——冯志伟《自然语言的计算机处理》
NLP是用计算机通过可计算的方法对自然语言的各级语言单位(字、词、语句、篇章等)进行转换、传输、存储、分析等加工处理的理论和方法。
4
其它名称
自然语言理解(Natural Language Understanding)
计算语言学(Computational Linguistics)
现代语言学的一大分支,它是用计算机理解、生成和处理自然语言,即它的研究范围不仅涵盖语言信息的处理,还包括语言的理解和生成。
5
研究语言的目的
研究语言的目的
为语言构造出足够精细的计算模型,以便能够写出由计算机程序来完成的涉及自然语言的各种任务。
计算模型的用途
作为科学研究的目的-可以探索语言交流的本质;
作为实用的目的-能够实现有效的人机通信。
终极目标
能够给出一些模型,这些模型在完成阅读、写作、听、说等任务时能够接近人的行为。
6
不关注与所使用的特定媒介相关的问题,例如手写输入、键盘输入或语音输入的问题。
关注在词语识别完成后理解和使用语言的过程。
NLP的历史
20世纪50年代起步
提出机器翻译等重要问题
50年代-60年代采用模式匹配法和文法分析方法
对基于理解和基于统计方法的讨论
60年代后期衰落
70-80年代采用了面向受限域的深入理解方法
80年代后期至今统计方法占据主流
大规模语料可用,计算机性能大幅提高
互联网的迅速发展为NLP提供了实验数据来源和新的应用场景
7
8
自然语言处理技术可以为我们做什么?
1、信息检索

• 微软:106,000,000条(8年前2,060,000 条)
微软,亚洲研究院:1,060,000条
微软,亚洲研究院,研究方向:116,000条
微软,亚洲研究院,自然语言处理:38,900 条
⇒ 08年7月一万亿个网页,每天数十亿增加
⇒ 获得的信息只有1%被有效利用
“框”计算
“框计算”是2009年8月18日,百度董事长兼首席执行官李彦宏在2009百度技术创新大会上所提出的全新技术概念。用户只要在“百度框”中输入服务需求,系统就能明确识别这种需求,并将该需求分配给最优的内容资源或应用提供商处理,最终精准高效地返回给用户相匹配的结果。这种高度智能的互联网需求交互模式,以及“最简单可依赖”的信息交互实现机制与过程,称之为“框计算”。
9
10
2、借助于语言信息处理的web智能
/