文档名称：

基于互联网自然标注资源的自然语言处理.pdf

格式：pdf 大小：7,696KB 页数：7页

下载后只包含 1 个 PDF 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

基于互联网自然标注资源的自然语言处理.pdf

上传人:sftnqws018 2017/8/18 文件大小：7.52 MB

下载得到文件列表

基于互联网自然标注资源的自然语言处理.pdf

相关文档

文档介绍

文档介绍：256 中文信息学报琋
年月 JOURNAL CHINESE INFORMATl0N Nov2011
文章编号:———
基于互联网自然标注资源的自然语言处理
孙茂松
寤4笱Ъ扑慊蒲в爰际跸担寤4笱е悄芗际跤胂低彻抑氐闶笛槭遥本
摘要:该文提出了。基于互联网自然标注资源的自然语言处理”的学术思想,并从自然标注资源的定义和基本类
型、基于自然标注资源的计算、方法论层面上的初步思考等三个角度对这一学术思想进行了初步的阐发。最后指
出了其中的一个基础问题;如果我们把全部自然标注资源所能提供的全部信息或知识都以一种系统的方式用到了
?
关键词:自然标注资源;用户产生数据;互联网;自然语言处理
TP391A
Natural Based Naturally Annotated Web Resources
SUN Maosong
Key Labof. and Systems Science and
UniversityBeing,
秚: article ofnaturaI based naturally annotated Web —
sourcesThe carried out three perspectivesthe and types naturally annotated —
琻 annotated putingas several key concerned the method0109i
. A fundamental problem presented for further exploration : could explore and integrate the
information all the availabIe naturally annotated resourcesin different respectssystematicallycanthema
chineasexpectedultimatelyachieve understanding
Key wordsmturallyannotated ; generated ;籲
自然语言处理自诞生之日起已先后发展出两种?
(methodology)一位长期在这个领域辛勤耕耘的学者都不能不有所
义方法和经验主义方法。总的来说,目前学术界应思考的问题。鉴于互联网上各类资源空前丰富的基
该形成了如下两点基本认识:第一,比较少地依赖 2010329
Ngram京都大学举行的“第二届清华一京都大学面向知识
表层语言单元的经验主义方法在全世界同行们的共社会的智能技术与信息管理研讨会”
同努力下,已经差不多做到了极致,需要谋求新的突 UniversityKyoto Symposium
破;第二,近中期的发展趋势是两种方法的融合,即 Intelligent and Information Man
多一点理性主义的经验主义,也就是说,研究超越了 agement for Knowledge 上,首次给出了“基
Ngram(Na
法。各种半监督的机器学****算法和基于结构的机器 tural Based Hugescale
[1]Naturally Annotated Corpora20年
“行到