1 / 9
文档名称:

北京语料库检索使用说明.doc

格式:doc   页数:9页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

北京语料库检索使用说明.doc

上传人:beny00001 2015/9/3 文件大小:0 KB

下载得到文件列表

北京语料库检索使用说明.doc

相关文档

文档介绍

文档介绍:北京语料库检索使用说明
首  页
一 L语料库及其检索系统
二关于查询表达式
特殊符号
基本项
简单项
复杂项
过滤项
子句
查询表达式
三关于查询结果
四在结果中查找
五举例

一 L语料库及其检索系统
。L不承担由此产生的一切后果。
本语料库仅供语言研究参考之用。语料本身的正确性需要您自己加以核实。
语料库中所含语料的基本内容信息可以在“高级搜索”页面上,点击相应的链接查看。比如:
   “作者列表”:列出语料库中所包含的文件的作者
   “篇名列表”:列出语料库中所包含的篇目名
   “类型列表”:列出语料库中文章的分类信息
   “路径列表”:列出语料库中各文件在计算机中存放的目录
   “模式列表”:列出语料库中可以查询的模式
语料库中的中文文本未经分词处理。
检索系统以汉字为基本单位。
主要功能特色:
支持复杂检索表达式(比如不相邻关键字查询,指定距离查询,等等);
支持对标点符号的查询(比如查询“?”可以检索语料库中所有疑问句);
支持在“结果集”中继续检索;
用户可定制查询结果的显示方式(如左右长度,排序等);
用户可从网页上下载查询结果(text文件);
二关于查询表达式
L语料库检索系统目前支持的查询表达式加以说明。
特殊符号
查询表达式中可以使用的特殊符号包括7个: |      $       #      +     -     ~     ! 
这些符号分为三组:
Operator1: |
Operator2: $       #      +      -     ~  
Operaotr3: ! 
符号的含义如下:
(一) Operator1:  Operator1是二元操作符,它的两边可以出现“基本项”(关于“基本项”)
(1)  |   相当于逻辑中的“或”关系。
(二) Operator2:Operator2是二元操作符,它的两边可以出现“简单项”(关于“简单项”)
(2)  $   表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数小于或等于Number
(3)  #   表示它两边的“简单项”出现于同一句中,
不考虑前后次序。两个“简单项”之间相隔字数小于或等于Number
(4)  +   表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数刚好等于Number
(5)  -   表示它左边的“简单项”出现于句子中,并且,在右边相隔Number个字的范围内,-号右边的“简单项”不出现。
(6)  ~   表示它左边的“简单项”出现于句子中,并且,在左边相隔Number个字的范围内,~号右边的“简单项”不出现。
(三)Operator3:Operator3是一元操作符。
(7)  !   表示它后面的“简单项”是本次查询的主关键字符串,显示查询结果时以该“简单项”作为中心来进行定位。
注意: Operator2后面的Number是必须的,不能省