文档介绍:知网 -- 可计算的词典
董振东
dzd@
北大
2005-11
提纲
创新是语言研究现代化的灵魂
知网可以告诉我们什么
创新是语言研究现代化的灵魂
语言本体研究需要创新
计算语言学研究也需要创新
知网可以告诉我们什么
概况:
Chinese character 7108
Chinese word & expression 83397
English word & expression 79246
Chinese Meaning 97764
English Meanings 98963
DEF count 24999
Record Total 162047
知网可以告诉我们什么
概念:
物事: 57488
部件: 6904
时间: 2209
空间: 1062
属性: 3749
属性值: 9044
事件: 12251
知网可以告诉我们什么
词类:
ADJ: 11648
ADV: 1513
NOUN: 46412
VERB: 25742
…
知网可以告诉我们什么
词长度统计
词长=1: 6905
词长=2: 45724
词长=3: 13681
词长=4: 13822
词长=5: 1649
…
知网可以告诉我们什么
同义:Set= 13349 词语数: 53871
反义:Set= 12811
对义:Set= 6691
知网可以告诉我们什么
“火车”
上位概念:entity|实体
==> thing|万物
==> physical|物质
==> inanimate|无生物
==> artifact|人工物
==> implement|器具
==> vehicle|交通工具
==> LandVehicle|车
知网可以告诉我们什么
“火车”
下位词语:货车军列邮车
客车旅客列车特等豪华铁路客车
通勤列车与船期衔接的旅客列车
快车流线型火车特别快车直达车
特快直达快车直快子弹头子弹头列车
慢车
晚班车晚车夜车
早班车早车