文档介绍:廿年磨一剑——联想汉卡研发记之三
       联想式汉字输入法的演变
 
陶勇
LX-80汉字图形微型机是联想式汉卡的前身,在1985年5月联想式汉卡推出前,计算所公司曾销售该微型机,这是当时的广告。
联想式汉字输入法从倪光南最初提出到后来的实现,经过了以下的演变。
   
    ——“字”==》“词”方式
倪光南最初提出的联想式汉字输入法是采用“字”==》“词”方式,即输入一个汉字,由计算机提供一组“联想词”(由一个或一个以上汉字组成)供人选择,例如对应“中”字的联想词典结构为:
中==》国、文、心、央、华、……
……
国共产党
华人民共和国
……
在这种情况下,选择一次就可输入由多个汉字组成的“词”,例如选择最后一项,就可输入“华人民共和国”。当初倪光南提出的联想是单次的:输入一个汉字,联想一个词,再输入一个汉字,再联想一个词,……等等。
 
    ——“字”==》“字”方式
在研制“111汉字信息处理实验系统”中,竺迺刚负责编制联想词典,他提出采用“字”==》“字”方式,即输入一个汉字,由计算机提供一组“联想字”供人选择,“联想字”形成一个链,实现
“字”==》“词”的效果。这是竺迺刚对于联想式输入法的一个贡献,可以节约联想词典的存储空间,所以倪光南接受了他的建议,而且用软件判断一个控制开关,可以选择是用这种连续的“字”==》“字”联想方式,还是用单次的“字”==》“词”联想方式。“字”==》“字”联想方式付出的代价是输入一个词需要作多次选择。例如,由“中”字开始,通过联想,输入“华人民共和国”这个词,需要选择6次,其过程为:
   中==| 国|==>人====>民=|   大     产     平
    |  文|   语     家|   解|==>和=|   气
    |  心|   夏     工|==>共=|   同|   善
    |=>华=|   文     力     政     享|==>国
       央     ·     ·     的    ·      谐
       ·     ·     ·     ·   
    ——“词”==》“词”方式 
“字”==》“字”方式虽然能节省存储,但这样联想字的命中率不高。后来倪光南在联想式汉卡中发展为“词”==》“词”方式,即根据已输入的“词”(可超过一个字),计算机提供一组“联想词”供人选择。“联想词”所依据的、已输入词的长度称为“联想相关长度”。显然,这个长度愈长,联想词的命中率也愈高。,支持“联想相关长度”为1至4,也就是计算机可以根据前面已输入的一至四个汉字来提供“联想词”。下面表示“联想相关长度”分别为1至4时,“联想词”的词典结构如下:
    联想相关长度=1:
    中==》国、文、心、央、华、……
    联想相关长度=2:
    中国==》人民、政府、国家、公民、制造、……
    联想相关长度=3:
    中国人==》民、文、口、均、……
    联想相关长度=4:
    中国人民==》政府、银行、解放军、政治协商会议、……
    按照这种方式,联想词的命中率较高,输入效率也较高(选择一次可以输入不止一个汉字)。