文档介绍:一种基于八叉树的拼音输入法的制作方法
专利名称:一种基于八叉树的拼音输入法的制作方法
技术领域:
本发明属于拼音输入技术领域,涉及ー种字、词的组织和查找方法,特别涉及ー种基于八叉树的拼音输入法。
背景技术:
拼音输入法是ー种将各种中间节点存入访问频率值,在本实施方式中,建立八叉树系统的规则包括八叉树的根节点不包含拼音字母,
仅记录查找字或词的次数;对字词库中的所有字和词的首字母进行统计,选出具有字和词的数量最多的7个首字母,根节点的前7个子节点是这7个首字母,最后ー个子节点不包含字母,不包含字母的子节点的前7个子节点是具有字和词的数量次多的7个首字母,最后ー个节点不包含首字母,以此类推,直到所有字和词的首字母都包含在八叉树中,由于汉字中没有首字母为i、v、u的字和词,因此,八叉树中的首字母为除i、V、u之外的所有字母;这样,从根节点到子节点就形成了一个路径,在路径上的字母依次排列形成对应子节点的拼音,叶子节点存储字和词的内存地址,对于有相同拼音的字和词,用多个叶子节点进行存储;中间节点和叶子节点中都记录该节点及相关子节点中字和词被选中的次数;对于词组,其各个字的首字母组成的路径的最后ー个叶子节点指向存储所述词组的内存地址。建立起八叉树系统后,在八叉树上查找并返回请求的字或词的方法为当需要全拼模式时,按照八叉树从根向下的顺序逐个查找对应的字母,到达叶子节点时即返回相应的字和词;当需要智能拼音模式时,按照八叉树从根向下的顺序逐个查找对应的字母,对于路径上的最后ー个节点的所有子节点包含的叶子节点所对应的字和词都返回。在八叉树上查找并返回请求的字或词后,将八叉树中间节点、叶子节点按使用频率进行排序,具体中间节点的排序方法为根据中间节点的子节点中字和词的被选中次数重新排列包含字母的中间节点的顺序,规则同建立八叉树系统的规则。具体叶子节点的排序方法为根据叶子节点对应的字和词被选中的次数重新从大到小排列叶子节点的顺序,排在前面的叶子节点对应的字和词也在字词库中排在前面。在本实施方式中,在将八叉树中间节点、叶子节点按使用频率进行排序后还可以具有以下步骤,即将新词加入到八叉树中,具体的方法可以为当新词被记录下来时,生成新的叶子节点对其进行记录,所述新的叶子节点排在具有相同拼音的字和词的叶子节点的前面。在本说明书的描述中,參考术语“ー个实施例”、“一些实施例”、“示例”、“具体示例”、或“ー些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少ー个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。 尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解在不脱离本发明的原理和宗g的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
权利要求
,其特征在于,包括如下步骤 Si:将字词库中的字和词组织为带统计信息的八叉树叶子节点; 52:建立八叉树系统,将所有需要的字和词存储到八叉树中,中间节点存入访问频率值; 53:在八叉树上查找并快速返回请求的字或词; 54:将八叉树中间节点、叶子节点按使用频率进行排序。