1 / 20
文档名称:

3500个常用字.doc

格式:doc   大小:59KB   页数:20页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

3500个常用字.doc

上传人:漫山花海 2019/5/12 文件大小:59 KB

下载得到文件列表

3500个常用字.doc

文档介绍

文档介绍:莆现代汉语常用字表(3500字)莃为了适应语文教学、词书编纂以及汉字机械处理和信息处理等各方面的需要,国家语言文字工作委员会汉字处从1986年6月开始研制现代汉语常用字表。1987年7月国家语委邀请教育、语言、信息处理等方面专家对字表草案进行论证;同年8月委托山西大学计算机科学系作抽样检验。国家教委有关部门参加了字表草案的修订工作。国家语委汉字处根据各方面提出的意见对字表草案进行整理修正,于1988年1月制订出现代汉语常用字表。袃【统计资料】罿制订现代汉语常用字表是在过去工作及其取得的成果基础上进行的,所用统计资料包括以下15种:(4261字)--1928年6月陈鹤琴(2000字)--1946年8月四川省教育科学院(1017字)--1950年9月中央人民政府教育部社会教育司(2000字)--1952年6月中央人民政府教育部公布(3559字)--1954年1月中国大辞典编纂处(3000字)--1958年8月山东省教育厅(3100字)--1965年3月北京市教育局中小学教材编审处(4444字)--1975年中国文字改革委员会汉字组(常用字部分4152字)--1976年12月七四八工程查频组--1979年7月中国文字改革委员会汉字组·基本集(一级字3755个)--(3189字)--1984年人民教育出版社(3994字)--1984年3月中国人民大学语言文字研究所、自然科学综合汉字频度表(常用字部分3500字)--1985年3月北京航空学院计算机科学与工程系中国文字改革委员会汉字处(4574字)--1985年7月北京语言学院语言教学研究所袀从通用字的资料中选用了以下5种:(6196字)--1965年1月中华人民共和国文化部和中国文字改革委员会联合发布。--1978年8月中国社会科学院语言研究所--1979年商务印书馆(7292字)--1983年中华人民共和国邮电部(6001字)--1987年1月新华社技术研究所袅【时间范围】螃常用字表选材的时间范围是从1928至1986年。在此时间区域内采用不等密度抽样,即抽样量按时间顺序递增,以近期的资料为主要抽样对象。社会用字与政治、经济、文化的发展有着密切的关系,不同时期的用字情况有所不同。如果仅依某一短时期的用字情况选取常用字则有时间的局限性。适当把统计的时间拉长,纵观各个不同时期的用字情况,则可以衡量字的使用是否稳定。选取使用稳定的字,可以避免选字的偶然性。莁【分布和使用度】芇拟订常用字表时,还统计了汉字在不同学科的分布和使用度。统计汉字在不同学科的分布,可以衡量某个字的使用分布是否均匀。如某个字在单一学科中使用频度较高,但在其他学科中却很少出现,这说明它的分布是不均匀的。与此相反,有的字不仅使用频率较高,而且能在多学科中出现,这说明它的分布是均匀的。选取分布均匀的字,可以避免选字的片面性。我们以1985年3月北京航空学院计算机科学与工程系和中国文字改革委员会汉字处合作统计的《现代汉语用字频度表》作为统计汉字使用分布的资料。该资料有十科用字频度表:;;;;;;;;;。羄使用度是将汉字的使用频率与该字在各个学科中的分布进行综合考虑的一种计算方法。计算汉字使用度的公式是:膃膂上述公式的计算条件是假定各个分科的抽样量是均匀的。其中,Ni是K号字在第i类语料中的相对频率,NK是K号字在综合类里的相对频率,n是语料的分类数,DK是K号字的散布系数,SK是K号字的标准分布偏差,UK是K号字的使用度,FK是K号字的出现字次。我们在统计汉字的使用度时,对上述公式进行了调整,调整后的公式是:荿莆其中,DIK和DEK都是我们采用的k号字的散布系数,LK是k号字的分布系数。薂【选字原则】袂拟订常用字表的选字原则是:膆 ,选取使用频率高的字;蒅 ,选取学科分布广、使用度高的字;羁 ,选取构字能力和构词能力强的字;莈