首页 新闻 搜索 短信 分类 聊天 导航

新浪首页 > 新闻中心 > 文化新闻 > 正文
总数有九万多常用只有三千五 最新汉字统计出炉

http://www.sina.com.cn 2001年09月26日17:01 北京晚报

  汉字字库变大了

  昨天,新华社公布了最新的统计信息,目前汉字的总数已经超过了8万,而常用的只有3500字。虽然常用字的数量没有多少变化,而字库总量却变大了,这是为什么呢?

  “十一”放假,许多学生准备到书店中购买字典,到书店后又感到困惑:书店中有许多种字词典,厚薄也相差很多,该选哪一种呢?我国汉字总量是多少,大家没有一个统一的说法。有“总汇汉字之大成”评价的《康熙字典》,在书后附有《补遗》,“尽收冷僻字,再附《备考》,收有音无义或音义全无之字”,收录的汉字是4万多个。1994年出版的《中华字海》收入了87019个汉字,而已经通过专家鉴定的北京国安咨询设备公司的汉字字库,收入有出处的汉字91251个,据称是目前全国最全的字库。与庞大的汉字库形成鲜明对照的是,历代日常书面语常用的不同的汉字数量一般都控制在三四千个。数量上并没有超过最初的文字甲骨文。国家在1988年公布的《现代汉语常用字表》选收了2500个常用字、1000个次常用字,总共只有3500字。

  生僻字逐渐淘汰

  国家语言文字工作委员会语言文字应用研究所前副所长纪恒铨认为,一个国家的文字总量有增有减,但基本字的数量则比较固定。汉字有很多,可以分做很多层面。我国常用汉字有2500多个,只要掌握了它们,就可以熟练阅读现代汉语书面语了。《毛泽东选集》5卷本,使用的不同汉字也不过2000多个。小学语文大纲规定学生应该认识3000个汉字,如果掌握了1800多个汉字,也就可以“脱盲”了。计算机字库中的汉字总量也不过有2万多个。王永民在研究“五笔字型输入法”时,将《现代汉语词典》上的1.2万多个汉字逐个分解并归并出数百字根,然后再与计算机相关的按键连起来,这已经基本满足了日常需要。

  纪恒铨说,文字是历史文化的载体,传达着一定的信息,不同社会阶段文字使用特点也不同。随着社会发展,一些文字就被逐渐淘汰了。从现代汉语角度,人们传情达意需要更简便的方式,“4万甚至9万多汉字,恐怕许多人一辈子也记不完。汉字中的生僻字很多,即使自己记住了,如果交流时对方不懂,还是没用”。许多生僻字就这样逐渐被淘汰出常用字。推广使用规范汉字,可以减少不必要的交流障碍,还能大幅度地减少学习读写、印刷排版和电脑汉字内存的负担。

  9万汉字从哪来

  汉字已有五千年的历史。早在新石器时代晚期的彩陶上,就出现图画和符号,它就是汉字的前身。现在所能看到的最早成熟汉字,是商朝刻于兽骨和龟甲上的甲骨文。当时已使用单字4600多个。

  随着社会的发展,为了表现新的事物,语言也在发展,9万汉字的背后是社会生活的不断进步,由于我国文字积淀的历史长,这些字就构成了汉字库的主体,主要体现在包括国家编撰的《说文解字》、《康熙字典》、《汉语大字典》、《中华字海》的收字上。在语言文字本身的发展过程中,不可避免地还出现了大批的异体字和不规范字,就像孔乙己曾经坚持“茴”字有四种写法一样,汉字中的异体字是汉字家族日益壮大的一个重要原因。在50年代,国家曾经做过一个异体字整理表,然而工作还未结束,随着汉语拼音化方案的提出,这项工作没有进行到底。中国社会科学院研究生院语言系教授晁继周先生这样解释。

  随着与外界接触扩大,一些外来词语开始进入我国的语言体系中,如沙发、经济、迷你裙等。汉字体系里外来字也有,但数量特别少。大家常说“二○○八年”,很少说“二零零八年”,“○”与横竖撇捺为构字元素的汉字显然不同,它来自于阿拉伯字系。另外还有一些国家,比如韩国、日本等国家过去使用的都是汉字,后来又用汉字的偏旁部首造了一些新的字,前者还是汉字字系,也会被收到汉字字库里来。这些字属于国际标准的字符集汉字,也是数目庞大的汉字字库的一部分。现在的字库整理,一般还会把新加坡、越南、马来西亚等周边国家里的汉字收录入内。

  同时字库还会收集上述字集、字典、字书所不能包括的古今姓氏、地名用字。刘先生认为,由于我国人口多、面积大,许多地方字、方言字、姓名用字也是汉字库的一个组成部分,早就有人把这些字编纂成字典,包括台湾香港在内,已经有大约40余本地方字字典分册被整理出来。如澳门有一个凼(dàng)仔岛。现在许多人洗完头发,爱用喱水固定发型,“喱水”是香港用语,后来大家也逐渐接受了。

  统计汉字做什么

  据中国社会科学院语言研究所研究员、参与了《新华字典》和《现代汉语词典》编纂工作的刘庆隆先生介绍,做这样一个大的字库收集整理工作,不但备查备用,还可供国内两岸四地及国外进行汉字文本印刷、古籍整理、辞书编写、汉字整理和研究使用,而且为人名名录及证件制作、中国地图地名标注提供了水平很高的字库工具。90年代初,国家制作过一个包含20902个字的国家标准字库表,但在使用过程中发现这个字表还远不足使用,目前补充工作正在开展中。

  整理汉字库的原因,刘庆隆认为一是适应国际上要求建立国际字标的需要,做成一个国际通用的字库以方便国际文字的交流,目前国际ISO国标委员会正在收集各国文字;二是适应计算机输入法的发展、扩大计算机字库的需要。目前信息产业部的计算机标准化研究所也正在进行汉字字库的统计整理工作,已经整理出来近7万字;第三,汉字发展过程中的字体变形使得一些字看起来已经不像汉字,需要整理以便统一。本报记者贾中山张卉

   手机铃声下载 快乐多多 快来搜索好歌!
      新浪企业广场诚征全国代理


发表评论短信推荐】【关闭窗口
 相关链接
现代汉字总数八万多 专家指出常用仅为三千五 (2001/09/25 09:57)
汉字乾坤大 邓氏巧布阵 (2001/07/31 11:06)
关于GB18030汉字编码标准集 (2001/07/26 17:00)
江苏天平红枫有“文化”:树芯里面长汉字 (2001/07/22 14:39)
6月女婴能准确识汉字143个 (2001/07/02 10:45)
“这就是你们的文字”--门多萨人探奇中国汉字 (2001/06/21 09:55)
生僻汉字的制造与调用 (2001/06/08 15:40)

新 闻 查 询


分 类 信 息
今天真是便宜你了!
北京
  • 北外托福雅思班
  • 和鸣花园怡人福地
  • 桑沐恩期待有情人
  • 深秋浪漫碧峰洲
    济南
  • 威海二手房信息
  • 抵挡不住的风情
    上海
  • 闻香留步名酒家
  • 黑头发飘起来
    广东
  • 钢结构设计安装生产
    河南
  • 大型经济类报纸招聘
  • 分类信息刊登热线>>


    新浪商城推荐
      香水专题
  • CD真我香水
  • 清泉女士香水
  • 古姿嫉妒女香水
  • 欢沁女士香水
  • 第五大道香水
  • CD绿毒香水
     (以上推荐一周有效)
  • 更多精品特卖>>



    新闻中心意见反馈留言板 电话:010-82612286   欢迎批评指正

    网站简介 | 用户注册 | 广告服务 | 招聘信息 | 中文阅读 | RichWin | 联系方式 | 帮助信息

    Copyright © 1996 - 2001 SINA.com, Stone Rich Sight. All Rights Reserved

    版权所有 四通利方 新浪网