汉字统一编码不为人知的内幕

http://www.sina.com.cn 2008年01月23日14:53 《环球》杂志

  【四】

  汉字统一编码不为人知的内幕

  “(汉字统一编码)这个工作做得很艰苦,从一开始就充满了矛盾和斗争,”张轴材告诉《环球》杂志记者,“此间中方的努力从未被公开报道过。但我敢说,这是中国大陆、台湾、香港和澳门密切合作,最有成效的项目之一。”

  张轴材应该是有一定发言权的。他曾是中日韩联合研究组(CJK-JRG)的主编兼召集人,是汉字国际编码的主要制定者之一。在他的讲述中,一些鲜为人知的事件浮出了水面。

  上世纪80年代末,随着信息技术的发展,为了在网络上能正确无障碍地传输汉字,计算机里处理交换用的汉字代码需要有一套认同规则。在前全国计算机技术标准化委员会主任、工程院院士陈力为的支持下,中国建立起一个跨部委的工作组,其工作内容是被列为“七五”攻关项目之一的汉字内码与数据类型标准化。

  “我们做着做着就发现原目标设定得太低了,当时代码的混乱到了很危险的地步,可以说是‘万码奔腾’。IBM、DEC、NEC、日立、富士通、AT&T等大公司使用的汉字内码都不一样。虽然那时还没有一个网络世界,但可以预见到如此发展,这将来会变成阻碍沟通和发展的大问题,”时任工作组副组长的张轴材对当时的忧虑还记忆犹新,“不仅如此,当时台湾已经流行BIG-5码,即俗称的‘大五码’,大陆则在发展多个GB(国标)字符集标准,两岸走了不同的道路,这种分歧已不容忽视。”

  1988年,中国建立了通用国际代码联合会(ACCC)。“这个协会完全按国际规则来操作。在汉字问题上,如果中国人内部都不同,还怎么跟别人谈,所以首先两岸要同。虽然当时两岸形势复杂,沟通困难,但我们努力跟台湾方面取得了联系,问他们是否感兴趣。他们表示了高度兴趣。这下,统一的基础就有了。”张轴材回忆说。

  的确,有了态度的统一,也就有了会谈的可能。1989年春节后,大陆和台湾的代表团在香港碰面了。台湾方面为首的是有台湾“IT教父”之称的宏基董事长施振荣,台北电脑公会的各大电脑公司,而大陆则去的是国家科委、国家语委、电子部、标准局委等部门的代表。

  “那时有个非常有意思的场面,双方都问‘咱们怎么办’,GB(国标)和BIG-5怎么走到一起呢?我们提议先背靠背讨论一下,然后互亮底牌,结果发现想法是一致的,都是要借着ISO(国际标准化组织)汉字编码的开发,让它近期成为两岸交换之标准,远期成为两岸共通之标准。”

  会谈结束后,两岸都有了实际的行动。台湾把资料都汇总到大陆,工作紧锣密鼓地开展,把字都揉在一起,进行认同和甄别,并建立多字符集汉字数据库,同时中方也秘密地把日本和韩国的汉字也纳入了多字符集汉字数据库。

  1989年,在国际标准化组织(ISO)的会议上,中方代表大陆、台湾、香港和澳门正式提出中日韩统一编码的N480提案,并提出了具体方案,引起轩然大波。文字工作者、IT界人士都展开了热烈的讨论。在国际上,最强烈反对提案的是日本。韩国基本上不表态。而美国作为许多大工业公司的代表,站在了支持的一方。

  谈到这些往事,张轴材至今对很多人心存感谢:“这是个技术外交与技术开发并行的工作。在ISO会上,每次都吵架,主要是跟日本人辩论。日本代表很强硬,我虽然是初次当发言人,但一点也不胆怯,因为我身后有国家好几个部委的支持、中文信息学会的支持、团队的支持、两岸四地一大批专家的支持,同时还有一批非常有远见的、在大IT公司任高职的华人的支持,特别要提出的是IBM王学猛、DEC 公司叶三闾、香港ITF的郑家安、台北电脑公会的苏亮、杜全昌。”

  因为支持派和反对派相持不下,韩国提出到汉城开特别会议。就在1990年的特别会议上,中日韩决定折中建立CJK-JRG,并通过了三国轮流坐庄的机制。后来在进入CJK汉字认同甄别的实质性阶段时,各方觉得老轮流坐庄,效率不高,于是,张轴材被任命为CJK-JRG的主编兼召集人。

  很快,在ISO的会议上开始讨论汉字编码的方案。产生了一个重要决议:以中国的多字符集为基础,生成字表。这是我们“七五”科技攻关的一个重要成果。但是在字序问题上,曾经相持不下。美国一度提出在字序上把日本JIS汉字放在前头,以换取日本人的支持。中国当然不干。于是,1990年春节那几天,在多伦多举行了秘密会谈。在会上,中国提出回到《康熙字典》序为首、《大汉和》《大字源》和《汉语大字典》序为辅的排序建议,随后成为了各方同意的妥协方案。

  在不断讨论中,中日韩已达成两点共识,一是按文字编码,而不是按国家、地域、语言编码;二是要按字形统一编码,而不是按字音、字义或具体的造型编码。大家越来越认识到这是正确的方向。ISO用投票来表决是否支持汉字统一编码,结果在1990年旧金山会议上,以16比2的表决结果,达成了决议。

  1993年,ISO/IEC 10646-1《信息技术通用多八位编码字符集第一部分体系结构与基本多文种平面》正式发布。中国等同采用此标准制定了GB 13000.1-1993。该标准采用了全新的多文种编码体系,收录了中、日、韩20902个汉字。

  “在汉字的国际编码问题上,中方一直是主导,这一点毫无疑问。”张轴材称,现在标准制订的大方向没有问题了,虽然在国际会议上,各方仍然为了各自的利益争论不休,但已经有了基本规则,ISO10646(GB13000/Unicode)已成为主流编码。

  【五】

  简体繁体哪个是“正体”

  众所周知,关于汉字的争议不仅发生在中日韩之间,在中国内部,大陆和台湾学者对繁体字、简体字的优劣也颇有争议。

  2007年12月18日,国民党台湾地区领导人参选人马英九应邀到台湾高雄县辅英科技大学演讲时称,汉字应该称为“正体字”,而不是“繁体字”,因为汉字一点都不“繁”。他甚至打算把汉字向联合国教科文组织申请为世界遗产。

  就汉字申遗的问题,大陆方面的做法恰恰相反。北京师范大学汉字与中文信息处理研究所所长、文学院教授王宁告诉《环球》杂志记者:“我们刚开过申遗名录的讨论会议,汉字被列在名录上面,但我们把它删掉了。汉字符号不需要保护,它有延续性,几千年都没有间断过发展和传承。申遗是为了抢救濒危的文化,而汉字的情形并不是这样。”

  简体字与繁体字属于一脉相承。中国出版界前辈陆费逵早在1909年即撰文《普通教育应当采用俗体字》,第一次公开提倡简体字。新中国成立后,面对有大量文盲的现实,推行繁体字的简化,无疑让更多的人易于学习和掌握了汉字。

  王宁向记者介绍说:“当初在确定简化字时,遵循了一条总原则:只整理古来或民间的写法,不自创。如今,大陆非文盲人口中习惯写简体字的比例高达95.25%。”王宁也直言,“我从不否认简体字存在弊端,我们曾经提出恢复八个繁体字,比如‘乾湿’的‘乾’,和‘干部’的‘干’区分开,但就是这八个字也没能通过。”

  在大陆,有些人认为简化字还简得不够,要继续简化,对此王宁表示“语委的态度是不再继续简化汉字”。

  对于目前文言文印刷恢复为繁体字,人们的手写汉字中繁简并用的一些情况,王宁认为,“文言文用简体字印刷,意思是不对的,应该恢复为繁体字。对个人的书写也没有强制性的规定,繁简并存的现象对文字的发展来说是有利的,经过实践的检验,哪些字该繁、哪些该简,会是一个自然的过程。”

  苏培成教授则认为:“‘正体字’不是台湾的发明,两岸没分开前都叫‘正体字’,也就是规范字。大陆推行简化字已经50多年,我认为它是成功的,并且这种成功超出了中国国境,比如新加坡也在用我们的简化字。不仅如此,现在简化字大量地进入台湾。有相识的台湾学者说他的书架上的书有一半是简化字的。”

  而学者的共识是:汉字在现实的应用中需要规范,这个规范需要从基础的小学教育开始抓起,让孩子从小学会使用规范汉字。读古籍、研经史的确不是每个老百姓要去做的,但是写规范的汉字,进而在成长过程中不断提高文化修养,才能避免出现在夏天感叹“七月流火”之热的无知笑话。

  王宁介绍说,由国家语委主持制订的《规范汉字表》将在2008年3月“两会”前正式推出。

[上一页] [1] [2] [3] [4] [下一页]


发表评论 _COUNT_条
Powered By Google
·《对话城市》直播中国 ·新浪特许频道免责公告 ·企业邮箱换新颜 ·邮箱大奖等你拿