|
汉字改革的反思 詹鄞鑫 二十世纪前半叶,我国涌现出一批富有使命感的语言文字学家,他们出于对民族的热爱,把研究汉字改革作为解救民族命运的重要途经。综观汉字改革的全过程,我们深深地体会到志士仁人为国家为民族为进步而进行的不懈奋斗。应该说,汉字改革的热心和努力是值得称赞的。然而,在当时的历史条件下,人们对汉字的认识是不全面的。50年代以来政府陆续颁布有关汉字整理和简化的方案时,论证并不充分,加上受到当时思潮的影响,实施是草率的,后果是严重的,教训是沉痛的。委婉的批评不利于解决问题,希望实事求是的评述能引起有关部门的关注,尽早克服存在的问题。 任何评价都有个评判标准的问题。从不同的角度也许会有不同的价值观,从而有不同的标准。然而,不能用小的是非来掩盖大的是非,用小的好处来掩饰大的危害。我们认为,文字是语言的符号,是人类文明和文化的主要载体,而汉字是汉语的载体,是我国现代化建设不能须臾脱离的符号系统,关系到中国现代化建设的效率和速度,关系到千秋万代;一切是非标准不能离开这个根本的大前提。在中国现代化建设的过程中,从现在的认识来看,电子计算机的应用是自动化和高效率的前提,而计算机和网络的开发与应用都不能离开汉字信息的处理,那么,我们评判汉字改革的过去和放眼汉字整理的未来,都必须以计算机汉字信息处理的效率作为最首要的标准。 汉字改革主要包括汉字简化、异体字整理、字型改造。这些方面都有较严重的问题。 先说简化字。文化事业的发展不可能割断历史,简化字推行之后,并不能由此彻底告别过去的汉字。所以,如果我们要对简化字作评价,并不是简单地把简化字跟繁体字作比较,而应该是对整个汉字体系,也就是增加了简化字的汉字体系,跟还没有增加简化字的汉字体系作比较。这样就会发现,简化字的推出大大地增加了汉字的总数。这不仅增加了汉字学习的负担,对计算机的汉字处理尤其不利。现在大陆通行的计算机使用的字符集主要有两个,国标汉字(gb2312)6763个字符,和国标扩展字符集(gbk)21003个字符(含国标字符)。国标码字符集为简化字体系的一级和二级汉字,而国标扩展字符集中的许多汉字是跟简化字相应的繁体字,原本(指简化字推行之前)也是相当于一级和二级的常用字,但现在被置于扩展字符中,无形中增加了大量仅仅形体不同其他用法都相同的汉字。现在的问题还在于,国标扩展字符集中凡国标码之外的汉字,其中有许多汉字,如果按照汉字简化方案的规定,其偏旁写法是必须类推简化的,例如“駰”字应类推写作“骃”。这样,在扩展字符集中同样是国标码之外的生僻字就必须有“駰”和“骃”两个字符,增加了字符量。更要命的是,在国标扩展字符集中,有大量的按规定偏旁应该类推简化的汉字并没有相应的简化字。例如字符集中“騇”、“騲”、“騬”等字就没有偏旁简化为“马”的写法。这样一来,虽然扩展字符集已经扩展到2万多字了,还是有大量的按规定应该简化的汉字却没有它的位置。如果印刷品中遇到这类字,排版部门还得另外造字。我们知道,计算机手工造字不仅费时费力且效果不佳,更要命的是计算机中临时造的字是不能共享和交流的,这给信息交流和储存带来极大的障碍。可见,简化字类推原则势必造成计算机字符集的严重膨胀而且还不能应付使用。如果取消类推法,又将造成汉字偏旁体系的混乱和不统一,显然也是行不通的。假如没有推行或者废除简化字,字符总量就会少得多,并避免计算机不胜造字的难堪。 至于说到简化字本身新增了构字符号,有许多字失去了造字理据等等,这些当然也都是明显的缺点,但比起汉字总量的膨胀所造成的恶果,这些缺点简直就可以不说它了。 现行简化字的另一个明显问题,就是许多汉字被强制合并带来的烦扰,这个麻烦在引用和计算机处理20世纪50年代之前的旧文献时尤其明显。从文献引用的规范来说,我们知道,引用文献的一个公认原则就是尊重原文,不可篡改,即使有版本异文依据的改动也应加以注明。然而,在旧文献中明明意思不同的“穀”与“谷”,“後”与“后”,“鬥”与“斗”等字,按现在的文字规范,引文中如果遇到“穀”必须改为“谷”,“後”要改为“后”,“鬥”要改为“斗”等等,而这样做是跟文献引用规范相抵触的。更为严重的后果还在于,在电子文本简化字和繁体字相互转换的时候,由于简化字和繁体字并非简单的一一对应关系,就不能实现完全的自动化,不得不采用人工检查逐个判断处理。这就给计算机处理的效率提高带来极大的障碍。microsoft office2000的word软件虽然有智能化的繁简字转换功能,能根据上下文作出相应的用字选择,但其转换是以预先设定的词汇搭配为前提的,凡设定之外的搭配就无能为力。在不使用简化字的地区,计算机汉字处理就不存在这个转换问题,自然也就不存在手工处理的问题了。这是简化字带来的又一个严重后果。 如果说,简化字的问题还只是简化方案是否合理的问题,那么,新旧字形的规定和异体字的整理则可能会出现对汉字历史的假造。 假如在采用规范繁体字排印的文献中出现“轉换、鬥争、异樣”这样的写法,会让人觉得像是把简化字和繁体字杂糅在一起似的,跟历史上实际流行的繁体字面目两样(实际写法应该为:轉換、鬥爭、異樣。按,“异”和“異”原本是不同的两个字)。但如果按照目前的规定,就是应该这样来用字的。繁体字明明是另外的样子,却偏偏要规定为这个样子,这不是假造历史吗?其实,就连汉字改革的文件本身,也未能彻底贯彻规范的原则。例如1964年国家公布的和1986年新版的《简化字总表》中,繁体字“産”、“廣”等采用的是新字形(按,旧字形“産”作“產”,“廣”所从的“黄”作“黃”),而“爲”字却是旧字形(新字形作“為”)。 从计算机字符集的制订来看,新旧字形的规定还造成不得不大量增加本来不存在或没有代表意义可以不予理会的异体字符,例如在繁体字中,“產、瑤、爲”等字本来都是那时的规范字,而现在因为有新的规定,只好另造已经被作为规范字的“産、瑶、為”等字,一下子成倍地增加了新的字符。计算机字符集的庞大,使得大量没有多少文献意义的字形仅仅因为人为的规定(而且是破坏理据的规定)而白白地占用码位,这不仅带来技术上的难度(在dos系统中至今还不能采用扩展字符汉字),而且增加计算机操作的难度(外码相同的字符越多,输入速度就越慢)。由此可见,在字形上的人为干预会带来多大的害处。只有废除这些规定,才能使字符集变得简洁干净起来。 说到异体字,1955年公布的《第一批异体字整理表》最大的问题就是把许多音义有别的字误当作异体字来处理。例如,被规定必须淘汰的“异体字”中有许多并不真是异体字,而是假借字或区别字或本来就是不同的字。如果把音义有别的字一概当作“异体字”加以淘汰,例如把“並”(义为“傍”)改作“并”,“郤”(古氏)改为“却”,“薙”(义为除草)改为“剃”,“蒐”(狩猎)改为“搜”,就会改变原义,甚至连读音也被改变(义为“傍”的“並”应读为bàng,“郤”通常音xì,“辛薙”的“薙”音zhì,“蒐”有时音huì)。即使是音义相同的异体字,在用作人名时还具有区别的功能,例如“鎔”不能写成“熔”,“堃”不能写成“坤”,否则就可能产生麻烦(例如在银行和邮政业务中要核对当事人身份证姓名)。 这篇短文不可能全面系统地对汉字改革的历史作介绍和评价,主要是从计算机汉字信息处理的角度谈谈汉字改革措施给现代化建设带来的沉重包袱。现在,种种规定已经成为现实,要纠正就要付出很大的代价。然而,纠正越晚,代价就越大。为了子孙后代,还是让我们这一代人来支付昂贵的学费吧。 |