胡吉成:谈谈汉字的检字法
汉字的检字法就是查检汉字的方法。由于汉字结构的复杂多样,使得汉字的查检也变得十分困难。汉字字数规模之大,可以说是世所罕见,而且由于汉字"出生不报,死而不僵",汉字的字数到底有多少,好像根本就没有一个准头。因此,有关汉字的工具书,收字数量不断被刷新。近代的《康熙字典》,收录汉字 47043个,1990年由徐仲书主编的《汉语大字典》,收字54678个,这是自有汉字以来收字最多的字书,可是这个记录还没有保持多久,在1994年就被中华书局和中国友谊出版公司联合出版的《中华字海》取代了,而《中华字海》创造的记录仅仅维持了7年,就又被新的记录所取代!据《北京晚报》2001 年9月26日报道,北京国安咨询设备有限公司的汉字字库,收入有出处的汉字91251个,是目前收字最多的字库,并且已经通过专家鉴定。汉字的数量真是惊人!而汉字系统是开放性的,在未来汉字使用过程中,还将有多少汉字涌现出来,谁也说不清楚,但新的记录随时可能产生,这是肯定的,不言而喻的。
这样浩如烟海的汉字,要在其中找到你所需要了解的汉字,没有一定的查检方法,简直是寸步难行!为了解决汉字的查检问题,我国的语言文字工作者,早就开始开始了不懈的努力探索,发明了多种多样的汉字检字法。汉字检字法成为一门专门的学科,几千年来为人们所研究,这在其它文字体系中是绝无仅有的。那么汉字检字法是怎样产生的呢?现行检字法有什么问题呢?未来的检字法的发展趋势如何?我们这里简要谈谈,供大家学习参考。
一、汉字检字法的产生与发展
汉字检字法不是一开始就有的,而是汉字发展到一定阶段的产物,是伴随着人们用字的需要应运而生的。
在我国汉代以前,字书都没有检字方法,所收录的字或词都是按意义来排列的。例如《尔雅》是把同义的词语排列在一起加以解释的。这部书共分十九卷,每一卷把意义相近相关的词排列在一起,如表示宫室的词语、表示山川的词语、表示亲属称谓的词语各为一体。汉初的一些童蒙识字课本,一般收字两千到三千多,但所收的内容,也按姓氏、器具、动物、兵器、礼仪等内容排列,每句三字或七字,例如"宋延年,郑子方。卫益寿,史步昌";"矛铤镶盾刃刀钩……"之类,这样按照意义排列,理解不免因人而异,因此要查检一个汉字是相当困难的。
到了东汉末年,许慎著《说文解字》一书,首创部首检字法,他将9353个汉字按其结构特点分为五百四十部排列,每个汉字都可以在某个部首中找到自己的位置。例如"驷、驾、驻、驰、骋"这五个汉字,虽然音义各不相同,但在结构上具有共同点,即都有一个"马"偏旁,这个偏旁就是一个部首,查找这些汉字,只要到部首"马"中查找就可以了,换言之,只要找到"马",就能找到"马"部的任何一个字。这样,原来要从上万个汉字中查找一个汉字,而且没有任何规律,现在,只需要查找540个部首就可以了,而且部首的排列还是有规律的。因此自从部首检字法发明以后,查检汉字就不再是困难的事情了。
部首检字法的发明在中国文化史是是一件大事,具有十分重大的意义,它为我国字词典的编撰开辟了一条新路,也给人们学习、使用汉字带来了极大的方便。
部首检字法从产生之日起就受到世人的重视,得到了广泛的运用。后世之人在运用的同时,又不断根据汉字的变化对旧部首加以改造,使之更加完善。梁代顾野王编《玉篇》,删去《说文》中设立?quot;哭、司、教、眉"等十部,增加了"文、云、丈、单"等十二部,首先开始了对《说文》部首的改造。辽代僧人行均编的《龙龛手鉴》,把所收录的汉字采取先分平、上、去、入四声类别的方法,从声调上把汉字分为四类,然后再按部首排列汉字,把部首分为242部。北宋司马光等编《类篇》,收汉字三万多,分为544个部首。金韩孝彦编撰《四声篇海》,以《玉篇》542部为主,同时参考《类篇》、《龙龛手鉴》等字书,增加杂部三十七部,共579部,为历来分部最多的一本辞书,后来其子韩道昭修订为444部,部首以声母及平生、上声、去声、入声四声为序排列,同部首的字,又以笔画多少为序。这是我国历史上以笔画数为检字方法的第一部字书。今天我们所见的各种字书,部首和检字部分无不是按笔画数排列先后的。明代梅鹰祚编《字汇》一书,对旧部首作了重大改革,就所收的三万多个汉字归入214个部首之中,部首及同部首的汉字以笔画数为顺序,同时全书又以"子丑寅卯"等十二地支分为十二集,这种分部方法一直沿用了几百年,《康熙字典》、《中华大字典》等都采用这种分类方法。
目前我们使用的各种字词典,大多使用部首作为主要的检字方法,但部首的数量并不统一,例如《新华字典》中的部首分为189个,《现代汉语词典》的部首,经历了多次变化,1965年的试用本分部首为250个,1979年正式本分部首188个,1996年修订本分部首189个。可见,现代汉字的部首的数量还不是定数,这种不统一的现象是不利于运用的。其实,现行汉字部首的数量到底应该定在多少个合适,恐怕是谁也不好下定论的,因为收字多少不同,使用对象不同,涉及到的汉字数量不一样,部首数量恐怕也就不一样了。
在部首检字法开始盛行的时候,我国古代的学者在长期的探索中发现并归纳出了汉语的四声,认识并离析出了汉字字音(音节)的内部结构成分――声母和韵母。随着认识的不断加深,人们又根据汉语的声韵调关系将汉字组织起来编成字典,供作诗词的人选择使用汉字,于是,利用声韵调来排列查检汉字遂成为一种重要的检字方法。最早以字音来排列汉字的字书是魏李登的《声类》。因为这类字书大多是为了方便当时的诗家词人们的创作而编的,因为同一韵部的汉字都排列在一起,这样查检同韵字就非常方便,因而这类韵书很受欢迎。自《声类》以后,各种各样的韵书如雨后春笋般地涌现出来,例如隋朝陆法言的《切韵》、唐孙缅的《唐韵》、宋陈彭年的《广韵》、丁度等编撰的《集韵》、金韩道昭的《五音集韵》、王文郁的《平水韵》等等。这些韵书,排列汉字的方法也是多种多样的,有的按韵母排列,有的按声母分类再按韵母排列,有的按四声排列,也有的按开齐合撮四呼排列。后来还有及声韵排列法和部首检字法结合起来排列汉字的。当然,由于那时还没有引进拉丁字母,所以这些声韵调都是用汉字来代替的。后来,在二十世纪二十年代,汉字改革运动中,人们创造了注音字母,所以新中国成立以前,许多字词典又是按照注音字母顺序排列汉字的,这种方法在我国台湾省还一直沿用至今。新中国成立不久,我国政府公布了以拉丁字母为基础构成的汉语拼音方案,因此我们现在使用的字词典,其正文内容大多是以汉语拼音字母顺序来排列汉字的,从此按汉字读音来查检汉字的方法进入了一个科学的阶段。不过,我国现行词典虽然采用汉语拼音字母顺序排列汉字,但又不是单纯的字母顺序,只是词条第一个汉字使用了字母顺序,至于第二个汉字的读音,只在首字相同的词条中以它本身读音的字母顺序排列先后。如果一个汉字排列在另一个汉字的后面,那么它领衔的词条统统都得排列在另一个汉字及所属的词条后面,因为词条在词典中的先后顺序由第一个汉字决定,不由第二个汉字决定。例如词?quot;亲爱"的注音是qinai,词条"侵占"的注音是qinzhan,按单纯字母法排列词条,第一个音节相同,就以第二个音节的字母作为排列先后顺序的依据,这两个词条,"亲爱"的第二个音节是ai,首字母是a,排在汉语拼音字母的第一号位置上,"侵占"的第二个音节是zhan,首字母是z排在汉语拼音字母的最后一号位置,很显然,在词典中,"亲爱"应该排列在"侵占"前面,但是由于词条第一个字同音是按笔画多少和起笔笔画横、竖、撇、点、折顺序排列先后的,"侵"字排列在"亲"字前面,所以"侵略"也就排列在了"亲爱"的前面。这种排列方法虽然不科学,但是符合我国人民的使用习惯,人们习惯按照第一个汉字的顺序查找词条,而不习惯按照第二个汉字查找词条先后,出现这种情况的原因是汉字不是拼音文字,人们也并不十分熟悉汉语拼音字母顺序。
号码检字的方法历史比较断,其中影响最大的首推四角号码检字法。四角号码检字法是二十世纪二十年代才发明的,发明者是王云五先生,后来又有三角号码法、五角号码法等等。四角号码检字法完全抛开了汉字的字音、字义,对汉字的构形上的解释也与传统分析汉字的方式大相径庭,是一种全新的检字法。从理论上看,四角号码排列汉字从0000开始,至9999结束,可以排列一万个汉字而不重复,所以用四角号码排列汉字,同码的汉字比较少,查检有一定方便之处,比较适用于大型的字词典。如果使用熟练,查检速度相当快捷,例?quot;轿"的号码是4252,查检时直接翻到正文4252处即可,没有分析部首查找部首再检字的烦琐。只要平时经常使用,尤其是熟悉一些常用偏旁的代码,查检起来就更加便捷了。例如"病"的四角号码是0012,其外框占据三方,号码是001 -,右下角根据具体的汉字确定号码,例如"疲"是0014,"痰"是0018,"癌"是0017,"痂"是0015,"痴"是0016。又如"广"的号码是0020,右下角以外的三个角的号码是002,依此类推我们可以直接看右下角笔形确?quot;广字框"汉字的四角号码,例如"庄"是0021,"序" 是0022,"廉"是0023,"府"是0024,"库"是0025,"唐"是0026,"庆"是0028,"床"是0029。
近二十年来,随着计算机的普及,汉字输入机器问题已越来越受到社会的关注,引起人们的重视,人们又发明了许多用于计算机汉字输入输出的检字法,如拼音汉字转换法、五笔字型输入法等等,归结起来有音码法、形码法、音形结合法。目前,用于机器的有关检字方案已多达数百种,正式应用的也有好几种,真是出现了万"码"奔腾的局面。据资料载,某科研机构搜集记录汉字字形编码方案,记录到750种就停止了,后来很快就超过了一千种,今天还以每月一两种的速度增加,笔者的电子信箱中就时不时收到试用某某输入法的广告。日本1980年完全废除了形码,改用假名自动转换汉字技术。日本的做法可以给我们使用计算机输入汉字以一些有益的启示。这些新的检字法,可以说是各有优劣,如何改进,还有待于专家学者们去探究总结出新。
二、现行检字法的不足
汉字是属于平面型的文字,字形结构不表音,因此笔画和部件的组合排列就不像拼音文字那样有序。拼音文字字母的先后顺序由所记录的词的语音情况决定,呈线性的序列,按照一个方向行进排列,读音近似的,字母组合情况也近似,如cabin-cabinet,face-facet。而汉字的笔画部件因为与字音没有关系,因此组合不是按线性序列组合,而是可以上下左右同时展开,结构近似的,读音可能差得很远,例如"栗-粟"、"浮-殍";结构差别很大的,读音可能完全相同,例如"衣-医"、"质-致"。
目前通行的多种汉字检字法,是以单个汉字的读音、结构、笔形等方面的特点作为依据来排列汉字顺序的,如音序检字法将字音居于主要地位,不考虑字的形体结构;部首检字法不考虑字的读音而把自动结构要素的一致性放在第一位,如凡是结构中有"木"偏旁的就归为一类;四角号码检字法则是既不考虑字的读音,也不看字的偏旁,而是假定每个汉字都有四个角,因而只考虑汉字四角的局部特征的一致性,据此取号排列并按四位数码的大小排列先后顺,笔画检字法是根据单字笔画数量的多少和笔画的先后顺序来排列查检汉字的。这几种检字方法,各有所侧重,因此各有优劣。,和拼音文字的检字法相比,汉字现行检字法存在的不足主要有以下几个方面。
第一,不自然,人为因素太多。现行的汉字检字法,好些已经超出了汉字自身的构形特点,而显得很不自然。例如拼音字母顺序检字法,按字音排列汉字顺序,应该说是最科学的了,但是汉字本身不是拼音文字,拼音形式是汉字字形以外的成分,如果事先不知道所要查检的汉字的读音,就无法查检这个汉字。实际上,很多查检汉字的人在大多数情况下是要查阅汉字的读音,这样一来拼音检字法就无用武之地了。而且使用汉语拼音字母顺序法查检汉字,要求使用者必须熟悉普通话语音,熟练掌握汉语拼音方案的有关规则,否则就无法使用。对我国南方方言区的人而言,使用这种检字法就要困难一些,比如查?quot;娘"字,在鼻音声母和边音声母不分的地区,就不能肯定到底应该是在以n开始的音节中查找还是在以l开始的音节中查找,查检平舌音声母和卷舌音声母、前鼻音韵母和后鼻音韵母的汉字也有这样的情况;如果不了解有关拼写规则,就不知?quot;鼋"字不能在u查找,而要到以y开始的音节中查找。又如四角号码检字法,它根据汉字四角形状特征代之以号码来查检汉字,但是,汉字形体千差万别,结构复杂多样,并不是呈规则的形状,因而对汉字四角笔形的认识理解,往往会因人而异,如果使用者的理解认识与四角号码规定者的认识不一致,查错一个角,就可能找不到要查找的汉字,更何况,汉字四角都有查错的可能性存在。例如"戏"字,其四角号码是 1345,右上角是查点,代码是3,但不少人理解右上角是插,那样的话代码就应该是5了,但实际上是右下角处理为插。当然,所?quot;戈"字旁都是这样处理的,上面是点,下面是插,知道这一点,就不会查错了。
但是,就算拼音字母顺序法没有方音问题,没有拼音方案的学习障碍问题,四角号码也没有角形理解的分歧问题,和拼音文字的字母顺序相比,汉字检字法也是不能及的,因为把汉字转换为拼音或四角号码,使用者的脑子都需要事先计算处理,脑子就要拐一个弯,不像拼音文字那样见字查字那样直截了当,那样自然。
第二,查字步骤烦琐。由于汉字结构的复杂,加上一些查字法不是直接就汉字的结构因素来安排字序,结果导致了汉字检字法查检汉字的手续烦琐,步骤很多。例如部首检字法,要顺利查找到汉字必须经过下列十几个步骤:
1.确定汉字的部首;
2.数出部首的笔画数;
3.在部首检字表中找到该笔画数;
4.在那个笔画数中找到该部首;
5.查看该部首后面的页码;
6.在检字表中找到该页码;
7.在该页中找到那个部首;
8.确定所要查检的汉字部首以外的笔画数;
9.在该部首中找到该笔画数;
10.在该笔画数中找到需要查检的汉字;
11.看该字后面的规定在正文中的页码;
12.在正文中找到该页码;
13.在该页中找到该字,查字结束。
音序检字法的查检手续也有近十道。笔画顺序检字法查检起来也是非常麻烦的,因为汉字的笔画大多是在六至十五画之间,同笔画数的汉字相当多,查找起来也非易事。例如《小学生常用汉字表》,共收录三千个常用汉字,其中六至十二画范围内的汉字都在两百个以上,而八、九、十画的汉字则在三百个以上,这样从头到尾查检相当费事。这还仅仅是三千个汉字,如果是五千、七千、一万、几万个汉字,按笔画查检,其烦人的程度就可想而知了。而拼音文字,一共就只有几十个字母,比如英文使用拉丁字母,才26个,俄文的斯拉夫字母采33个,日文假名也才五十个,所以查检步骤就非常简单了。
第三,标准难以掌握。汉字各种各样的检字法,由于设计者对汉字结构的分类有不同的认识,这样使用者往往就难以使用查字法查检到汉字,虽然大部分汉字的查检没有问题,但少部分汉字的查检就可能引入误入歧途。比如部首检字法,是我们传统的查字法,一般而言,按部首查检汉字,似乎是比较简单的事情,然而实际上部首的确定确相当困难,因为首先,汉字充当部首的偏旁,在功能上并不是单一的,在这个字中是部首,在另一个汉字中可能就不是部首,例如"木",在"桃、样、杨、树、梨"等字中是部首,在"沐浴"字中就不是部首;又如"马",在"验、驻、驾、驰、骋"中是部首,在"妈"字中就不是部首字中并没有,遇到这样的情况,查字时到底应该查哪个部首呢?往往就令人难以断定。其次,在位置上,部首在汉字中的位置不是固定的,或上或下,或左或右,或内或外,或居于一角,或断为两截,例如"草、照、仁、戏、辉、整、哀"等字的部首,位置各不相同,又例如"哀、衷、衰"等字,可以在"衣"部查找,这里的部首就被别的成分分开了,至于像"孰、史、麻、鹿、呆、甥、甫、尧",等字,部首就非常难以确定。
笔画顺序检字法的标准也不是那样容易掌握的。由于汉字是平面型文字,笔画结构呈多方向展开,不像拼音文字那样字母是按照线性的方向单向行进的。由于汉字的书写习惯不同,一些汉字的笔顺先后也往往因人而异,例如"有、右"之类的汉字,有人先写横,有人先写撇,那么排列汉字时应该以哪个作为标准呢?又如" 火、必、臼、凸、凹、及、米、犰"等字,都有笔顺不一致的问题,排列和查检之间就容易产生矛盾。
第四,不尽合理。部首检字法为了方便人们查检汉字,近年来作了一些改革,主要就是多开门的方法,对一些汉字采用归入几个部首的折中方法来处理,即一个汉字中的几个偏旁都可以充当部首,那么这个汉字就归入几个部首,在每一个部首中都可以查找到这个汉字,例如"相"归入"木"和"目"部,"党、堂、省"等归入"小"部同时又分别归入"儿、土、目"部,这样处理的好处是,使用者只要判断出其中一个部首就可以查找到这个汉字了。但部首法并沐浴始终如一地坚持这一原则,有时候纯粹根据字的构成成分来确定部首,如"问"归入"门、口"二部,"孟"归入"子、皿"二部,"常"归入"小、巾"部;有时候又从部首与字义的联系角度来制定一个字的部首,如"分"字归入"八、刀"二部,而同类结构的"公"字只归入"八"部,不归入"ム"部,"雠"归入"隹、讠"二部,但同结构类型的"辩"却只归入"辛"部,不归入"讠"部。就一般人而言,查检"辩"记可能查检"讠"部而不是"辛"部,如果根据查检"雠"字的经验在"讠"部查找,势必白查一次。又如"鸡"入"鸟"部不入"又"部,"呆"入"口"部不入"木"部,(同样结构的"杏"入两部),"妈"入"女"部不入"马"部,等等,没有采取多开门的方式,这显然是受传统部首检字法的影响所致。由于部首检字法既按字的结构成分定部首,又按字义和偏旁的联系来确定部首,对所有汉字的归部原则不一致,因此,碰到一个字,使用者就不知道到底应该按哪条原则确定部首,这无疑又增加了查字的难度。又如四角号码既规定一笔可以分角取号,又规定用过的笔形后角作零,这样就出现了矛盾,例如"扎"字的四角号码是5201,其中提手旁左上角取号,左下角笔形算用过,作零处理,而右偏旁右上角取了2,右下角又取1,右下角不作零处理,这样规定的取号方法明显是相互矛盾的。而且有些字的取号角形也是很不好理解的,例如"筹"字,号码是8834,左下角取笔形点,很叫人莫名其妙,不如取插5或取垂2,都比居中取点3合理。
三、检字法的局限所产生的后果
由于线性的几种检字法各有优劣,因此,为满足不同层次和不同习惯的使用者的需要,目前我国出版的字词典,往往采用多种检字法并用的方式,大多是正文采用汉语拼音字母顺序排列,另附部首检字法或四角号码检字法;正文是四角号码检字法排列的,就另附部首检字法和拼音字母检字法。
目前我国通行的汉字检字法,主要有部首法、汉语拼音字母顺序法、四角号码检字法、笔画笔形法。现代的字典辞书大多是以一种字序法为主,再附上别的字序法,以弥补其不足。因此,要更好地使用字典辞书,就得同时掌握几种字序法。例如我国最通行的《新华字典》和《现代汉语词典》,前面一般附有音序索引和部首字序法查检汉字,正文则按照拼音字母顺序排列字词条目。
多种字序法并存的好处是,可以满足各种各种不同习惯的人的需要,由于各种检字法排检汉字的角度不同,各有利弊,因此多种检字法并存,有利于相互补充。比如查字时,用一种检字法查不到需要的汉字,可用另一种方法查检。这种多检字法并用的方式,不过是不得已而为之的权宜之计,没有办法的办法,并非长久良策,因为这没有从根本上解决汉字的查检问题。
多种字序法并存的不足也是明显的,带来了两个方面的后果:
第一,加重了使用者的学习负担,由于现行字序法有这样或那样的不足,所以要顺利地查检汉字,就必须熟练掌握好几种字序法,而汉字的检字法看似简单,有的只需记住几句歌诀就可以了,然而由于汉字结构的复杂和字数的繁多,对汉字的结构分析认识并不完全一致,检字法的标准难以掌握,附带的要求多,使用起来相当麻烦,这就要使用者花一定的时间精力去学习,而且还并不容易学会。例?quot;辉"字,其中的"光、军、车、冖",似乎都是部首,然而都不是,实际上正确的部首是"小"部,即"光"的上半截。
第二,造成了人力、物力、财力的浪费,同时还加重了使用者的经济负担。字词典附列多种多样的检字法,单是有关检字法的内容,就占了字词典不少篇幅,有的多达一百多页,这给国家和个人都造成了人力、物力、财力上的浪费。例如商务印书馆1979年出版的《现代汉语词典》,其中检字法内容就占了150页,约占正文的10%的篇幅。商务印书馆1978年出版的《四角号码新词典》,正文为688页,前后另附的检字法110页,占全书七分之一强。这样一来,既要多用纸张,又要多排印内容,多用人力,书的价格也随着上涨,这无论对国家还是对个人都是不利的。多用纸张,势必又要多用木材,一本词典检字法就占一百对页,而且像商务印书馆的《现代汉语词典》,一般一次都要印刷数十万册,把全国所有的字词典加起来计算,其中检字法所使用的纸张是多少,相信数量一定是十分惊人的。
四、汉字检字法的革新
同拼音文字相比,汉字的结构规律性很差,所以排列与查检汉字就比线性文字繁难得多。加之汉语方言众多,读音不统一,因此排检汉字就很难找到简便而又快捷的方法。查字方法如果简便,那么例外往往就多了;如果查字方法细致决无例外,那么查字规则就繁复得难以掌握。比如以字形为依据建立部首查检汉字,可是并非每一个汉字都有部首,有些汉字虽然规定部首了,但难以确认,除非一个字一个字死记,例如"枣、史、电、卷、夷、夹、秉、弟、卵、卑、农、出、无、卡、东 "等等。如果以字音排列汉字,就要以普通话语音作为排字标准,按汉语拼音使用的拉丁字母顺序排列,但在普通话尚未普及、拼音方案掌握不好的情况下,使用就很不方便。无论是哪种方法,具体处理起汉字来都有一些模糊不确切的地方。
正因为如此,千百年来,许多学者都致力于汉字字序法的研究,从古到今发明的检字法,多得不计其数,总数超过了世界上其它文字字序法的总和。据有关资料统计,仅在1911年-1948年间,我国报刊公开发表的汉字查字法就超过84种;1961年底,文化部、教育部等四单位联合成立汉字查字法整理小组,在两年多的时间内,征集到完整方案170件;在上个世纪70年代末至80年代初,有关汉字电脑输入法方案有四五百种之多,简直令人眼花缭乱。这些方案,有的名称也是千奇百怪的,例如"元亨利贞法"、"江山千古法"(其实就是笔形笔画法,取每个汉字第一笔作为代表,"元亨利贞"就是横、点、撇、竖,起笔相同的汉字就归在一起)。但至今为止,还没有哪一种方案被公认为最行之有效的,因为它们总有这样那样的局限或不足,非常不自然,例如拼音字母字序法,由于汉字结构自身并没有表音要素,所以用汉语拼音字母查字,所凭借的字母完全是外在的,超出了汉字的范围,不像拼音文字那样是见字查字;四角号码同样也是这个问题,见字先想代码,就拐了一个弯,速度和准确度和拼音文字就相差太远了。因此,很多检字法由于种种不便应用的原因,往往都是昙花一现便销声匿迹了。
在二十世纪三十年代,我国一些研究检字法的专家学者,曾经议定完美的汉字排检法的三条标准:
第一,简易。检字法的简易又表现在三个具体的方面,那就是:①简单;②自然;③普及。就是说检字法规则不复杂,简便易用,而且是很自然的,少人为的主观的东西,符合客观实际,符合客观标准,而且这种检字法应该是属于大众的,大众易于接受和乐于使用的,而不是学者们孤芳自赏的阳春白雪!
第二,准确。检字法的准确包括两个含义,那就是:①一贯,②无例外。就是说检字法处理汉字的字序遵循同一条原则,比如部首,这个字多开门,那个字也是多开门;又如四角号码,笔形用过作零,那就所有的笔形用过后都作零,规则是一贯的,而且规则能查检所有的汉字,没有例外需要其它规则来补充。
第三,便捷。检字法的准确具体包括三个方面的内容:①便当;②直接;③迅速。就是说,使用这种完美的检字法查检汉字,方便而又迅速,直截了当,不要曲里拐弯,让人一看就明白,一查就会,而且速度还很快捷。
根据这三大标准来决定完善的排检汉字的方法,则产生下列三个很自然的方式:
第一, 字形和笔形的分别和类别要简易、准确、便当;
第二, 条例的制定要简易、准确、便当;
第三, 方法的运用要简易、准确、便捷。
以上完美检字法的标准的方方面面,归结起来就是四个字:易学易用。
然而,历代学者梦寐以求的"易学易用"的汉字检字法,并没有遂人心愿而产生出来,汉字检字法依然难学难用。
造成汉字各种检字法的不便运用这一局限性的根本原因在于汉字本身。林语堂在上个世纪二十年代在曾经这样说过:"中国汉字字体复杂,变化无穷,加以写体印体的区别,笔画先后的不同,所以无论任何方法,欲求简易则失之疏漫,而欲求缜密则又规则繁难,绝对没有又简单排列又精确的办法。"拼音文字的排检是最为干脆的,因为形音统一,字母数量有限,词典的编排秩序完全顺其自然结构,极少人为的东西,只要明白了有限的几个字母顺序,就能快速而准确地查检词语了。而反观汉字的检字法,无论是依其声,还是依其形,都难以求得统一。
由于汉字自身的局限性,要想在现行汉字基础上设计出简明、便捷、实用的字序法是非常困难的,要打破现行检字法的局限,最终解决的出路还是在于改革汉字,比如简化汉字的偏旁系统,调整汉字的结构布局,使汉字在结构上规整划一,具有一定的规律性,这样排列汉字和查检汉字就方便了。
但是在当前汉字还没有进一步改革的情况下,我们可以对现行检字法进行一些调整,以便于运用。例如部首检字法,就可以适当减少部首数目,简化部首系统,这样更便于学习和使用。
1961年11月,我国文化部、教育部、中国文字改革委员会、中国科学院语言研究所联合组成汉字查字法整理工作组,整理并提出的《部首查字法》规定了 250个部首;1983年中国文字改革委员会和国家出版局联合发布《汉字统一部首表(草案)》,议定部首为201个;我国当前影响最大使用最为广泛的《新华字典》、《现代汉语词典》分为189部。其实,从汉字的实际情况看,这些部首数量都太多了,不便于人们学习使用,还应该进一步调整简化部首系统。笔者认为部首系统的调整可以做以下方面的考虑:
第一,将笔画结构复杂的部首取消,与别的部首合并。例如像"鹿"部、"麻"部,完全可以合并到"广"部中,作为偏旁部首,"广"字的部首特征比"鹿" 字、"麻"字要突出得多,因此立部应该采取就简原则,本身已经含有部首且这个部首特征非常明显,这样的汉字就不必立作部首。又如"鼻"部,其实完全可以合并到"自"部中去,而且从原始意义讲,"自"的本意就是鼻子的意思,用"自"代"鼻"无论从意义上还是从结构上都讲得通,具有可行性,而且更加便于使用。又如"麦",其实可以合并到"夂"部中去,也可以同"青"部合并另离一个"�"部,新立一个部首而取消了两个部首,从数量比方面看也是合算的。
第二,取消收字少的部首。汉字数量很多,《现代汉语常用字表》规定的常用字为七千个,这样有些部首涉及到的汉字就很多,然而实际上有些部首所管辖的汉字非常少,比如《新华字典》收字上万个,189个部首,平均每个部首差不多有53个汉字,但有些部首只有几个汉字,例如"青"部只有五个汉字(注:不含本字,以下同),"采"部只有六个字,"赤"部七个字,"音"部五个字,其实像这样的部首,单立一部意义不是很大,使部首系统显得繁杂,加重了使用者的学习负担,不如取消。这些部首也可以按照第一条方法进行整理合并,例如"青"可以归"月"部,"音"可以归"日"部或"立"部,这样也可以化简部首系统。
第三,取消繁体字部首。如果按照现行规范汉字的标准,很多部首其实是用不上的,尤其是那些涉及到繁体字的部首,对一般人而言不过是摆设,没有什么实际意义,例如"食、馬、車、歯、壟、韋、鳥、風、麥、鹵、鬥、魚、糸、門"等部首,只有查检繁体字才用得上,因此一般字词典没有必要分那么多部首,这样反而累赘。
以上三个方面,至少可以简化部首四十个。
此外,还可以研究新的检字法,比如像《三角号码字典》、《新部首大字典》等,都有创新的检字法。近年电脑输入汉字方案非常多,其间有没有可以借鉴运用于字词典的检字法呢?我们认为是值得研究的。有关方面、比如教育部、国家语委等,应该拨专款,从财力上支持新的检字法的研究,因为一种优秀的检字法的发明运用,是利国利民的大好事,应该大力提倡大力支持。
当然,检字法的内部调整也好,创新也好,都只能是修修补补,不能从根本上解决汉字检字法存在的问题。汉字检字法问题的根源在汉字自身,在现行汉字基础上和普通话还不是十分普及的情况下,要设计出一种"易学易用"的完美的检字法方案来,我们认为是很难很难的,甚至是不可能的。大家如果对汉字的检字法感兴趣,在学习之余不妨进行这方面的探索研究。
没有评论:
发表评论