《四角号码检字法》序 中华文库
《四角号码检字法》序 作者:胡适 |
近年以来,“整理国故”的喊声居然成了一种时髦的倾向。但“整理”一个名词的意义似乎还不曾得著充分的了解。穿凿傅会,算不得整理;武断的褒贬,也算不得整理。“整理”是要从乱七八糟里面找出一个条理头绪来:从昏乱湖【糊?】涂里面找出一个明确意义来;从盲从和武断里面找出一个正确评判来。这三条路之中,第一条路最难下手,却正是下手的工夫;最没有趣味,却又是一切趣味的钥匙;最粗浅讨人厌,却又是一切高深学问的门径阶级。这种工作完全是“为人”的工作,是大慈大悲救苦救难的工作。做的人吃了千辛万苦,只要别人从此以后永永不用再吃同样的苦了。所以做这种工作的人,无论他们的成绩如何,都是学问界的恩人;我们都应该感谢他们,敬爱他们。
应该这样整理的材料很多;但最难做却又最不可不做的,我们不能不算中国字的整理——就是中国字的分类与排列。
为什么最难呢?第一,字的数目实在太多,研究须费很大的工夫,很长的时间,所以许多人望而生畏了。第二,中国字不是一个人造的(仓顿造字之说是神话),不是一个时代里造的,乃是几千年中慢慢地孳生增长的,本来没有一贯条理。有些是象形,有些是会意,却又有些是谐声。字形,字义,字音三个方面,随便那一方面都可以作字的起源,所以绝对不能有一贯的系统。后来从篆文变到隶书与楷书,楷书又变到所谓“宋体字”,本来的形体都失掉了,系统更不容易寻了。普通的人谁知道“东”字是从日从木呢?谁知道“莫”字是日在艸中,下边的“大”字也是“艸”的变相呢?从前有个刻薄的人说,“矮”字和“射”字的意义弄颠倒了,因为“寸身”应该是“矮”,而“委矢”应该是“射”。他不知道“射”并不从寸从身,只是像那手弯弓之形;我们看甲骨文和金文便知此字全是象形,绝非会意。“矮”字也与“矢”字无关,只是“倭”字的变相;此字本作”倭”,后人因为“短”字从“矢”,故联想的结果把“倭”字也改成从矢了。故无论用古文的系统,或用楷书的偏旁,终有许多困难,终有许多遗漏,顾得“东”字了,“西”字又怎么办呢?“南”、“北”又怎么办呢?有偏旁可认的字,无论如何武断(如“射”字),都还可以勉强分类;但“求”字“与”字“承”字等类的字又怎么办呢?如《康熙字典》的分类,“求”字属“水”部,是牵就现行的形体;然而“承”字属“手”部,却又是回到《说文》,不是一般人所想到的了。
本来没有条理的,我们却要去寻出条理来;本来没有系统的,我们却要去造出系统来:所以中国字的整理是一件最难的事。然而这件事业却又是不可不做的事。第一,字的分类与排列是一切字典辞书的基础;字的排列不可能,一切词典便不可能;字没有方便的排列法,一切词典便也没有方便的检查法。词典的检查不方便,识字便不容易了。第二,字的次第又是一切“索引”的基本。凡文件的分类庋藏,人名地名编排与检查,书目的编纂,书籍内容细目的翻检……这一类的事皆须有一种公认而易学的次第,方才可以一索便得,一引即至。字的排列没有一定,我们便不能不单靠内容和性质来做编排的标准:如文件须分事类,地名须依省分,人名须依《百家姓》,书目须分四部,那是多么困难的事呵!
古来的人也感觉字的整理的必要,所以也曾想出种种分类排列法来。向来的法子,约有几种:
(甲)依古文的来源分类。许慎的《说文解字》是最早用此法的。这个法子有许多困难:(一)古文的来源不易确定,如“三画而连其中”为“王”,“闻一知十”为“士”之类,显系晚出的曲说。(二)部首亦无天然的次第;一部之内孳生的字也没有天然的次第。(三)此法重在研究字的本义,而本义往往极不重要,又多为一般人不认得的。(四)此法须用古文,与现行字体相差太远。
(乙)依韵分类。《佩文韵府》,《经籍纂诂》,《纪元韵编》,《通鉴地理今释》一类的书即用此法。凡字必有音,有音即可分韵,这是此法的长处。但此法也有短处:(1)汉字没有字母,字音没有显明的记号,所以不认得的字便不能分韵。(2)韵有古今之别,而中国韵书或用《唐韵》,或用《洪武正韵》,只有少数学者懂得,决非人人能用的。(3)韵有地方的差别:广东人能分别侵、真,而长江流域人不能分真、蒸;至于入声,更不是北部中部人能容易分别的了。(4)韵书上保存了许多难辨的分类,如东、冬之分,如鱼、虞之分,如寒、删之分,如幽、侯之分,……之类,所以困难更多,非硬记不可。
(丙)依现行字体分部首,并依现行字体的笔画分先后的次第。《康熙字典》即用此法;现行的电报码也略依此法。此法比《说文》用的古文部首法自然要算一大进步了,因为前文(甲)条所举的四种短处都没有了。此法的最大长处是依字画定部首的次序与每部的字的次序。有了此法之后,词书的编排与检查都更方便了,所以从前的旧法都渐渐被淘汰了。然而这个法子也有许多困难:(1)部首仍是太多(《康熙字典》有二百十四部)。(2)字的分部有时很难看出,如“公”字属“八”部,而“分”字在“刀”部;“仝”字在“人”部,而“全”字在“入”部;“舍”字在“舌”部,而“含”、“合”都在“口”部。至于“众”字在“目”部,“舆”字在“臼”部,“丱”字在“丨”部,……更不容易寻了。(3)字的笔画不容易分断。“子”字“幺”字何以算三画?“弓”字何以不能算四画?“马”字何以又算十画?(4)同部之字太多,如“艸”部近二千字。(5)同部又同笔画之字太多,虽有分画的法子,仍旧难定次序。
(丁)依字的画数分次第。这个法子本是用来补助部首分类法的;但撇开部首,有时也可以独立,《康熙字典》里的“检字”一门,即是用此法编纂的。近年新编的字典也常用此法来编“检字”的索引。这都是补助部首的用法。此法单独用来编纂字典,是不行的,因为同画的字太多了。但近几年的经验颇使我们知道此法可以用作简单的索引,如电话簿,书籍内容索引,药目,书目之类。此类的索引,因为名目不多,字数不繁,同画的字比较很少(统计起来,只有八画至十一画的字数稍多),所以不妨单用字画的多少来定次序。但此法也有短处:(1)字画的连续和分断有时容易算错。(2)同画之字太多时,便不适用。(3)最大的缺点就是字画必须一笔一笔的计算,检查时不能迅速。
(戊)依起笔分类排列。这个法子是旧日的胥吏发明的。各部的胥吏管理档案,感觉旧法分类的不便检查,所以有人发明“江山千古”的四字诀:“江”字代表“、”,“山”字代表“丨”,“千”字代表“丿”,“古”字代表“一”。他们知道中国字的“起笔”不外这四种,所以用这四种分类,以便检查。这个法子的最大长处在于只有四类,最便记忆,最易检查。故简单的索引可以用此法。但这法子也有大缺点:(1)同起笔的字太多,故此法不容易独立行用;于字典词典一类决不适用。(2)仅用起笔,虽很简单,然起笔有时不易规定;如“有”字,先写“一”或先写“丿”都是常见的事;如“女”字,有人先写“丿”,也有人先写“一”。
以上略述向来通行的五种分类排列法。此外还有许多种不曾试行过的,我不用说了。简单说来,向来的法子或是太繁笨了不便检查,或是太简单了不适于字典词典之用。将来注音字母通行之后,国音渐渐普及了,音标(字母)的使用也渐渐习惯了,也许我们可以用音标来分类排列了。但在音标的文字通行之前,我们对于这种方块头的汉字似乎总不能不想一个较方便的分类排列法,凡是肯在这件大事业上面用心思去研究的,凡是对于这个问题提出新解法的,都是我们应该欢迎,应该感谢的。
王云五先生前年就研究这个问题,费了半年的心力,“没有一日暂停”,还加上八九个助手的力量,到去年五月里才能发表他的《号码检字法》。他把中国字的笔画分作五类,每类用一个数目代表:
第一类:横和刁 (第一位)
第二类:点和捺 (第二位)
第三类:竖和竖钩 (第三位)
第四类:撇 (第四位)
第五类:屈折与右钩 (第五位)
如“天”字有两横,一撇一捺,故号码为“21010”,“黄”字有五横,一点,四竖,一撇,一屈折,故为“51411”。
这个法子虽容易懂得,而计算颇繁重,不能算是很方便的法子。所以王先生自己很不满意,仍旧继续研究。去年我到上海时(十月),他对我说,他有了一个更容易又更完备的新检字法了。那一天是星期,我同他从哈同路回来,坐在人力车上;他把那法子告诉我,我随便指街上店招牌上的字问他,他举了几个例,我就懂了。后来他也指著招牌上的字来考我,我居然也能用号码回答他。我那时觉得这法真是容易,只消几分钟就把我教会了。这个法子就是现在王先生发表的《四角号码检字法》。
这个法子的大致是把每个字的四角(左上,右上,左下,右下)的笔画用号码记出;笔画有九种,恰好用九个单位数目做码子;角只有四个,故每个字的号码只有四位。九种笔画的号码是:
①=横与刁,例如 汀
②=竖,例如 上
③=有交叉的竖,例如 土
④=撇,例如 亻 冖
⑤=有交叉的撇,例如 大
⑥=点与捺,例如 衣
⑦=交叉的点与捺,例如 爻
⑧=左钩,例如 于 犭
⑨=右钩,例如 戈 元
凡连续不断的笔画,前截已有了号码,下截所在的角上用“0”号记出。没有笔画的角上也用“0”码记出。我们可举几个例:
天 1056 地 3319
玄 6016 黄 3346
宇 6080 宙 6022
洪 6316 荒 3349
自去年10月到今天(4月),又是半年了。王先生在这半年之中,继续研究这个检字法的实地试验,把所有的困难问题都试验过,都解决了,然后把他的新发明公布于世,供大家的讨论采用。总计王先生前后共费去了一年半的工夫,的的确确“没有一日暂停”专研究这个最难又最重要的问题。即使他没有好成绩,他这种毅力,这种热心,也是我们应该十分敬服的。何况他新发明的检字法确是一个很重大的贡献呢?
王先生说一个检字法应该具有八个条件。他自己指出这个检字法是具有这八个条件的。我们试用过这个法子的人,都可以承认王先生这话不是过分的自许。他这个“四角号码检字法”确有许多胜过前人之处:
(1)不用部首,可免分部的困难,又使不懂部首的人也可以用这种检字法。
(2)不消汁算全个字的画数,只消计算四角,可省无数时间与精力。“口”与“围”同码,而“麤”的计算比“一”字还容易;这是多么经济呵!
(3)不问笔顺,因为笔顺容易有争端;只问四角,因为四角是机械的,客观的,不会有主观上的先后不同。
(4)“号码检字法”必须依笔画的种类先分类计算,然后依著各类的次第用号码记载出来。如“黄”字,须先算五横,次算一点,次记四竖,次记一撇,最后记一屈折,故号码是“51411”。种类不可乱,次第更不可乱;你若先记竖,后记点,就成了“54111”,就不对了。这是很难的,很麻烦的,很容易颠倒错乱的。依现在的《四角号码检字法》,我们可以不必管这“黄”字有几横几竖,也不必问横先竖后,只看四角就是了,故号码为“3346”。这里的号码只是每一角的笔画的代表,不是每类笔画的总数;我们认笔画时,同时即是记号码,不须分类,不须记总数,不须死记次序,所以容易的多多了。
(5)我们在上文说过,从前的种种检字法,繁的太繁了,简的太简了,都不适于作字典词书之用。这个“四角号码法”的最大好处就在能做一切字典辞书之用,凡辞书的排列法必须有一个根本条件,就是要使人容易找出某字在字典的某处。例如我们见Dictionary这个字,立刻就知道他在字典的“D”字部“DICT”的一页,他的位置是有一定的,不会颠倒的,是不用猜想的,是不用计算的。中国字典里的字,部首的次序先后没有一定,同部同画的字也没有一定的次序。同是四画,为什么“心”部远在卯集之首,而“犬”部远在巳集之末呢?同为水部十画之字,为什么“溍”字在第一,而“滁”字在第八十几呢?况且部首的归类,先就没有一定的标准:还是根据古文呢?还是根据现在的字体呢?还是靠左边傍分类呢?还是靠右边傍呢?还是用上半截呢?还是用下半截呢?“承”字在手部,是依古文;“举”字在臼部,又不依古文了。普通的读者自然只认得现行字体;然而“明”字在日部,“胡”字在肉部,“朋”字在月部,“胜”字在力部,“滕”字在水部,“服”字在月部,这些谜多难猜呵!若用王先生的新法,每个字有一个号码,号码的排列有天然的顺序:“一而十,十而百,百而千,千而万”,绝对不可颠倒,丝毫不用瞎猜。“玄”字为“6016”,“宙”字为“6022”,“宇”字为“6080”,数目即是次序,还不容易吗?所以王先生自己说:“号码的先后次序,都至显明,无论何种方法都比他不上;真可谓一望而知的了。”
(6)从前用部首和画数的法于都有一个大困难,就是同部的字太多,同画数的字更多。近年吴研因先生等编纂的《学生字典》的“检字”一门,把同画的字分作四类:(1)横起,(2)直起,(3)撇起,(4)点起,这种救济的办法正可以证明同画字数之多实是一种大困难。王先生的“四角号码法”也有一种同类的困难,就是同码的字也还不少。如“口”部的字,如“门”部的字,都是同号码。他曾列出一张表,九千字之中,不同码的字只有四百六十三个,只占百分之五;而同码的字在十个以上的却有百分之五十五之多;最多的有八十八个字同一码的。这也是不可忽略的一个问题。王先生因此又想出一个救济的办法:凡同码的字,另计算每字中所含“横”数,各加一小数,依次排列。例如“十”、“中”、“申”、“串”、“车”都是“3000”,可以这样排列:
“十”字有一“横”故为 3000.1
“中”字有二“横”故为 3000.2
“申”字有三“横”故为 3000.3
“串”字有四“横”故为 3000.4
“车”字有五“横”故为 3000.5
这样计算,不同码的字便增至三千二百之多,占千分之三五五;同码的字至多不过十个;这就不成问题了。
以上略略指出这个新检字法的特别长处。我以为王先生新发明的法子确是最容易,最方便,应用最广的法子。依我看来,这个法子是可以普遍采用的。他的最大阻力不过是两个大魔鬼:一个是守旧,一个是懒惰。守旧鬼说:“仍旧贯,如之何?何必改作?”懒惰鬼说:“这个法子很好,可惜学起来有点麻烦;谁耐烦费几分钟去学他呢?”这个懒惰鬼最可怕;他是守旧鬼的爸爸妈妈;一切守旧鬼都是他的子孙!我很望国中一班不懒惰的人费几分钟去学习这个《四角号码检字法》;先学会了,方才有批评的资格。王先生抱著“为人”的弘愿,费了整整一年半的工夫,才有这样好的结果。我们不可让我们骨头里的懒惰鬼辜负了王先生一番大慈大悲救苦救难的工作!
这个《四角号码检字法》只有一点小小的难处:我们必须记熟那九种笔画的号码。为便利记忆起见,我今天编了一只歌诀,也写在这里,请王先生教正:
一横刁,
二三竖。
撇四,叉撇五。
点捺同是六。
有叉变成七。
左勾右勾八九毕。
十五年,四月,二十三夜上海,客利饭店
后记
王云五先生的《四角号码检字法》,最近又有第二次改订的新法了。新法的大意是注重从前最感觉困难的许多例外,故用一些“复笔”做单位,如“头”(亠)“叉”(十,乂)“方”(口)“八”,“小”等,来驾驭一切发生问题的字角。这么一来,检字更方便了。云五先生这种精益求精的毅力,更使我们敬佩。我这篇序本来大可以毁去了,但因为序中的叙述颇有历史的意味,所以我把此序保存在这里,作为检字法演变史的一种材料。并摘记新法的要点如下:
(1)笔画分为十种,各用号码代表[1]:
笔形 | 亠 | 一【横提】乚 | 丨丿亅 | 丶乀 | 十乂 | 【两横一竖】 | 口 | ∟┘┌ ┐乛 | 八丷人 | 小灬【当字头】忄 |
笔名 | 头 | 横 | 垂 | 点 | 叉 | 插 | 方 | 角 | 八 | 小 |
号码 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
(2)遇单笔与复笔并列时,应尽量取复笔。如“亠”作0,不作3,“寸”作4,不作2,“丷”作8,不作32,“小”作9,不作33。
我们可以仍举“天地玄黄,宇宙洪荒”八字作例来说明这两条规律:
天 1043 地 4411
玄 0073 黄 4480
宇 3040 宙 3060
洪 3418 荒 4421
(3)由整个囗门斗所成之字,其下角取内部之笔。但上下左右有他笔时,不在此例。
如 因=6043
闭=7724
斗=7712
但 茵=4460
澜=3712
(4)旧法于四角之外,另加“横”数,使同码字减少,以便检查,但是碰著“横”数较多如“缰”、“讟”等,包含十“横”以上的字,计算起来,比四角反要费时,所以新法又发明了第五角,取右下角上方最贴近而露锋芒的笔,为第五角。例如“进”、“适”、“迹”、“避”等字,都是3030,就可以有这样排法:
进——3030.1
适——3030.2
迹——3030.3
避——3030.4
这样计算第五角,所费时间不过四角的四分之一,于是那同号码过多的问题也就解决了。
上回我曾编一只笔画号码歌诀送给王先生,现在他的新法十种笔画,也可以编作一只歌诀如下:
一横二垂三点捺,
点下带横变零头;
叉四插五方块六,
七角八八小是九。
不知王先生以为如何?
十九,二,七
收入王云五著:《四角号码检字法》,
1933年12月商务印书馆初版)
- ↑ 表中部分笔形因电脑输入法有限无法完全展现,请参见纸质原著。