图显世态 文说天下 图文吧——最全的微信公众号/资讯聚合平台
首页/百科/周六荐书|汉字的历史与特征

周六荐书|汉字的历史与特征

《东方历史评论》微信公号:ohistory


以下文字摘自《哥伦比亚中国文学史(梅维恒[Victor H.Mair]主编,马小悟、刘文楠、张治译,新星出版社7月出版)之第一章第一节,由梅维恒撰写,标题为编者所加。



1


汉字简史



殷墟甲骨文


中国最早的文字可追溯到公元前1200年左右的“甲骨文”(不过这是个现代词汇)。些许零星分散的陶器标记和其他人造器皿上的符号可以追溯到三千到四千年前,不过它们构不成可以记录一种句法清晰的语言的书写体系,而且也没有证据表明它们与后来中国文字有什么关联。这样,基于现存记录,中国的书写体系首先出现于将近两千年前,比美索不达米亚和埃及(二者都出现在公元前3000年左右,美索不达米亚明显略先于埃及)要晚。这自然生发了一个问题,即中国文字是否独立产生?以下几点证据会表明,颇有一些刺激性传播发生着作用:一、汉字看起来是在一夜之间羽翼丰满,没有经历过长期的逐渐演化过程,而在西南亚,文字产生中的这些演化有案可稽;二、汉字被证明是紧接着炼铜术产生的,并和马车的出现几乎同时,而考古学家和科学史专家已经确认炼铜术和马车都源出于西亚;三、中国文字体系的特性(基本上是具有语义量词和听觉元素的语素音节,同时也包括象形成分和表意成分等等);四、许多学者多次独立发现最早汉字的一些字符群在视觉上和对应的西亚字符群很相像(在中国用于计数和历法的二十二个天干地支,可比之于在它之前的腓尼基人和乌干特人呈现各种变体的二十二个字母[特别是其最短形式最明显]),并且就我们所知的三千多年前它们的发音而言,它们似乎有共同的语音对应(这不必然需要黎凡特地区和中国之间有直接联系,而是某种间接传播,或者刺激物最早产生于东西方之间的某地,同时向两个方向传播);五、大量个体汉字在形状上、意思上以及有时甚至发音上很像其西亚对应字;六、已经高度发展的汉字在最初的几百年间只服务于一种高度专门化的用途(王朝卜筮的记录),而在接下来的几百年中又用于另一个高度专门化的用途(贵族青铜钟鼎上的铭文),这暗示着汉字为贵族或者神职人员及其后继者这一小团体所垄断,他们小心翼翼地护卫着自己书写汉字的技能。以上没有哪个单独证据能够充分质疑汉字的本土原生性,但是这些证据加在一起就足以说明,不能轻易打消外来影响的可能性。



腓尼基人的字母表


不论它何时形成,我们今天所知的汉字原来只是用来记录卜筮中的问与答,这就是上文中提到的甲骨文。甲骨文和商朝国君有密切的关系,起始于武丁(在位时期:约前1200—约前1181)及其长于卜筮和释卜的亲近顾问。这样,中国最早的文字是王室专属物,专门指派给史官卜人。然而在近东(西南亚和东北非),早期的文字有从经济管理到文学宗教等各种用途。


不能说甲骨文是出于一种文学意图,它们所触及的仅是君王所感兴趣诸主题的一小部分,但是有时也显示出某些文学效果,或者预见了后来中国文学写作的一些特质。下一时期的文字(金文)同样也是如此。金文主要是在周朝,不过重要的是,汉字在这一阶段已经伴随着青铜器流布到王公贵族一层。而且,现存最长的金文从甲骨文的十数个字扩展到将近五百字。


随着文本长度的增加,汉字的数量也激增。甲骨文单字总共加起来接近4500个(包括约1000个异体字),其中仅有1000到1500个字有后世的对应文字。周朝的金文有差不多4000个单字,其中略超过2400个字是可辨的。由于证据过于支离破碎,所以很难确定战国时代(前403—前221)丝帛、竹简、青铜和石刻铭文等中使用的汉字数量,不过肯定是超过了5000个,包括各地使用的许多异体字。秦始皇在公元前三世纪后期统一六国,“书同文”政策清除了各地的异体字和重复字,不过不久汉字的数量又再次激增。此后各时代字典收录的汉字个数如下:9353(100),11520(约227—239),12824(400),13734(500),22726(534),26911(753),31319(1066)。最近的字典收录了超过六万个汉字,有两部字典甚至收录了超过八万汉字,而几位北京大学学者甚至计划编写一部罗列超过十万汉字的大字典。汉字的这种天文级数量对于表音文字使用者而言是不可思议的,因为他们字母表中的字母通常在20到40个之间。


实际上,汉字的数量是开放的,仍然在不断增长。汉字使用者可以自由创制新字(许多人这样做了,比如在取名时,或者科学家首次发现未知元素时)。某个汉字一经创制,它就永久在汉字表中获得一席之地。这迥异于不增加字母总数而通过重新排列字母来创造新词的表音文字(莎士比亚一个人创造了将近1700个新词,比如barefaced, castigate, countless, critical, dwindle, excellent, fretful, frugal, gust, hint, hurry, leapfrog, lonely, majestic, monumental, obscene, pedant, radiance, submerged和summit)。也就是说,无论英语中加入多少新词,字母的数目(26个)是不变的。当然,汉语也可以通过组合语素来增加词汇量,而从来就是这么做的。比如在官话中,天、花、粉和板四个字可以组合成为“天花”“天花粉”(栝楼根制成的一种中药)“天花板”等等。实际上这是汉语中创造新词的标准方式,但它没有阻止新汉字的激增,这部分是因为每个时代都有全新语素产生,不过也是由于人们希望与众不同,而与众不同的方式之一就是创造新词。


很明显,人们只能记住这些天文级数量汉字中的很小一部分。若要基本能够识文断字,需要记住1000个汉字,2000—3000个汉字则足以应付大多数环境,而达到“完全识读”水平(包括读报以及就各种主题进行书面交流)则需要约4000个汉字。掌握6000个汉字(中文处理软件和常用案头字典所提供的汉字字数)是非常了不起的,而单个人是否掌握1万或者更多汉字则值得怀疑。大多数书写都习惯性地仅限于使用几千个汉字,这一现象不仅发生在今天,在中国文学的最高峰唐诗中亦如是。数万汉字中的许多字在历史上仅仅被使用过一两次,它们的发音或意义(或者二者都)很难确定。然而,字体创建者必须要考虑到这些汉字,因为它们会不时出现在文本中。信息处理专家必须准备提供至少25000个汉字以敷日常之用,即便这些汉字中的绝大多数在大多数文本中的出现频率小于十万分之一,它们仍然不时出现在姓名、历史事件、词汇讨论等中间。


汉字的数量虽然很庞大,但它明显不等同于任何一种汉语中的全部词汇,也更不等同于所有汉语中的全部词汇。实际上现代标准汉语中的词通常是双音节的,即便是文言文中也经常使用双音节或者多音节的词或者术语(包括所谓连绵字、复合字或者复音字、拟声词、同义词,以及其他种类的共同词项)。于是,虽然汉语被广泛认为是单音节的(由单音节词构成),但是经过对实际使用情况的细心分析后,我们会发现并非如此。汉语中的绝大多数语素是单音节的,但是包括英语在内的绝大多数其他语言中的语素也以单音节为主,另外在汉语中(甚至在文言中)有大量多音节语素,比如“蝴蝶”“蜘蛛”“孑孓”“琵琶”“枇杷”“珊瑚”“麒麟”“凤凰”“忐忑”“逶迤”和“尴尬”。这些词中的一部分也许在古代是包含复辅音的单音节字,而语音演化以及随之而来的音位配列导致了汉语中所有复辅音的分裂。复辅音被再分配在两个相邻音节中,这叫做“一分为二”(dimidiation),此种双音节化过程似乎在晚近的上古汉语中相当常见。并且一些学者认为,复辅音的分裂和某些末尾辅音的消失导致了汉语中声调作为一种补偿而诞生。还有一些学者则提出,这些过程也导致了双音节词数目的激增,使得汉语在面临日趋同音化时,能确保口语中有足够的词汇差异性,特别是在一些汉方言中的声调日趋减少的时候(在普通话中,现在只剩下四声:阴平、阳平、上声和去声,但在一些传统分支如闽南语和粤语中,声调要多得多)。


藏缅语中的对应词研究,以及与印欧语系、南亚语系、南岛语系和其他语系之间相互的古老借词比较,表明了汉语中原来是有复辅音的。除了上面提到的语音变动,汉字本身的音节特性也强化了复辅音的分裂,因为世界范围内的音节文字都展现了一种在结构上单个辅音加元音的大趋势。类似的语音约束,加之以上提到的对极致简洁的追求,也导致了曾经一度存在于上古汉语中的词形成分(前缀、后缀和屈折等等)的丢失。而在中古汉语,甚至在现代汉语中,这些丢失的词形成分在上文提到的阿尔泰化和白话过程中,又得到了复原,区别在于语法成分不再加于词根之上作为变化,而是作为加于语素音节开头或末尾的单独音节(书面中则为单独汉字)。


2


汉字的特性


正如上文所提到,文字不等于语言,语言不等于文字。某种特定文字可以用来书写多种不同而彼此无关的语言(比如英语、土耳其语、越南语和印尼语都用罗马字来书写),而某种特定语言也可以用不同文字来书写(如维吾尔语根据历史年代排序曾用过以下文字来书写:卢恩文字[runes]、古回鹘文字[起源于阿拉米文字,经由粟特草体演变而来,是蒙文字和满文字的祖先]、阿拉伯文字、西里尔文字、罗马文字,然后又再是阿拉伯文字)。因此文字的分类与语言的分类是无关的,反之亦然。汉语的分类上面已经讨论过了,本节主要对汉字进行分类。


对于该给汉字贴上什么样的标签,仍旧未有定论。虽然在非专业文献中,经常把汉字称为“象形文字”,这是非常不正确的,因为只有一小部分汉字如山、日、马、鸟、鱼、龟,在创制之初是有意仿照事物样子的。即使是这一小部分象形字,其现在的字形,对于不熟悉汉字的人来说,也完全辨认不出来它们的象形对象。同样只有一小部分汉字——如“上”“下”和“中”等等——是表意的,而且只有接受过专门训练的人才能辨识出它们的表意之处。所以将汉字称为表意文字也不妥当。许多权威专家比较接受“意符文字”(logographic)这个提法,这意味着汉字的每个音节单位都等于一个词,因而汉语是单音节的。对汉字的更准确描述应该是语素音节型(morphosyllabic),这指的是每一个汉字单位在长度上都是单音节,传递一个基本意思。这里要重申的是,汉字的基本音节特性不能用来宣称所有汉字只包含一个音节。学者们使用语法分析、心理语言学和其他方法结论性地表明,除了汉字,汉语使用者对于其他单词的不同音节长度也有一种明白无误的感觉。


诚然,汉字基本上是单音节的,但还是有些例外,因为确实存在一些具有多个音节的汉字(有些可追溯到唐朝,甚至更早)。在这种所谓“合文”的汉字中,有比如“茾”(菩萨)、“”(菩提)、“”(涅槃)、“”(某乙)、“”(营田[使])、“瓩”(千瓦)、“”(问题)、“邗”(干部)、“”(社会主义)、“圕”(图书馆)(这些汉字当然也可以用多个汉字写出来),有些合字被广泛使用,甚至今天还能在标准字典中找到。在二十世纪,超过1000个这样的多音节汉字被广泛使用,这清楚地说明了汉语使用者有一种汉语并非完全单音节的天然的认知。这些多音节汉字多为代替许多常用词汇,所以这也预示着简化汉字的内心愿望。


另一个从十世纪后半期一直持续到十九世纪末的相关现象,是反切的使用。这是一种受佛教启发的注音方法,用两个汉字合起来为另一个汉字注音。反切时,通常写做“X Y反”,这表示X(反切上字)注声母,Y(反切下字)注韵母和声调。有时“X Y反”(三个字)经常写做“XY”(一个字)。在这种情况中,两个汉字就合成了一个汉字。这再次显示了,中华帝国晚期的学者不仅能进行语音分析——这一分析具有发展成真正拼音的潜力,而且显示了汉字体系并非毫无变通即注定是单音节以及单语素的,汉语更是如此。


实际上,在已知的最早汉字(甲骨文)中,两个甚至三个音节写成一个汉字的情况并不罕见,比如“乙祖”、“三万”、“十五发”所对应的甲骨文字。周朝的金文中双音节汉字不乏其例,如“小子”“小臣” “武王”和“文王”对应的金文。这些证据表明,在中国文字的最早阶段中,仍然有清晰的认识,即文字(和明显的词汇单位)是可以有一个以上的音节的。然而到了秦汉时期,汉字的单音节化趋势将有保留和传承价值的文本中的双音节字和多音节字几乎铲除殆尽。不过词汇单位可以是多音节的这一直觉还是保留着的,所以多音节汉字仍在不断被创造出来,如“不要”“二十”“三十”和“四十”的对应字。但是由于忠实于汉字单音节限制的压力太过强大,这些表达的合音和别的特定发音便孕育而生(分别是“甭”“廿”“卅”“卌”)。不过许多汉字双音节和多音节特质是不可否认的。而且上面提到过,许多汉语语素不止包括一个音节,因此在汉字的基本单位同时传递语音与语义的意义上,我们最好认为汉字是语素语音型或语义语音型(而非简单称之为语素音节性),而汉字的长度并不必然是单音节的。


不管我们将汉字完全称为意符型、语素音节型,还是语素语音型/语义语音型,大多数汉字(约85%,即形声字)都由一个传达语音的部分(声旁)和一个传达意义的部分(形旁)构成。不过声旁和形旁都不会准确告诉读者这个汉字的意思或者发音,而只是给出大略近似于该字的字义和字音。比如,读者也许会碰到一个字,它的形旁是三点水。三点水意味着这个汉字极有可能(但不必然)与水或者液体有关,这样我们会猜这个字也许意思是“浪”“溅”“浅”,等等。但是,仅仅从三点水来判断,我们不可能确定这个字的确切含义,只能得出这个字与水及其引申义沾亲带故。带三点水的汉字超过2000个,词义纷呈,从洁到汽、河、游、渔、泡、消、汁、液、油、酒、沟、淌、泻、沫、湿、滞、泥、淫、泪和澳,等等。仅仅辨识出一个汉字的形旁,在实际判断其词义的时候不一定会派上很大用场。同样的,读者可能会碰到一个汉字声旁为“方”(其四声代表的意思有很多,如方、妨、仿、访、舫、放、芳、枋等),而它的形旁表示它和“门”有关。只有将声旁和形旁连起来看,有经验的读者才能明白这个字读fang的第二声,它的意思是“房子,建筑物”。这一词素在文言文中是单独出现的,不过在现代标准汉语中与名词后缀或者一个同义字组成双音节词,比如“房子”、“房间”和“楼房”。另外,要确定某个汉字的意思,我们必须暂时忘记声旁(如“方”)自身也可以作为形旁,例如在於、施、游和旗等汉字中。在“旁”这个汉字中,“方”既是声旁也是形旁。


另外,许多形声字不止有一个读音,这很难用语音衍生过程来简单解释。比如上面提到的“施”字,实际上有下述多种读音:shī(施行),yí,yì,shǐ。在这种情况下(有两个及以上读音的汉字即“破音字”或“多音字”数以千计,其中最多的有十一种读音),读者必须在上下文中用直觉来判断某个字的确切读法和意思。


必须要指出的是,形声字是相对容易处理的汉字。读者要辨识剩下15%—20%的汉字,必须完全靠记忆从字形中抽取语音和语义。


虽然形声字有上面提到的种种复杂特性,但是它们的优势地位极大地支持了为汉字贴上单音节或者语素语音的标签。而且因为形声字的声旁是更重要的部分,汉字可以在基本上被视为一种附加了语义成分的音节或者语音文字体系。它由一张非标准的音节表所构成,若被标准化,现代标准汉语的所有音节可以在有声调的情况下用约400个汉字,或者在忽略声调的情况下用1300个汉字涵盖。在通用计算机字库中并不是这种简单的1:1对应,汉字和音节的比率为5:1或者16:1(后者考虑了声调)。这可以与类似的非标准化英文体系中约40个音素的15:1到40:1这一比率形成比较,英文中像sent, cent和scent这样的语义—语音词段也为英语贴上了语素语音文字体系的标签。


当我们了解到汉字体系包含了超过4万个兼具语音与语义的独立单位,便会很明显认识到汉字是一种令人费神的文字。只有花费大量时间,才能达到熟练掌握的程度。甚至像写下“打喷嚏”这样常用的词,都会遇到难以预期的困难,连中国人(除了汉字能力强的人)都很少能完全正确地写出来。中国西部约占全国六分之一国土的维吾尔自治区——新疆的“疆”字有十九画,也让很多人不堪其扰。灰心至极的他们,要么丢掉右边声旁的上半部,要么用六画的“江”这个同音字来代替,不过这样写是“不合法的”。同样的,“舞”字有十四画,也让许多舞厅经常用只有四画的同音字“午”来代替。另一个十二画的常用汉字“街”,由于它的出现频率太高,所以会让很多信笔写来的人丢掉中间的六画。“疆”“舞”“街”这三个都没有官方认可的简化形式,但是由于汉字的平均笔画是十二画,我们完全可以理解一直存在着创造出这几个简化字的强烈的冲动。运用最广泛的语音文字体系(如罗马字和日本的假名)是从更复杂的形式中演变而来的,所以汉字笔画简化的自然趋势可能将其导向一种语音文字。然而在政府和知识分子的强有力抵制下,这种趋势被阻挡了。


现代汉语中出现频率最高的语素“de”的对应汉字“的”值得我们特别关注。“的”表示所有格、形容词结尾、关系从句、介词短语和动名词等。这个汉字在文本中每间隔二十个字就会出现一次(!),一共有八画,即使其草体也让有些人觉得麻烦,所以——在私人场合——用字母“d”来代替(d是“的”拼音首字母)。“的”字的通用简化形式还没有发明出来,官方接受的简化形式更需假以时日。更具讽刺意义的是,用来书写无处不在的语素de的汉字“的”,其第二声至今还具有其原初意义“光亮,目标” (一千多年以前的发音为tiek ,两千多年前的发音大概为*tiawk)。


许多人现在经常私下使用字母d来代替“de”这个频率非常高的语素。实际上,de是个多义语素,至少是三个同音语素合而为一,而在书面中则用三个不同汉字来表示。有意思的是,用来表示这三个高频率语素的三个汉字原先的字义都不包括语素所指代的意思,而是被借用了:一、上文已提到,标记所有格和关系从句的de,用实际上意思是“目标”的“的”字表示;二、标记形容词补语的de,用原初字义为“得到”的“得”字表示;三、标记动词补语的de,用“地”字表示,其原初字义为“大地”,原初发音为di。现代汉语中这三个出现频率最高的语素(在通常的文本中平均占全部汉字6.5%)的对应汉字居然是原初具有不同语义、语义上被漂白的汉字,这一事实凸显了本章前几节中提到的汉字体系和白话之间的鸿沟。于是,有些人用一划而就的d(即写这个字母的时候,笔可以不离开纸面),来代替分别为八画、十画和六画的“的”“地”“得”。


汉字极其错综复杂和难以把握的特性对汉字读写和中国文学都产生了重大影响。汉字的一些社会意蕴、语言意蕴和审美意蕴,在本章以下的讨论以及全书各章中将得到清晰呈现


3


中国传统的语言研究


中国传统的语言研究叫做“小学”,这颇为发人深省,因为其对应的是处理社会政治主题、更宏阔的所谓“大学”。前佛教时期的小学——始于公元前数个世纪——几乎完全以汉字为中心,而对于语言本身一无所涉。(在现代标准汉语中,由于受日本的影响,大学的意思是university,小学则用来指primary school。)正是佛教,说服了不情愿的中国知识界在他们珍视的汉字之外,对口语也给予应有的关注。不过直到二十世纪之前,中国传统的语言研究都还在很大程度上聚焦于汉字,对口语只偶尔投以一瞥。


模仿日语中しょうがく和だいがく的对应汉字,小学的意思变成是primary school,大学用来指university——这一事实指向现代汉语词汇形成过程中一个非常有意思的方面。即,数以百计有其原初意义的重要词汇(特别是在科学、文化、社会学、经济学和教育领域),在前现代时期从汉语借用到日语中,然后这些词汇被日语赋予新的意义(通常在西方启发下),最终带着新的词义又回借给汉语。这种“往返词”包括了文学、文化、文明、语法、词汇、物理学、铅笔、演讲、讽刺、学士、博士、艺术、决心、具体、安全、封建、方面、法律、模特、保证、表达、观念、意义、自由、阶级、改革、革命、环境、课程、计划、经理、经济、权利、自我批评、机械、机会、机体、抗议、讲义、故意、公司、结构、教育、教授、共和、劳动、理解、流行、政治、社会、进步、信用、支持、思想、自然、方法、宗教、主席、便当、投机、预算、运动、游击,等等。(其中特别有意思的一个词汇是China在汉语中的对应词“支那”。China来自于秦朝的chin,后被梵语借用为Cīna,而最晚到唐代,这个词又回译为汉字“支那”,并远渡重洋到了日本。所以,“支那”基本上是一个“二度往返词”。“支那”这个词现在在中国是禁止使用的,因为在二战时被日本官兵所污,除了有些学者出于特殊历史效果仍偶尔使用它。)现代汉语词汇中更大的一个子类(用来对应英语中具-ology和-ism词尾的词汇)也是最初为日语所生造出来以对应西方概念,后来又为汉语所借用。与以上列举的“往返词”不同,这类词汇在汉语中原来并不存在。


对汉字的首次彻底考察是许慎的《说文解字》,这部完成于公元100年的作品至今仍作为与汉字有关事物的“福音书”而被频频征引。许慎将所有汉字分为六大类:


1.“指事”,属表意文字;

2.“象形”;

3.“形声”,形声字包含一个声旁和一个形旁,大多数汉字属于这个类别;

4.“会意”,字义由其组成部分的合义构成(如仁,言,信)。这是一个错谬的类别,因为实际上并没有哪个汉字是起源于这种方式; 

5.“转注”,这是一个晦涩的类别,它试图解释人们所认为的具有近似形状而相互之间轻微变形的汉字。有些成对的汉字之间具有非常微小的字形区别;

6.“假借”,这个类别涵盖的是同义词,同义词在金文中相对突出。


以许慎“六书”为代表的汉字研究一般被认为是中国的词源学。实际上,严格而系统化的汉语词源科学从未在中国建立起来。而词源学的基本内容——最早的使用以及词形词义的变化,告诉我们真正的词源学处理的是词的源流和演变。它包括词根和词素的语音语义分析,以及它们在不止一个词根的词汇中的结合。词源学关涉的是词的源流与演变,而非字的演变。中外学者正在合作编写一部中文的词源学词典,将于二十一世纪问世。



许慎著《说文解字》


《说文解字》的另一处瑕疵在于,即使是它的汉字研究也只以年代追溯到公元前三世纪左右的小篆为基础。小篆与之前的金文、甲骨文有长达千年的时间距离。结果是许慎对汉字字形的解读经常是严重错误的。由于未能意识到字从起源时到他所处的东汉,其间会发生何等巨大的语音转变,许慎有时在分析字的发音时会谬以千里。虽然有这么多不足,许慎还是被追认为中国的语言研究(更精确的应该是汉字研究)创始人,他的《说文解字》也成为后世这一领域著作的标杆。


许慎的最伟大贡献之一在于他抓住了如何给数千汉字排序这一至今让信息专家头疼不已的重要问题。许慎的解决方案是创立540个形旁部首,然后将所有现存汉字分门分类在540个部首之下。到了清代的《康熙字典》,部首慢慢削减为214个(其排序法实际上早在明代的1615年已由梅膺祚所创立)。当我们考虑到如下事实,才能充分理解这一体系令人生畏之处:一、一个汉字可能包括两个、三个甚至更多部首,这让人很难确定它到底属于哪个部首(比如只有九画的“章”字,却有不少于五个可能的部首);二、因为有要将它放进汉字的方块形状中这一削足适履的习惯,部首很可能会以变形的面貌出现;三、即便成功辨别某字的“正确”部首,一个部首之下有可能会包括数百个汉字,这便又提出了一个如何给部首之下的汉字逻辑排序的复杂问题。(通常的方法是根据减去部首之后的剩余笔画排序,但实际笔画数有时候也是模棱两可的,同时如在“木”或“心”部首的七画下,会超过一百个汉字。)除了用许慎发明的部首法查字带来的困难之外,部首分类法的存在还或多或少排除了汉字逐渐演变为语音文字的可能性,因为这一分类强调所有包含一个以上成分的汉字(绝大多数汉字)都能这样进行分析,这样它们就能被视为包含一个语义成分——不管被分配的语义是否在该词的词源学演变中确有其事。 


如何排列(反过来就是如何查找)数万个汉字这样一个头疼的问题,导致产生很多其他方法。中国传统的类书经常根据名词概念(如天、地、人、岁时、鸟兽或者草木)来组织。而在吸收了印度音韵学之后,汉字开始根据音律这一高度技术化的体系来分组,一共出现过数百种排序和查找汉字的其他方法(四角法、上下笔画法和笔画顺序法等)。大多数方法发明于急迫追求效率的二十世纪,此时的中国词典编纂者面临着前所未有的国际经济和文化竞争压力。汉语使用者越来越发现拼音是最简易快速的检字方法。(这一点从图书馆词典中拼音检字表的污损,以及非专业打字员的一般电脑使用者的输入习惯那里得到证明。)对所有词汇(单音节、双音节以及多音节)来说,完全的字母音序排序正在成为比首字排序更受欢迎的方法。在词典编纂领域和信息以及计算机科学领域都是如此。


除了《说文解字》,中国传统的语言研究中另一部标杆性著作是东汉刘熙的《释名》(约200)。《释名》的主要分析技术是“声训”,就是用声音相同或相近的字来解释词义。于是基本上,它试图用双关法来解释词汇的起源与关联。虽然这让《释名》多少具有音律研究方面的价值,但是对于词义和词源研究而言,就很难采信。


概括一下本节以及前两节的主要观点:汉字既非完全语音,也非完全语义。只有通过其语音部分和语义部分的结合,汉字才成其为汉字。汉字的这一典型双重特性使之在世界现存通行文字中独一无二,这对于艺术和文学都具有重要意义。


4


汉字的审美特征


前面几节旨在澄清关于汉字的几种错误概念,但是有一种广为接受的概念却毋庸置疑:汉字之美。即使目不识丁者一般都觉得汉字有大美,这一事实表明了汉字之美是一种共识。上文已提到,汉字不是象形文字,而是高度视觉性的。这样,汉字就和书法有一种亲近感。当书法家写下与木、水、山等有关的汉字时,他可以将木之苍虬、水之灵动、山之肃穆赋予这些汉字。即便视觉特征不是很明显的汉字,书法家的情感也能很容易地从作为弥补的字形变化中找到宣泄出口。当然,这些情感的表达用阿拉伯文字、罗马文字和其他文字一样可以实现,但达不到这么看似无拘无束的程度。


书法在中国士大夫的世界里的重要性如何强调也不为过。从甲骨文到金文,以及在春秋(前722—前481/463)战国时期大量地区异体字的出现,秦始皇的“书同文”,再到各种主要书法体的演变——大篆、小篆、隶书、楷书、行书和草书——每一个阶段的字体都在其通行时代过去之后,作为一种书法体被运用,得到永久保留。书法是文人生活的中心,所以笔墨纸砚有“文房四宝”之称。即便在今天,知名人物的墨宝还是得到高度珍视,人们热忱地拜请书法家撰写书名、店名和其他公用展示性文字。中国人对汉字的这份浓情也传到了其他东亚国家——日本、韩国和越南——实际上,这三个国家中最早的已知文本无一例外都是用汉字书写的(见第五十三、五十四和五十五章)。汉字的高度视觉化特性导致文学与艺术之间界限的模糊化。一位诗人在墙上题诗,与仅高声口占有很大不同。他同时在视觉性和文学性地表达自己。类似的,一位书法家在卷轴上写下一首诗,通过笔画的厚重度、墨的浓度、字的布局等表达自己的同时,他也必定传递了诗句的文本情感。



 日本书坛巨匠井上有一在创作


因为在中国,艺术与文学的分界线并不总是泾渭分明,如用绘画表现诗句,在绘画上题字、极具个性的签名和印章。文学与艺术的结合作品已然超越了单维度的语言或者视觉。


诗与画的结合于是成为中华文化的一个典型特征(见第二十五章),因为这对于使用字母或者音节文字的文化而言是不可思议的事情。字母和音节文字的纯粹语音特质导致了语言与视觉之间的二元分立。而相反,汉字的半语音半语义特性为这一二元分立架起了桥梁,很自然地为艺术与文学的微妙中介形式提供服务:回文、变位词(anagram)、视觉双关语和字谜、刻有铭文的雕塑、同时也是绘画的地图、同时也是地图的绘画,看上去是人像的一个或一组汉字等等。虽然东西方批评家经常提出,汉字的特性可能抑制了西方人所熟悉的抽象和分析思维(知识论、本体论、线性逻辑、笛卡尔的二元实在论、假言命题等)的发展以及白话文学的繁盛,不过它的最强力量却在于其无边的具象性。熟悉汉字者认识到,汉字为纯粹语音文字的使用者不易到达的观照、感受和冥想打开了视域。


5


汉字对文学的意蕴


汉字的特征对中国文学产生了巨大影响。汉字对文学的影响涵盖了作品的技术性和语言学,以及社会学和人生观各个方面。


首先,汉字在中国享有至尊地位。掌握汉字者拥有不可比拟的力量。甚至目不识丁者都对汉字怀有敬畏感。汉字的这种近乎神秘的性质在1984年的电影《黄土地》中一览无遗。在《黄土地》中,目不识丁的农民请不起人写对联。当他们把对联贴在门框上希望能带来福气时,我们惊诧地发现,对联上只画了几个圆圈,用来代表字。究竟是什么使得汉字受到如此礼遇,其原因值得深思。

 


电影《黄土地》剧照


可以列出的方方面面无疑有很多:内在特性、历史遗产、宗教和意识形态情结,等等。然而不管这些因素有多少,这些因素实际上是由少数精通汉字者(也即能书写流利文言文,占总人口的约2%)无与伦比的社会政治权威所支撑的。两千多年来(起于汉文帝时期[在位时期:前180—前157]公元前178年的“对策”,历史上时断时续直到1905年,7世纪以来尤盛),对汉字的精通程度通过在科举考试中的表现来衡量。在科举考试中表现出优异书写才能的考生,锦绣前程指日可待,官运的亨通总是会带来财富与权势。结果,才华出众者都希望通过科举考试,因为这不仅意味着一种荣耀,更因为这将为他的整个大家族带来“千秋万代”的兴盛。


汉字享有如此崇高的地位,所以它当仁不让地使文字优越于言语。这与印度、希腊和其他古代文化相反,在这些地方,祭司、先知、演说家和吟游诗人之所以受到尊重,是因为在他们头脑中有智慧与美,当有要求的时候,能够滴水不漏地背诵这些文本。在中国,文字优于言语的地位是由文人丝毫不被质疑的权威所决定的。文人精通深奥的汉字,反过来也创造出关于文学诸形式的一种特别格局,居于此格局顶端的是史书(记录君臣大事)、道德论文(强化了社会政治秩序)、抒情诗(表达文人最深沉的抱负)。就这样,复杂的文字体系和文人主导的社会政治秩序相互加持,抗拒任何变革的可能性。


中国文学史专家经常为七零八落的古代中国神话,以及缺少堪与《摩诃婆罗多》《罗摩衍那》《伊利亚特》和《奥德赛》比肩的伟大史诗而大惑不解。神话与史诗基本上都是叙事的、起源于“说唱者”口头保存的故事,在古代中国的文学格局中自然处于低贱之位。叙事文学最终还是发展起来了,但是首先以历史(见第二十六章)特别是历史传记(见第二十七章)为伪装,其次更为纵情的是借佛教之光——佛教给中国带来了对好故事热情洋溢的印度式热爱。


汉字第二个显而易见的特征在于它的方块形状。不管一个汉字的笔画是二画还是四十二画(笔画最复杂的汉字多达六十四画),它都占据同样大小的方格,所以汉字也叫方块字。并且,大多数汉字都是具有强大语义携带能力的语素(或者被视为语素)。最后,汉字传统上以连续行书写(仅受到书写表面长度的限制),中间没有任何中断或者空间,也没有任何标点。中文这些特点对于汉语和文学的意蕴相当深远。中文还有以下补充特征:(1)屈折词缀的丢失;(2)省略部分对于传递语义并非必不可少的词句;(3)在诗歌与散文中极端强调(词汇、语法和句法的)对仗;(4)对双音节耦对与结构的强烈偏好;(5)强制性词序(主谓宾,修饰词在被修饰词前),只有极少数倒装的例外情况(与为了效果可以自由改换语句成分位置的拉丁文以及其他屈折语言不同)。这些现象明显会以各种方式给中国文学上色。


中国文学史充满了中文这些特质(以及本章中提到的汉字的其他特质)所带来的影响的生动例子。总体而言,简洁被抬到了极其重要的位置,情感、情绪和印象的表达价值被认为高于逻辑分析思维能力,同时拥抱具体意象,冷落抽象概念。每当中国的作家、词典编撰者和评论者想要定义某物时,他们经常借助于文字双关。两个汉字的发音如果很接近,人们就用它们来相互解释,而罔顾其各自的实际词源。虽然对于词源考察而言,这是一种很危险的方法,但是几乎所有前现代中国学者都心照不宣地信任它,频频借助于它。迷恋于狭隘的文字双关,这生动表现了汉字的权力和威望。这一声势浩大的权力和威望,使得汉字不仅对文学,还在一定程度上对语言本身起到了塑造性作用。







点击下方 蓝色文字 查看往期精选内容

人物李鸿章鲁迅聂绀弩俾斯麦列宁胡志明昂山素季裕仁天皇维特根斯坦希拉里性学大师时间1215189419151968197919914338地点北京曾是水乡滇缅公路莫高窟香港缅甸苏联土耳其熊本城事件走出帝制革命一战北伐战争南京大屠杀整风朝鲜战争|反右纳粹反腐|影像朝鲜古巴苏联航天海报首钢消失新疆足球少年你不认识的汉字学人余英时高华秦晖黄仁宇王汎森罗志田赵鼎新高全喜史景迁安德森拉纳・米特福山尼尔・弗格森巴巴拉・塔奇曼榜单|2015年度历史书2014年度历史书2015最受欢迎文章



扫描二维码获取最新科技资讯
推荐公众号
  • 万能助手

    我来让你万能 ♣ 做你的「知识弹药库」㊣

  • 创意失控

    我们爱生活,爱想象。热爱新奇的、大胆的、能为我们带来快乐的创意产品。 在未来的发展中,我们可以在这个平台上分享上千款创意产品,发现彼此分享的乐趣

  • 西木良伴

    陪在你嘴边

  • 水兵舒适家

    分享家庭中与温度、与空气、与水有关的知识。 见不得满天飞的网络误导、奇谈怪论,我愿以15的积累,传播知识,以正视听 数以百万计的行业小B(中小微企业、团队),技术不足,需要知识能量,我愿意PGC的模式建立一个平台,为他们提供营养

  • 金色沙漠

    千淘万漉虽辛苦,吹尽狂沙始到金。

最新更新