您好,欢迎浏览国际汉语教育网 各地教学中心

语言研究

汉语双音复合单位范畴化途径新议
发布时间:2020/6/24
  内容提要:汉语双音词的形成机制除了现在常说的“词汇化”途径外,还有另外的一些途径,如派生与变音构词外,另有两种少被关注的途径,即本文所分析的逆序范畴化与粘结范畴化。它们共同形成了汉语里的双音复合范畴,汇入汉语词汇大家族。这两种途径尤其是粘结式造词,无论在数量上还是在能力上,都有相当占比。由于相当数量的单音词去词化而成为构词语素,粘结式造词已成为现代汉语中主要的复合成词方式。前述“词汇化”途径可以看作“组合词汇化”,本文所探讨的归纳为“黏合词汇化”。
  关 键 词:双音节;合成词;词汇化;范畴化
  作者简介:池昌海,博士,浙江大学汉语史研究中心教授,主要从事汉语词汇等研究。
   基金项目:教育部重点研究基地重大项目“中古近代汉语词汇系统研究及其认知分析”(06JJD740014)。
 
  一、汉语双音复合单位与词汇化、范畴、范畴化
  汉语词汇史研究显示,在殷商时代就有了双音节词的萌芽,后经历了西周时期的“类型大备期”,以及春秋战国的“第一个高潮期”(伍宗文2001:306-373)。此后双音节词占比逐渐增加,一直到现代汉语里占据了67.625%的优势地位(周荐2014:176)。汉语双音节词的产生、发展过程的研究,成果已非常可观(董秀芳2011:11-18)。汉语双音节词产生途径的研究相对比较滞后,但成果却可喜。其中董秀芳的专著《词汇化:汉语双音词的衍生和发展》(修订本)成为标志性成果。该书将探讨“双音词的历史来源与产生途径”看作首要任务(董秀芳2011:19),并认为,“双音词的衍生属于一种词汇化现象”,对“词汇化”作了这样的界定:“即短语等非词单位逐渐凝固或变得紧凑而形成单词的过程。”(2011:36)且在此基础上,归纳出三种具体途径:
  一是从短语变来,这是汉语双音词的最主要来源;
  二是从语法性质成分参与组成的句法结构固化而来;
  三是由本不在同一句法层次上而只是在线性顺序上相邻接的成分变来。(2011:24)
  笔者认为,上述界定和三类概括本身很明确,也符合事实。该书对这三种途径的论证(2011:48-285)也很精当。根据作者的表述,上述“词汇化”可以归纳出以下属性:
  (1)预先存在由两个词构成的非词单位短语或结构(P=A+B);
  (2)该短语或结构有一个作为其本来形式与功能单位的使用过程;
  (3)在合适的条件下,经过重新分析,该单位由P凝结成词
  (4)这一由P→W的变化过程就是“词汇化”,即汉语双音词由此产生。①
  仅据笔者的观察,就作者所界定的“词汇化”现象或途径来说,确实解释了很大一部分双音词的产生方式,但还不能解释所有双音词的“出生地”,即“双音词是从哪里来的?”(董秀芳2011:25)的问题。因为汉语双音词的产生无论从方法还是从数量上看,是一个较为复杂的现象,上述结论恐还可商榷。据笔者观察,除了来自上述“词汇化”的成分外,以下两个类型是我们熟知的,也产生出许多双音词:
  (1)派生式双音词。该类双音词,产生不晚于战国,之后新词缀不断滋生,到中古时即为很重要的双音词产生途径了(方一新2010:692-713)。现代汉语里新词缀继续产生,派生词总量不断增加。
  (2)变音式双音词。指在已有的双音节合成词基础上通过声调变化,产生新的词语,如“自然、精神、自在”;“地下、大意”等等。
  这两种途径的造词,丰富了汉语双音词,其功能在于通过语素组合的方式构成复合单位以表达范畴,从而满足语言表达认识和情感的需要。因此,笔者将由两个音义单位复合成双音“范畴”的这一过程称作“范畴化”,产生的合成词即为范畴的载体。
  这里所说的“范畴”是指人类思维的最小单位,“指人的思维对客观事物的普遍本质的概括和反映”(《现代汉语词典》2016:365),它们以最小的语言单位为载体,同“概念”。但“概念”作为逻辑学单位,它们可以是词为载体,也可以是短语为载体(邢公畹1992:33),故本文未用。而范畴得以产生并符号化的过程,就是“范畴化(categorization)”——“指人类将经验组织成各种一般概念及相关符号的整体过程”(戴维·克里斯特尔著、沈家煊译2000:51)。结合到语言符号层面来看,范畴化可以是通过单音节实现,如“天、说、好”等,也可以是双音节或多音节实现,如“徘徊;疾病、果然、在乎;自行车”等等。本文所要关注的就是通过两个有意义成分合成的复合单位的范畴化现象,也就是双音节合成词主要是复合词有哪些产生途径。
  双音复合单位的范畴化,其结果产生了大量的双音词。董著理解的“词汇化”,同样实现了“范畴化”,可见,“词汇化”所产生的合成词,与本文所指的“范畴化”新手段产生的双音范畴单位一起共同融汇成双音词大家族。因为这些双音词都来源于句法组合,本文称其为“组合范畴化”或“组合词汇化”。这一途径与前述的“派生式”、“变音式”及下文将要作重点分析的“逆序范畴化”、“粘结范畴化”两种途径大不相同。作为造词方式,后者在汉语词汇系统中产生很早,也多有很强的生命力,但尚未得到合理关注,也未被包含于上述“词汇化”范围,但确应为“范畴化”或“词化”。本文称它们为“黏合范畴化”或“黏合词汇化”。下文要讨论的两个途径,具有以下三个属性:
  (1)在一个双音单位以词()的身份出现之前,并无一个同形的短语单位;
  (2)该词的产生不存在一个使用并凝固的过程,即没有上述“词汇化”的过程;
  (3)该类词形成后构成了一个最小的范畴单位,并以词语身份进入词汇系统。
  二、逆序范畴化②
  语序是汉语语法的重要手段之一,在造词层面,语序也是不可忽略的一种方式。所谓逆序范畴化就是指将原本一个A+B顺序构成的短语或可能构成,改变其语序,直接获得一个最小范畴,指称一个最小概念的成词方式。据笔者的观察,可分两种情况:
  (一)有基式。言语活动中有一个基本形式,为短语,后以此为基础逆序衍生出。但前者作为一个短语,属临时组合,意义透明,用于描述行为;后者实现的是范畴表达,成分具有凝固性,意义具有不透明性,用于“命名”(黄月圆1995)等。例如“袒肉”与“肉袒”,从义理上看,两者都是指脱去上身衣服,裸露部分肢体。如:
  1)若此而得祔,是生臣而安死母也;若此而不得,则臣请挽尸车而寄之于国门外宇溜之下,身不敢饮食,拥辕执辂,木干鸟栖,袒肉暴骸,以望君愍之。(《晏子春秋·外篇上十一》)
  2)君再拜稽首,肉袒亲割,敬之至也。(《礼记·郊特牲》)
  3)廉颇闻之,肉袒负荆,因宾客至蔺相如门谢罪。(《史记·廉颇蔺相如列传》)
  4)周武王克殷,微子乃持其祭器造于门外,肉袒面缚……(《史记·宋微子世家》)
  例1)中“袒肉”用于描述一个行为,即袒露身体,与并列的“暴骸”类型相同。该段话为盆成适对晏子所说,表示如齐景公不同意他去世的母亲与父亲合葬(其父先逝,坟地被圈入齐君苑囿),盆就只能将棺木停放在都门外侧的房檐下,并袒露自己的身体。显然这里的“袒肉”并非用于祭祀或谢罪,没有特别的礼制等含义,应看作短语。③
  例2)、3)、4)中的“肉袒”就不同了,既表现在成分顺序相反,更重要的是其意义发生变化:它们都用于特殊场合:带有明显礼制含义,或祭祀(如例2),或自罚、谢罪(如例3)、4)等等。“肉袒”虽即“袒肉”,但承载了特殊含义,已成一个特定范畴。
  另外,我们从这两个单位的应用表现,也可以看出逆序不是普通的换序,而是一种标记单位性质不同的手段。
  “袒肉”作为短语,它仅指具体的“袒露身体”这一动作,不附带表达其它含义,当然也就允许出现“袒+X”的结构,如:
  5)忿而争,袒其肉,邻与里,遂不睦。(清《琴隐园诗集·争井》)
  不仅如此,“袒”还可以产生大量后接受事等宾语的结构,如“袒+衣服/怀/胸”等等。
  但是“肉袒”没有此类句法单位才有的可类推性,即“肉”与“袒”凝结紧密。同时,也未见同类异形组合,可见组合相对凝固。两个单位在文献见用的情况,同样显示明显的不同:“袒肉”用于描写实际行为,应该不会很多,实际所见频次很低,以《中国基本古籍库》的文献查询结果看,包括正文和注疏的,共仅得41条。而“肉袒”则不同,它作为一个有特殊含义的古代常用词,常用来记录该类行为,因此频次很多,高达2676条。另外,大型文献《史记》的数据也颇有意思:“袒(含‘襢’)”共见32例,其中“肉袒”有20例,“袒肉”则无1例用。这些调查也正验证了一个基本原则——(复合)词的使用频率要高于词组,且古今相同:“不仅现代实际口语中复词的使用频率一般要高于自由词组,即使在古代文献中复合词的出现频率通常也比自由组合高。”(伍宗文2001:137)
  类似的例子在古代汉语里并不罕见,另如“右袒、左袒、狗屠、虫出、饭含、庖代、腰斩、族灭”等等,在现代汉语词汇中也有,有的延续自古代,如“亲迎④、鱼钓”等,也有是现代产生的,如“鱼生、笋干、客运、糖稀、车辆、痒痒挠”等等。
  (二)无基式。与有基式不同,虽然事实上存在着A+B的行为或现象,但对该行为或现象并无相应的陈述或描写,即不对它们做短语单位的表达,却产生了一个将可能的单位成分逆序组合(即BA)从而衍生新范畴,形成新词语。例如,在古代尤其是在上古时期,当时的人们非常看重血缘或家族血统的传承,祖先逝去了但其灵魂应该得到后代以杀牲方式行礼的祭奠。先人魂灵享受后人用各类祭物奉献的祭奠过程,实质上就是“食+祭物”这一行为。因为杀牲流血,且血也是重要的祭物,因此“血”便转喻指各类牺牲或奉献,即“食+祭物”或具有转喻价值的“食+血”。但可能因为这一表述只是对行为的描写,而不能更好地成为一个具有特殊含义的范畴,也即不能以词语的形式体现特别的“命名”效果,因此,我们实际能看到使用的是“血+食”这一复合单位。《汉语大词典》收录了该单位,并解释道:“谓受享祭品。古代杀牲取血以祭,故称。”笔者认为,“血食”通过改换语序的方式,将“食+血”这一对行为的描写转指成了一个具有特定文化意义——“血脉获得延续”的标志。其意义透明度低,构成凝固性高的最小造句单位,承载一个最小范畴,而且“句法规则不涉及词内部结构”(黄月圆1995),故应断作范畴化或词化了:
  6)立后稷之祠,至今血食天下。(《史记·封禅书》)
  7)然社稷血食者八九百岁……(《史记·燕召公世家》)
  相反,“食血”作为描述性短语,却不见用于表达“血食”义的用法。查《史记》中,“血食”用9例,无1例“食血”。
  另外,作为述宾短语,它自然可以产生相应的类推组合,在《中国基本古籍库》中得“食其血”20例,但均用于描写具体行为,且意义完全透明。如:
  8)飞鸟等尽食其血。(《太平广记》卷一百)
  9)(蚩尤罪孽深重)故今万世百姓食其血也。(《平妖传》)
  现代汉语里也有类似的造词,如“肉松”,《汉语大词典》解释为:“用瘦肉加工制成的松散的绒状或屑状食品。猪、牛、鸡、鸭、鱼、虾等肉均可制造。一般多指猪肉松。”《现代汉语词典》也收录该词。显然,“肉松”不能理解为“肉+松软”,从词义理据上说,它应该指:松软的成绒状的肉制品,即“松肉”,但最后却产生了“肉松”这一似乎顺序颠倒的单位。类似的还有“鱼松、饼干、面条”等等。
  该类型中还有一种特殊情况,即源自对一个典故的概括,但组合没有按照通常逻辑顺序,而是逆序,从而形成一个具有特定内涵的范畴,完成词化。如:
  10)于是卒述陶唐以來,至於麟止,自黄帝始。(《史记·太史公自序》)
  对“麟止”,《汉语大词典》的解释是:“汉武帝至雍获白麟,司马迁作《史记》于此处止笔。后以‘麟止’指绝笔。”实际上,“麟止”发生了以下意义路径的演化——首先指行为:获麟——汉武帝获白麟;其次,以“获麟”转指事件发生的时间;最后在此基础上因司马迁止笔于此而转指“绝笔”:
  11)及太史公记六国,历楚汉,讫麟止。(《汉书·扬雄传下》)
  12)固赞汉自创业,至麟止之间,袭蹈迁论……(宋苏洵《史论下》)
  因此,其本来意思指“止于+获麟”,以短语的形式描述这一行为,但最后产生的却是一个语序颠倒了的单位“麟止”。这样的词有人称作逆序词⑤,虽然数量也不多,但很值得注意,其它还如古代常用的“面缚、肢解、打围(指狩猎或作战的方式)、点卯、托梦、洗三、抓周、卧病”等,其中“肢解、托梦、卧病”等还沿用至今。
  三、粘结范畴化
  与上类情况不同,本小节所讨论的这类词语是由两个自由或不自由的语素直接按某种意义方式拼合粘结,从而形成一个新范畴,产生新词。此外,这类手段产生的词在数量上远多于上一类,在古汉语词汇系统中应该已有相当数量的占比,在现代汉语词汇系统中则占绝对的数量优势。最后,此类途径还产生了相当多的难以用一般成分关系或意义解释的所谓“无理(据)”复合词,如“谢幕、开锅、拔河、醒酒、木耳、面孔”等。
  (一)古代粘结。这种方式产生的词语在古代就应该存在,例如“掌故”始见于汉代文献,《史记》共见12例,按意义可归纳为两类:
  13)(晁错)以文学为太常掌故。(《史记·袁盎晁错列传》)
  14)使张仪、苏秦与仆并生于今之世,曾不能得掌故……(《史记·滑稽列传》)
  例13)指汉代设立的一种官职:“汉置,太常属官,掌管礼乐制度等的故实。”后可代担此职的人;14)指“旧制旧例;故事,史实”,沿用至今。此前或至少汉代未见有短语用法,甚至也没有相应的短语扩展组合如“掌其故、掌之故”等。
  同类还如“君子、小人、夫子、寡人、故旧”;“还归、计算、介绍”;“美好、整齐、威严”等等。这类词语在古代汉语词汇系统中,总数应有不少,不应被忽略。
  更为重要的是,就来自古代汉语中的双音词来说,除了上述零散但数量已不少的成员外,还应特别注意一种数量更多且有类型价值的单位,即已被学界公认为不需要经过短语的组合阶段而直接成词的词语——同义并列复合词。
  程湘清在讨论先秦汉语双音词的意义关系类型时,有这样的总结:“一批由同义单音词并列构成的双音词甚至并不经过词组的阶段就径直在交际中出现了。”(1982/2008:74/52)
  伍宗文在引述程湘清的结论后,进一步具体地说:“由表达相同(或基本相同)概念的同义单音词合成的双音词,通常不经过一个逐步凝固的词组阶段,因此,它们尽管出现一两次,却已取得双音词的资格。”(伍宗文2001:140)
  丁喜霞通过对中古常用并列双音词的成词和演变研究,也得出了相同的结论,且表述更加明确:“从成词数量来看,同义并列双音词是并列双音词中最多的一类,数量远远超过类义并列和反义并列双音词。”“同义并列双音词,是通过词法途径,将两个意义和用法都相同的成分并列构成,不需要经过由短语到词的演变阶段,一般也不需要经过转类即可成词。”例如“墙壁”“房屋”“池塘”“树木”“追逐”“甘甜”等(丁喜霞2006:346)。
  至于该类词语的数量,虞万里(1992)通过自己的研究,给出了一个相对具体但较为可观的数字:“现存的汉以前文献中,此类同义复合词达数千例。”
  这一结论还可以从该类词在古代不同时期的占比得到更确凿的证实。据程湘清的研究,该类词的占比“自战国时期以后,联合式双音词的增长速度却比偏正式显著加快了”(2008:80)。另据李仕春的统计,联合式复合词在上古占复合词比例为38.4%(2011:52),到了中古时期,占比更高,达到48.7%(2011:101),且在该聚合类中,同义联合的最多,其次是类义联合,最少的是反义联合(2011:52)。不过,到了近代,联合式复合词占比开始下降,到了现代汉语里,共有8310个,占比为25.7%(周荐,2014:213),其中同义复合的即以一半计算,也超过4000个,不可谓少。
  综上所述,笔者认为,即便相对古汉语词汇系统而言,数量这么多的复合词应被看作双音词成词路径所致,也应归入“词汇化”范围。
  (二)现代粘结。比较而言,在现代汉语词汇系统中,这类途径构造的双音合成词同样很多,甚至更常见。也就是说,如前所说的“词汇化”现象因缺少了构成的基础而出现相反的趋势:由于双音化手段的稳定趋势以及现代汉语复合词构造材料功能属性改变等原因,原来从词组长期使用并逐渐凝固而完成的“词汇化”的现象大大减少,由两个语素径直粘结构成双音复合词更加常见,数量也占绝大多数。
  (1)从复合词的成分属性来看,语素粘结主要有这样几种情形:
  (a)成词语素+成词语素。该类单位的构成成分都是成词语素,但由它们构成的单位却没有也不需要经过一个短语运用的先期过程,当然也就无所谓有前述的短语凝固的“词汇化”途径了,例如“口红”“谢幕”“高铁”“枕木”“逼真”“醒酒”等等。
  (b)成词语素+不成词语素。该类单位的构成的成分有一个是不成词语素,当然就不可能产生短语这一句法单位了,也就更不存在短语凝固过程了,如“导游”“铁腕”“失业”“控制”“机动”等等。
  (c)不成词语素+不成词语素。构成的两个成分均为不成词语素,本身均不能成词,合成的单位只能是复合词,就绝不可能存在短语凝固的过程了,例如“公务”“警察”“观察”“医务”等等。
  (2)从该类词语的内在成分意义关系看⑥,类型也丰富多彩,能产性强:
  (3)现代粘结成词动因。以上两点显示出现代汉语复合词在构造上的结果,那么,与古代汉语相比,是什么因素促成了这一结果呢?本文发现,古汉语中很多本可以单音节成词的单位在功能上出现根本性变化——去词化,从而使这些单音节词不再能够单用,降级为语素,成为造词材料。我们知道,至少在秦汉以前,汉语词语的单音节特征明显,并以汉字作为记录符号,两者呈现高度的对等关系,如吕叔湘曾说:“在古汉语里,‘字’和‘词’是基本一致的(当然并不完全一致)。”(1959/2002:360)王力断言:“上古汉语是以单音节为主的。”(1980:343)史存直(2008:450)认为:“(甲骨文)就已经辨认出来的字面而论,除了少数地名、人名、官名由两个字构成之外,总的说来,可以说基本上都是一字一词。”正因此,早期的合成词相当多的应该来源于单音节的词构成词组,并经过长期运用而凝固成词,也就是说,“复合词汇化”的成词途径有其词汇史基础。到了现代汉语里,汉语单音节词的去词化已经非常明显,数量也很可观。笔者通过对《现代汉语常用字表》(下简作《字表》)的调查和分析进一步证实了上述判断,也揭示出汉语单音节词去词化的实际表现。该表发布于1988年,共收字3500个,其中常用字2500个,次常用字1000个。它虽然以收录单个汉字为对象,但由于汉字与汉语词语单位的对应关系,其中的绝大多数单字都是有音义的单音节基本成词或构词成分。由这些单独可以成词的汉字和以它们为成分构成的合成词等,基本满足了现代汉语的表达需要。这在该表的收字原则中也已经表述得很明白,其中第二条为“构词能力强”,第三条为“学科分布广”。实际上,由它们及其组合成的单位可以覆盖全部统计语料的99.48%。因此,完全可以说,《字表》所收录的字或由这些字所代表的语言单位构成的词语反映了现代汉语的语料面貌。根据“成词判断从宽”原则⑦,我们得到下表:
  从该表的统计,我们可以获得以下结论:
  常用汉字或与汉字对应的有音义的语言单位单音节词,到了现代汉语里,将近有一半是不能直接以词的身份构成句法单位了(如贝、乏、史;丐、歹、袒,等等),必须与其它成词或不成词语素组合成更大而基本的成句单位即双音节合成词。
  通过以上讨论,我们可以发现,在过去几千年的发展中,以单音节为主的汉语词汇形式逐渐发展成双音节形式占优势,除了相当数量的合成词是由词组长期使用凝结而来的以外,还有许多是单音节词去词化,成为构词语素,由它们参与构造成双音节合成词,而且这一趋势与时代的发展成正比关系,即相对于先秦,时间经历越长,单音节词的去词化成员越多,“黏合式词汇化”单位也就越多。
  ①作者在该书封底强调了这一看法:“本书研究词汇化现象及其规律。词汇化指非词形式在发展过程中变为词的过程。除联绵词和音译词之外的双音词在历史上的产生主要是词汇化的结果。”(董秀芳2011)
  ②逆序造词也存在于其它语言中,如英语里有peaceloving、moneylaudering等,只是往往除了语序特征外,还有-ing形式作标记。
  ③《汉语大词典》在解释“袒肉”时,引用该例(也是惟一引例),且作如下解释是不妥当的:“谓脱去上衣,裸露肢体。古人谢罪或祭祀时的一种表示。”
  ④“亲迎”为古代“婚”的六礼(纳采、问名、纳吉、纳徵、请期、亲迎)之一,指夫婿亲至女家迎新娘入室,行交拜合卺之礼。(《汉语大词典》)而“迎亲”,但所指具体得多,指结婚时男家到女家迎接新娘。(《汉语大词典》)后也成词,但意义透明度高。
  ⑤见周荐(1991;2014:204)把它们划为定中式与状中式。当然对其中的词例也有争议,可参见朱彦(2004:23-24)。
  ⑥这里的“成分意义关系”,暂借现有术语,侧重指成分之间产生的意义相互逻辑关系或功能关系,表格中“陈述”等只是沿用现有术语。这一角度的研究董为光(1992;2009)作了很有启发性的探讨,如将“鲤鱼、梅花”归纳为指类或注释,将“首级、银两”归为同位,等等。
  ⑦指为稳妥起见,在判断某个字(看作有音义的语言单位)是否成词时标准适度从宽,就是说只要有成词倾向,均断定为成词单位,相反,对不成词则从严控制。
  原文参考文献:
  [1]程湘清1982《先秦汉语研究》,山东教育出版社.
  [2]程湘清2008《汉语史专书复音词研究》(增订本),商务印书馆.
  [3]戴维·克里斯特尔著,沈家煊译2000《现代语言学词典》,商务印书馆.
  [4]丁喜霞2006《中古常用并列双音词的成词和演变研究》,语文出版社.
  [5]董为光1992《汉语词汇双音代换管窥》,《语言研究》第2期.
  [6]董为光2009《汉语复合词结构分析若干问题》,《语言研究》第3期.
  [7]董秀芳2011《词汇化:汉语双音词的衍生和发展》(修订本),商务印书馆.
  [8]董秀芳2016《汉语的词库与词法》(第二版),北京大学出版社.
  [9]方一新2010《中古近代汉语词汇学》(上编),商务印书馆.
  [10]黄月圆1995《复合词研究》,《国外语言学》第2期.
  [11]李仕春2011《汉语构词法和造词法研究》,语文出版社.
  [12]吕叔湘1959/2002《汉语里“词”的问题概述》,载《汉语语法论文集》(增订本),商务印书馆.
  [13]史直存2008《汉语史纲要》,中华书局.
  [14]王力1980《汉语史稿》(中),中华书局.
  [15]伍宗文2001《先秦汉语复音词研究》,巴蜀书社.
  [16]项梦冰1988《试论汉语方言复合词的逆序现象》,《语音研究》第2期.
  [17]邢公畹1992《语言学概论》,语文出版社.
  [18]虞万里1992《金文“对扬”历史观》,《语言研究》第1期.
  [19]荐1991《语素逆序的现代汉语复合词》,《逻辑与语言学习》第2期.
  [20]周荐2014《汉语词汇结构论》,人民教育出版社.
  [21]中国社科院语言研究所词典编辑室2016《现代汉语词典》(第七版),商务印书馆.
  
作者简介
姓名:池昌海 工作单位:

来源:中国社会科学网

扫一扫下方二维码,即刻关注国际汉语教育网