第二节 辞书的原型论

3.2.1 原型论

原型论(prototype theory),是对亚里士多德以来的经典范畴理论的革新。经典范畴理论是用事物固有的、共有的、充分的特征(features)定义事物,确定概念。而原型理论则用典型事物的属性(含心理认知)为中心描述事物。这是到了20世纪70年代罗斯(E.Rosch)等人在维特根斯坦(L.Wittgenstein)等人家族相似性理论基础上发展出的认知理论,到了80年代在语言学中的发展更为成功,90年代被引入中国。

原型理论认为“我们的许多心理概念实际上都是原型”,“指被(多数人)认为是某一类或一组的典型的人或物”。(Jack C. Richards,2000:374)也可以指一个范例、典型性较高的成员、认知参照点或一个范畴的概念中心。范畴成员分中心、次中心、边缘。所有成员都共有部分属性,显出家族相似性,不同层次成员具有属性多少不等。属性也分中心的、边缘的不同等次。因为认知的目的不同,属性及其数量的选择也可以不同。《新牛津英语词典》(1998年版)较明显地体现了原型理论。

原型理论对语文辞书的认识和编纂有多方面推进作用。

3.2.2 中型语文辞书位于文化成果中心

在原型论视角下,文化成果或精神产品也应该分别出中心、次中心、一般、边缘等层次。其中心成果之一就是辞书。辞书的中心是最常用的中小型语文辞书,例如《简明牛津词典》、《小罗贝尔法语词典》、《俄语词典》(奥热果夫)、《现代汉语词典》。次中心成果是次常用的各种类型语文辞书(例如《常用词词典》《成语词典》)、中小型百科辞书(例如《辞海》)、普及的专科辞书(例如《语文知识词典》《语法修辞词典》《哲学辞典》等)。一般成果是大型语文辞书(例如《汉语大词典》《牛津词典》)、大型百科全书(例如《中国大百科全书》《不列颠大百科全书》)、高级专科辞书(例如《哲学大辞典》《中华实用法学大辞典》)。边缘成果是不常用的有各种专门用途的辞书(例如《唐五代语言词典》《通鉴大辞典》)。这些等次的划分,主要有三条标准:它们所包含的文化知识有中心以至边缘的区别,它们在获得文化知识过程中的作用有早晚之别、主次之分,它们在获得文化知识过程中的使用频率有高低或多少的不同。

3.2.3 推进词项系统的整体构建

一部中型语文辞书,是该民族共同语词汇整体的缩影。在原型论视角下,这个整体的成员也应该分别出中心、次中心、一般、边缘等层次。其中心成员就是根词,1943年I.A.Richads(理查兹)在Basic English and its Use(《基础英语及其用法》)中,提出850个词,到20世纪50年代美国语言学家M.Swadesh(斯瓦德士)在语言年代学观点下,提出200个词,还有提出100、500个词的。也许500个词更合适些。500个根词是词汇的中心成员,占《现汉》总收词量的0.76%。次中心成员,即围绕根词的是基本词汇(许多人认为相当核心词),针对历史比较语言学、语文教学论、语言结构论和词典学提出2000到4000个词,也许3000个词(含根词)更切合实际些,该数占《现汉》总收词量的4.61%。一般成员,即一般词汇,《现汉》收了25000多条,占《现汉》总收词量的38.46%。边缘成员,即词汇主流之外的“口、书、术、方、外、古、旧、新”各个支流系统,以其在《现汉》中的数量和比例大小排列如下:术语(含科技和哲社)15660条,占24.09%;新词语3500多条,占5.38 %;书面语(含公文和书信)3360多条,占5.16 %;方言词2000多条,占3.07 %;旧词语1100多条,占1.69 %;古词语(含早期白话)990多条,占1.52%(严格说,这个比例数,不是现代汉语词汇系统的,而是《现汉》词项系统的,因为《现汉》根据备查目的才收入的这些古词语);口语词750多条,占1.15%;外来词680多条,占1.04 %。总之,在原型论视角下,《现汉》的词项系统是以3000条根词和基本词汇为中心,以25000多条一般词汇为主体,以8个支流近30000条词语为边缘构建的整体。

3.2.4 推进词场内的词项选择

中型以上的词典编纂,最好“横编竖排”,即按语义场的次序分工,成稿后按音序、形序或义序编排。在原型论视角下,在一个语义场内应该按中心成员、次中心成员、一般成员和边缘成员次序选择词条。例如在书信场中的“来信、回信”小场成员共有30多个,其梯次按频度排列如下:

中心成员:来信、回信。

次中心成员:来函、复信、回音。

一般成员:来书、来鸿、华翰、玉音、手谕。

边缘成员:大函、大札、鼎札、惠函、来翰、芳翰、尊翰、台翰、玉翰、瑶函、琅函、芳缄、芳信、芳札、朵云、钧谕、手教、诲存、还翰、嗣音、裁答。

汉语中型词典应该收录上列中心、次中心和一般成员,最好再选收几个边缘成员。大型词典当然应该收录上列全部成员。可惜,《汉语大词典》并未全部收录。

3.2.5 推进对词项内部多义项关系的新认识

索绪尔认为,语言单位有聚合和组合两种关系。语义单位除了有聚合和组合两种关系以外,还有第三种关系:联想派生关系。(Mocka:Hayka,1973)索绪尔的高足巴利称之为联想场。

一个词的原始义靠着隐喻等多种联想,会出现第二次、第三次等多次编码,于是形成了多义词,即词典的多个义项。对辐射型和链条型的多义项,都可以运用原型理论找出中心义项、次中心义项和边缘义项及其间的相似性,也就是以共同义素为表征的语义桥(semantic bridge),其间的语义桥或相似性呈现出梯度。场论有三个基本量,一个是旋度,一个是散度,而最重要的是梯度,后者指场内连续量或程度的级差和差值。多义场内梯度有7种梯度模型:

(1) 多义项场内呈现出认知层次梯度:本义或基本义处于中心,是最先被认知的;引申义或比喻义等转义处于次中心以至于边缘,是稍后被认知的。

(2) 多义项场内呈现出相似梯度:从中心义项到边缘义项,义项之间的共同义素渐次减少。例如“窗口”依次有5个义项:①人们在墙等处造出的,用来通气、透光、看东西的框形空间。②窗口跟前(站在窗口远望)。③用作售票、挂号、传达的窗口。④比喻可以观察事物全局的有代表性的局部地方(如:特区是中国的窗口|眼睛是心灵的窗口)。⑤指计算机的文档窗口、对话框等应用程序。义项①和②之间的共同义素有5个:a.人们在墙等处造出的,b.用来通气,c.透光,d.看东西,e.框形空间。义项 ②和③之间的共同义素有2个:a.人们在墙等处造出的,b.框形空间。义项③、④、⑤之间的共同义素有1个:局部地方。

(3) 多义项场内呈现出认知时间梯度——符号和主次义位之间认知反应速度渐次加长:

从tóu(头)想到“头部”义,是直义或第一性意义反应,假设需要0.1秒,那么想到各引申义是转义或第二性意义的反应,需要的时间可能分别为①“头发及其样式”0.2秒,②“物体的顶端或末梢”0.3秒,③“事情的起点或重点”0.4秒,④“物品的残余部分”(铅笔头儿)0.5秒,⑤“头目”0.6秒,等等。

(4) 多义项场内呈现出认知细节梯度,从中心义项到边缘义项,义位的细节成分由少到多。如“嘴”的中心义项有4个语义成分:a.〔人或动物〕,b. 〔进饮食〕,c.〔有时用来发声〕,d.〔器官〕;引申义“别多嘴”的“嘴”还得在“嘴”的4个语义成分之上再加2个语义成分——〔说的〕〔话〕;引申义“瓶嘴儿”的“嘴”还得在“嘴”的4个语义成分之上再加3个语义成分——〔形状或作用〕〔像〕〔东西〕。语义学把这种现象叫义位的义值丰度渐次加大。

(5) 多义项场内义位句法组合自由度渐次变小。从中心义项到边缘义项,就是从自由义位到非自由义位,其句法组合能力或习用范围由大变小,由强变弱。例如“看”的中心义位“使视线接触人或物”的后接成分多达9类:名宾(含受事、工具、处所),动宾,小句宾,动时量,动介,了着过,动结宾,结补,趋补。“看”的次中心义位“观察”的后接成分只有7类:名宾(含受事),动宾,小句宾,动时量,了着过,结补,趋补。“看”的边缘义位“看望”的后接成分只有4类:名宾(含受事),了着过,结补,趋补。(孟琮等,1987)

(6) 多义项场内义位词法组合能力渐次变小。从中心义项到边缘义项,从词法角度观察,就是从强势语素义到弱势语素义,其词法组合能力由大变小,由强变弱。例如用“书”的中心义项“装订成册的著作”为语素义构成70个词语(义位);用“书”的次中心义项“书信”为语素义构成17个词语(义位);用“书”的边缘义项“文件”、“写字”“字体”为语素义分别构成8个、7个、7个词语(义位)。(周士琦,1986)

(7) 多义项场内义位对语境依赖性渐次加大。从中心义项到边缘义项,从词的形式认知其意义,越来越依赖语境。例如听到“xian”(线)这一读音,看到“线”这个字,几乎不必依靠语境就能想到“细长的、随意弯曲的东西”,即线绳的“线”,这是它的中心义项。次中心义项“几何学上指点移动的图形”,则依靠一定的小语境认知:“直线”“曲线”“斜线”“面是线移动形成的图形”。次中心义项“交通路线”,也至少依靠下列小语境认知:“干线”“飞机航线”“大巴走南线”。边缘义项“比喻细微”(量词,多用于抽象事物,常说“一线”)必须依靠下列语境:“一线希望”“一线光明”“一线生机”“一线红光”。

3.2.6 推动义项排列法的发展

已有的义项排列法分历史(时间)序列、频率序列、逻辑序列、词性序列(实→虚,主→次)等。根据原型理论,又演绎出认知原型序列。一词有许多义项的,从中选一个或几个认知原型义项。确定这个义项的条件或标准,是认知中具有突显地位的意义:较早认知的并有引导、代表作用的,处于认知的中心、主要位置,处于认知的基本层次,是常用、常见的意义。排在后面的义项认知较晚并无引导、代表作用,处于认知的外围、次要位置,处于认知的非基本层次,是不常用、不常见的意义。这样可以建构词项的新的多义结构体。进行这种新探索的词典有:《柯林斯合作英语词典》(2001)、《朗文当代英语词典》(2004)、《简明牛津英语词典》(2004,以下简称《牛津》)等。请看下列两组例子:

【杏】①杏树,落叶乔木,叶子宽卵形,花白色或粉红色,果实近球形,成熟时一般黄色,味酸甜。②(~儿)这种植物的果实。(《现代汉语词典》)

【Apricot】1.an orange-yellow soft fruit, resembling small peach./橘黄色的软果,像小桃子。2. the tree bearing this fruit./结有这种水果的树。(《牛津》)

【萝卜】①二年生草本植物,叶子羽状分裂,花白色或淡紫色。主根肥大,圆柱形或近球形,皮的颜色因品种不同而异,是常见蔬菜。②这种植物的主根。(《现代汉语词典》)

【Radish】1.a pungent-tasting edible root, typically small, spherical and red, and eaten raw./一种具有刺激味道的可食用的根,典型的radish很小,红色,可生吃。2. the plant of the cabbage family which yields radishes./长有这种根的植物。(《牛津》)

《现代汉语词典》比起《国语辞典》等较早的语文辞书,其长足进步之一,就是对其所收录的400多条有“植物”母体及其“子实”关系的义项,绝大多数都遵照植物生长的时间序列,第一义项描写母体(杏树),第二义项指明子实(杏儿),个别情况下把一二义项合并为一个义项的两个子义项,总之建构了“母子模型”。以此作为该类典型群的类名,把“萝卜及其根茎”、“植物及其种子”、“植物及其花、茎”等也归入其中。

《牛津》等新版词典则新建构了“子母模型”。它们不是遵照植物生长的时间序列,而是遵照大多数人的认知序列:大多数人较早认识或只认识杏儿这种果实、萝卜这种蔬菜,较晚或根本不认识杏树、萝卜这种植物。这样编排义项,便于读者从“凸显”认知“隐晦”,从熟悉认知陌生,从已知认识未知。尤其是对第二语言习得者,更为方便。

3.2.7 推动义项语义特征提取法的进展

辞书义项中的内容选择是个较复杂的问题。这里以“萝卜”的释义为例,观察一下古今中外的变化和异同。

A.《尔雅·释草》晋·郭璞注“蘆菔”、“紫花大根”。宋·邢昺疏:“今谓之萝卜是也。”清·王念孙《广雅疏证》引《唐本》云:“味辛甘温,捣汁主消渴,其嫩叶为生菜食之,大叶熟啖,消食和中。”

B. 蔬类植物,茎高尺余,叶作羽状分裂,花色淡紫或白,根长,色白多肉,可食;别有红萝卜,皮红肉白,亦可食。(《国语辞典》)

C. 十字花科。一二年生草本。肉质直根呈圆锥、圆球、长圆锥、扁圆等形,肥厚多肉,白、绿、红或紫色等……(省略号的内容有:叶、花、性能、产地、类型、功用)。(《辞海》)

D. 《现代汉语词典》(释义见前文)。

E. 《牛津》(释义见前文)。

对“萝卜”的释义,A类囿于古代,仅管见所及,郭璞只言及部分形态,王念孙只引述了部分性能。B类已有近代语文观念,释出较多状态。C类已有现代百科理念,详尽给出客观物体的类别、形态、性能、产地、类型、功用。D类已有现代语文词典理念,选择并给出词语的必要语义特征,即义征,而不是物性。吕叔湘先生认为,“外界事物呈现无穷的细节”,单词意义“保留一部分,放弃一部分”,“一部分显示,一部分暗示”。(吕叔湘,1980)E类已有现代语文词典原型论思想:其一,在多种萝卜中选出典型群;其二,在多种味道中选出“有刺激”;其三,在多种形体中选出“很小”;其四,在多种颜色中选出“红色”;其五,在多种功用中选出“可生吃”;其六,在多种上位范畴中选出认知的基本范畴——植物“根”。这6项就是选出最典型的事物特征作为语义特征,最少量的,必不可少的,最有区别性的,最简明的。这就是原型论在选择义素这一层面上的新进展。它显示了词义(义位/义项)反映了以典型成员为中心的原型范畴,使释义思想从结构主义语言学转到认知语言学,从客观主义范式转到非客观主义原型模式。