西北师范大学青年文丛《名词短语竞争与关系从句生成--一项基于英汉对比数据库的研究》

发布者:张璞发布时间:2018-04-12浏览次数:522

                           

作者:曹依民

成果简介:

名词短语具有可及性。可及性指人在生成和理解语言时,从大脑记忆系统中提取语言或记忆单位的便捷程度。名词短语作为认知的概念化结果,因其本质特征(譬如生命度)形成可及性差异。可及性越高,越容易被提取。

一般的生命度划分为有生-无生格局,这是基于生命度的提取顺序观的核心前提。这一分类简单明了,便于操作,但不够精细,因为有生实体类别多样,如:第一&第二人称 > 第三人称 > 代词/亲属称谓 > 人类 > 有生实体 > 无生实体(Silverstein,1976)。

上述生命度等级表明,有生实体各位置之间也存在可及性差异。继续考查各位置内部发现:同一等级位置内部的名词短语可及性大体相似,而当两个或两个以上名词短语均有提取可能时,就出现了竞争关系。这是基于相似性的竞争观秉持的立场。

深入考察发现,提取顺序观和竞争观的基础类似,差异仅在精密度不同,二者属同质架构。等级位置接近或相同的名词短语会产生概念的竞争和干扰,其机制可在生成-分布-理解观(PDC)中得到阐释。三者桥接起来,就构成了基于生命度的名词短语竞争体系。

基于生命度的可及性在简单句中的作用已有大量研究,但复杂句的研究尚不充分。比较前沿的研究是Gennari et al(2012),该研究通过五项实验,考察提取顺序观与竞争观在生成关系从句语态、施事的隐现以及关系化标记的隐现中的作用。其研究结果总体上证实了上述两种句子生成观有效作用于关系从句的生成,且该作用在英语、西班牙语及塞尔维亚语间存在跨语言差异。

鉴于这三种语言同属印欧语系,需要其他语系语言的佐证,且实验结果也需要自然语言的检验,故本研究从可比材料中选取英汉叙事语篇各5部(各约10万字/词),从中选出符合关系从句标准的语料共6166条,建立了英汉对比数据库。

统计分析发现:总体上,关系从句的类型和语态的分布大致符合名词短语竞争体系的预测。名词短语的生命度分析越精密,其竞争的作用越明显,比如施事的隐现;另一些关系从句的分布模式更符合PDC的预测,如关系化标记的隐现。语料表明,关系从句生成不止涉及上述实验的自变量,还包括语境、语义角色等因素。此外,这些因素均存在跨语言的共性和差异。比如,英汉关系从句语态的选择在某些条件下遵循名词短语竞争体系,但与英语不同,汉语主动形式表达被动意义的结构分布频度最高,与塞尔维亚语类似,而塞尔维亚语必须依赖名词和代词的格标记。换言之,即使具体语言的限制不同,语言形式的分布也可能相似。

这些规律性或倾向性发现可应用于翻译、写作、语言习得等领域。