[摘要]本研究自建语料库,对比分析美国主流媒体涉华政治语篇词块的结构和功能特征。研究发现,在结构上,《华尔街日报》主要以名词类和介词类词块为主,《纽约时报》主要以名词类和动词类词块为主。在功能上,指示词块在两库中比例最多,立场词块比例最少。《纽约时报》的关注重点在政治、教育等方面,而《华尔街日报》侧重于政治、经济等方面,但均格外关注涉华热点问题,如南海问题。本研究对词块研究、政治语篇分析均有一定贡献。
[关键词]《纽约时报》;《华尔街日报》;涉华政治语篇;词块特征
1.引言
近年来,研究者对词块的研究取得较大进展。词块的定义有五十多个术语,如词汇句段(lexicalized sentence stem)、多词单位(multiwordunit)、预制模块(prefabricated pattern)、语块(formulaic sequence)、搭配(collocation)、词块(lexical bundle)等(Wray 2002:9[1];胡元江,娄喜祥2011[2];胡元江等2017[3])。本研究采用Biber et al.(1999:990)[4]提出的定义,词块为在自然情境中,不管其地道性或结构状态,高频出现在一定文本中不间断的三词或多词序列。如:Insummary,I hold the view that protecting theenvironment is very important. 这句话中,“insummary, I”就不被看作词块,因为“,”破坏了其连续性。许多研究者基于此定义开展了一系列研究,Biber et al.(1999)[4]最先运用大型可比语料库,研究对话和学术语篇的词块特征,发现学术语篇中超过60%的词块都是由名词类和介词类词块组成;马广惠(2009)[5]研究了英语专业学习者二语限时写作的词块特征,发现近2/3的目标词块在二语写作中的输出率都低于本族语者;潘璠(2016)[6]研究了本族语者和非本族语者期刊论文的异同,发现中国学者论文并未遵循学术英语以短语类词块为主的特性,而是表现出以小句类词块为主的结构特征。值得注意的是,词块作为整体储存、识别和提取的语言单位(参见胡元江2011)[7],以往研究主要集中于学术语篇或研究本族语者和二语学习者对词块使用的异同,缺乏对美国主流媒体政治语篇词块结构和功能的对比研究,而对西方国家主流媒体涉华报道的研究逐渐成为学术热点,因此本研究自建语料库,分析《纽约时报》和《华尔街日报》涉华语篇中高频词块结构和功能的特征。
2.理论框架
本研究的理论框架为Biber et al.(1999:972)[4]的词块结构分类和Biber et al.(2004)[8]的词块功能分类。结构子类译文参照马广惠(2009)的翻译。Biber et al.(2004)[8]包括四类功能特征:立场词块、指示词块、组篇词块和会话专用词块。由于本研究所采取语料为主流媒体新闻报道,故不包含会话专用词块。立场词块表达愿望、责任、指令、意图、能力等态度,如be able to、I don’t know 等,可分为认知立场和态度/情态立场;组篇词块表达话题引出、聚焦、阐述、说明等,用于建立上下文关系,如as well as 等,可分为话题引出(聚焦)和话题阐述(说明);指示词块直接涉及实体或抽象体,表达识别、模糊、属性、时空、文本指示等,可分为3个子类:识别(聚焦)、属性规范和时空(文本指示),如in the world、in the past(Biber etal. 2004[8]; 胡元江等2017[3])。
3.研究设计
3.1研究问题
本研究探讨《纽约时报》和《华尔街日报》中高频三词词块的结构和功能特征,旨在回答以下问题:(1)《纽约时报》和《华尔街日报》涉华政治语篇词块的结构特征有何异同?(2)《纽约时报》和《华尔街日报》涉华政治语篇词块的功能特征有何异同?(3)《纽约时报》和《华尔街日报》两库共享词块有何特征?
3.2研究语料
本研究语料为《纽约时报》和《华尔街日报》2016.01-2016.12的涉华报道,自建语料库,库容分别为300018 和300349。两库库容相当,具有可比性。
3.3词块提取
3.3.1数据清理与词形还原
数据清理有三个步骤:人工清理符号、乱码等无效信息;(2)运用Textforever软件和编辑正则表达式对标题、导语等信息进行批量处理;(3)使用Lemmatizer 对词形进行还原处理,如将arelikely to 和is likely to 还原成be likely to,使词形规范化,提高准确度。
3.3.2词块提取和语料分析
本研究使用AntConc 3.4.4软件进行词块提取。首先自动提取三词词块,提取频点为40次/mw,同时至少在五个文本中出现。最终《纽约时报》提取出62个有效词块,《华尔街日报》提取出43个有效词块,进行对比分析。
4.结果与讨论
本研究从《纽约时报》和《华尔街日报》中分别提取了62和43个三词词块。进行结构和功能分类,参考胡元江等(2017)对词块的结构分类,分为四大类:动词类、名词类、介词类和其他类。功能上,将词块分为三大类:立场类、组篇类和指示类。
4.1《纽约时报》和《华尔街日报》高频词块结构特征对比
4.1.1《纽约时报》结构特征
(1)动词类词块:共有22个,约占总数的35.5%。动词类词块分为五个子类:1)代词/名词+ 其他动词片段。2)be+其他名词短语片段。3)代词/名词+其他动词短语片段。4)to do短语片段。5)其他动词短语片段。最突出的特点是包含be的动词类词块较多,多达10个,占该类45.5%,包含“动词短语+be”、“名词短语+be”、“be+介词短语”分类,出现频次较高的词块有be try to, be ableto, there be no 等。其他动词短语片段词块较多,共有12个,占该类的54.5%,例如say in a, sayit be, be try to 等。
(2)名词类词块:共有23个,约占总数的37.1%。名词类词块分为两个子类:1)名词短语+介词短语片段;2)其他名词短语片段。名词短语+ 介词短语片段较多,约占该类的47.8%。其中“名词短语+of”词块最多,如one of the, a lot of,part of the 等。
(3)介词类词块:共有15个,约占总数的24.2%。介词类词块共分为三个子类:1)in+名词短语片段;2)of+名词短语片段;3)其他介词短语片段,这类词块主要是at, around 等介词+ 名词短语片段居多。介词类词块中,in+名词短语片段最多,共5个,约占该类的33.3%,如in recentyear, in the south 等。其次是of+ 名词短语片段,共5个, 约占该类的26.7%,如of the world,out of the 等。
(4)其他类词块:共有2个,约占总数的3.2%。其他类词块共分为两个子类:1)连接类词块;2)从句类词块。连接类词块只有一个:as well as,从句类词块是wh-从句片段,只有一个:whatyou need。
4.1.2《华尔街日报》结构特征
(1)动词类词块:共有10个,约占总数的23.2%。动词类词块分为两个子类:1)be+其他名词短语片段;2)其他动词短语片段。其中最突出的特点是包含to的动词类短语最多,共6个,占该类的60%。出现频次较高的词块有:be likely to,be try to, be expect to 等。
(2)名词类词块:共有16个,约占总数的37.2%。名词类词块分为2个子类:1)名词短语+介词短语片段;2)其他名词短语片段。名词短语+介词短语片段为6个,包含of的名词类短语片段最多,约占该类的83.3%,如one of the, part ofthe, the end of 等。其他名词短语片段为10个,包含the的名词类短语片段较多,为7个,约占该类的70%,如the central bank, the south china等。
(3)介词类词块:共有14个,约占总数的32.6%。介词类词块分为3个子类:(1)in+ 名词短语片段;(2)of+ 名词短语片段;(3)其他介词短语片段。in+ 名词短语片段和of+ 名词短语片段的词块各为4 个,各约占该类的28.6%,如inthe past, in the first, of the world, out of the等。出现频次较高的词块有accord to the, in thepast, accord to a 等。
(4)其他类词块:总数为3个,约占总数的7%。连接类词块只有一个:as well as。
4.1.3《纽约时报》和《华尔街日报》高频词块结构特征对比
《纽约时报》主要以名词类和动词类词块为主,名词类词块中,子类其他名词词块所占比例略高;动词类词块中,子类其他动词片段比例最高,缺少后置that从句修饰、被动动词片段等分类的词块。《华尔街日报》主要以名词类和介词类词块为主,名词类词块中,子类名词短语+介词短语词块和其他名词短语片段比例相当;动词类词块中,子类其他动词片段比例最高。
4.2《纽约时报》和《华尔街日报》高频词块功能分类特征
4.2.1《纽约时报》词块功能特征
将《纽约时报》提取的62个词块按指示类词块、立场类词块和组篇类词块进行分类,具体分析如下:
(1)指示类词块:共有40个,约占总数的64.5%。指示类词块共分为3个子类:1)识别:共有10个,如one of the, part of the 等高频词块;2)性质描述:共有4个,如a lot of, theministry of 等;3)时空信息:共有26个,如around the world, the cultural revolut ion 等。
(2)立场类词块:共有7个,约占总数的11.3%。立场类词块仅包含1个子类:态度立场,如you need to, be able to, be try to 等。
(3)组篇类词块:共有15个,约占总数的24.2%。组篇类词块共分为2个子类:1)话题引出:共有9个,如there be a, say it be等;2)话题阐述:共有6个,如as well as 等。
4.2.2《华尔街日报》词块功能特征
再将《华尔街日报》提取的43个词块按指示类词块、立场类词块和组篇类词块进行分类,具体分析如下:
(1)指示类词块:共有32个,约占总数的74.4%。指示类词块共分为3个子类:1)识别:共有8个,占该类的25%,如one of the, part ofthe 等;2)性质描述:共有1个,占该类的3.1%,如the end of 等;3)时空信息:共有23个,占该类的71.9%,如south China sea, the Chinesegovernment 等。
(2)立场类词块:共有5个,约占该类的11.6%。立场类词块共分为2个子类:1)认知立场:共1个,如be likely to ;2)态度立场:共有4个,如say it will, be try to 等。
(3)组篇类词块:共有6个,约占总数的14%。组篇类词块共分为2个子类:1)话题引出:共有2个,如do not respond 等;2)话题阐述:共有4个,如say in a; as well as 等。
4.2.3《纽约时报》和《华尔街日报》高频词块功能特征对比
在功能上,指示词块在两库中比例最多,《纽约时报》指示词块所占比例略低于《华尔街日报》,而立场词块比例最少,但两库所占比例相当。该研究中,指示词块通常以介词类词块为主,立场词块通常以动词类词块为主。
4.3《纽约时报》和《华尔街日报》两库共享词块特征
《纽约时报》的高频词为the culturalrevolution,the university of,South ChinaSea 等,侧重于政治、教育等方面,而《华尔街日报》高频词为Bank of China,the centralbank,South China Sea 等,侧重于政治、经济等方面,但均格外关注涉华热点问题,如南海问题。根据对数似然率结果,共享词块为15个,其中10个无显著性差异。共享词块以名词类和介词类词块为主,这与上述讨论中《纽约时报》和《华尔街日报》的结果一致。
5结论
本研究基于语料库,探讨《纽约时报》和《华尔街日报》高频词块的结构和功能特征。研究发现,在结构上,两家媒体涉华政治语篇词块结构的总体分布略有差异。具体而言,《华尔街日报》主要以名词类和介词类词块为主,名词类词块中,子类名词短语+ 介词短语词块和其他名词短语片段比例相当;动词类词块中,子类其他动词片段比例最高。而《纽约时报》主要以名词类和动词类词块为主,名词类词块中,子类其他名词词块所占比例略高;动词类词块中,子类其他动词片段比例最高,缺少后置that从句修饰、被动动词片段等分类。在功能上,《华尔街日报》和《纽约时报》均以指示词块占绝对多数,各功能类型词块的比例亦呈现相同特征,分别为指示、组篇和立场词块。《纽约时报》侧重通过名词类和动词类词块实现立场功能,而《华尔街日报》侧重通过名词类和介词类词块实现指示功能。本研究对词块研究、政治语篇分析均有一定贡献,对二语教学亦有相当意义。
参考文献:
[1]Wray,A.2002.Formulaic Language and theLexicon[M].Cambridge:CUP.
[2]胡元江,娄喜祥. 程式化语言的多视角, 多维度研究——《程式化语言》评介[J].外语教学与研究,2011(4) :626-632.
[3]胡元江,石海漫,季萍.英语学习者与本族语者议论文词块的结构与功能特征——基于语料库的对比研究[J].外语研究,2017(4):58-62.