基于語料庫的同義詞“持續”、“連續”的辨析
摘 要:文章以同義詞“持續”和“連續”為例,通過使用語料庫,運用搭配理論和語義韻理論,展示了語料庫技術在同義詞辨析方面的重要作用。
關鍵詞:語料庫;持續;同義詞辨析;連續
關于同義詞辨析,傳統方法是借助于“同義詞辨析詞典”等參考書,這一方法的缺點在于:舉例不充分,闡述難理解。隨著計算機技術的突飛猛進,大型語料庫的建立為同義詞辨析提供了新的方法和途徑。
一、語料庫在詞匯研究中的運用
(一)語料庫的運用
語料庫就是一定規模的真實語言樣本的集合,有三個特性:一是收入語料庫的語言材料應當取自真實文本;二是語料庫應是機器可識別和讀取的;三是語言材料經過適當標注和加工處理。通過對語料庫檢索統計,可以發現同義詞在不同語域中的詞頻分布差異,計算出詞語搭配的相互信息值,通過觀察檢索行中所呈現的同義詞搭配特征,就能揭示出它們不同的類聯結、搭配關系和語義韻等語言特征。
(二)相關理論
1、搭配理論
“所謂搭配關系,就是指詞與詞之間的橫組合關系,即什么詞經常與什么詞組合在一起。詞的意義在特定的搭配關系中常常具有特定的意義。”搭配指個別詞項之間習慣性的同現。例如“布”作名詞時與“匹”、“料”搭配,作動詞時與“置”、“分”搭配。搭配通常分為詞匯搭配和語法搭配。詞匯搭配存在于名詞、動詞、形容詞和副詞之間的搭配關系中,如我們常說“吃面”,而不說“喝面”,因為根據“面”的詞義,與“吃”特征比較匹配。
2、語義韻理論
一定的詞項會習慣性地吸引某一類具有相同語義特點的詞項,構成搭配。由于這些具有相同語義特點的詞項與關鍵詞項在文本中高頻共現,后者就被“傳染”上了有關的語義特點,整個語境內就因此彌漫了某種語義氛圍,這就是語義韻。
二、“持續”在語料庫中的搭配考察
選定國家語委現代漢語語料庫作為考察數據,因為它語料規模很大,時間跨度大,語料收錄廣泛,是一個大型通用的現代漢語平衡語料庫;同時在數據處理功能上,完成了詞語切分和詞性標注。
(一)“持續”的搭配情況
在語料庫中收集并整理得到有效語料700例,“持續”后面的搭配詞語可分為三類:形容詞、動詞和名詞,另有個別詞項為副詞和助詞以及零搭配等。這樣得到“持續”的搭配情況:“持續+VP”、“持續+NP”和“持續+AP”。
1、持續+VP
在這一情況中,“VP”主要有性狀動詞、動作動詞、趨向動詞和關系動詞。其中性狀動詞所占比例最高,出現頻率最高的是“發展”一詞,其他如“增長、不降、不退、振興、好轉、貶值”等表事物變化或消失義的動詞。其次是動作動詞,如及物動詞“開發、保護”等,不及物動詞“循環、創新”等。
2、持續+NP
在這一情況中,“持續”與表時間的名詞的搭配占絕對比例,高達77%。如“持續(一定/很長/的/一段)時間”、“持續時間+(為/可達)+數量時間名詞”、“持續時間+(比較/最/越/也)+長/短”等等。
3、持續+AP
在這一情況中,“持續” 借助其他成分限制或修飾后面的詞語,如“持續(偏/走)+高”,這類詞語大多是性質形容詞,如“高漲、異常”等。
(二)“持續”搭配詞的語義色彩傾向
通過研究發現,“持續”的語義韻呈現中性傾向。其搭配詞語多表示中性色彩和積極色彩。在VP類詞語中,語義韻呈現積極傾向,如“振興、發展”等;在NP類詞語中,語義韻呈現中性傾向,因為NP中占絕對比例的表示時間類的詞都是中性詞,屬于客觀反映。
三、“連續”的語料庫考察
(一)“連續”的`搭配情況
在語料庫中收集并經過整理得到有效語料771例。“連續”的搭配詞語主要是動詞和名詞,形容詞只有4例。另有個別搭配詞項為助詞、零搭配和后接成分等。這樣得到“連續”的搭配情況:“連續+VP”、“連續+NP”。
1、連續+VP
在這一搭配中,“VP”主要有性狀動詞、動作動詞和關系動詞等幾類。其中動作動詞所占比例最高,以及物動詞為主,如“觀測、出現”等。
2、連續+NP
在這一搭配中,名詞性成分可以分為三類:時間類、專名類、普通類。時間類NP可做狀語、定語或謂語,如“連續幾天、連續多年”等。專名類主要是指“連續”后接名詞屬于專業術語,如“~函數、~點”屬于數學術語,“~介質”屬于物理術語等。普通類NP以抽象名詞為典型搭配,如“低溫、生活”等。
(二)“連續”搭配詞的語義色彩傾向
經研究,在VP類詞語中,語義韻呈現中性傾向,如“觀測、出現”;在NP類詞語中,語義韻亦然,因為NP中占絕大多數的時間類和專名類詞全部為中性詞,屬于客觀反映?偟目磥恚“連續”的搭配情況中,近絕大部分的詞都呈中性色彩。
四、結語
用語料庫進行搭配分析提供了一種新穎直觀的同義詞辨析方法,經研究,“持續”和“連續”在搭配形式和語義韻特征上都存在差異。“持續”可以搭配動詞性、名詞性和形容詞性成分,而“連續”后面卻不能搭配形容詞性成分;與“持續”搭配的詞語有中性傾向和積極傾向,而與“連續”搭配的詞語只有中性傾向。
參考文獻:
[1] 楊節之.語料庫搭配檢索與英語同義詞辨析[J].外語電化教學,2007(116)
[2] 翟紅華,方紅秀.國內語義韻研究綜述[J].山東外語教學,2009(2)
[3] 楊巖勇.基于語料庫的同義詞辨析[D].廣州:暨南大學碩士學位論文,2007(5)
[4] 王文斌.英語詞匯語義學[M].杭州:浙江教育出版社,2001
[5] 衛乃興.語料庫數據驅動的專業文本語義韻研究[J].現代外語,2002(2)
【基于語料庫的同義詞“持續”、“連續”的辨析】相關文章:
5.基于聯結主義的連續記分IRT模型的項目參數和被試能力估計
8.日語助詞的辨析