- 相關推薦
機器翻譯中漢語動結式生成的過程和困難
1.引言
當電子計算機1946年問世的時候,人們就提出了機器翻譯的想法,并且在1954年進行了第一次機器翻譯試驗。然而與后來的各種語言信息處理研究和應用(語言信息檢索、文本自動分類、自動文摘、信息提取等等)相比,機器翻譯卻是進展最慢的。學者們傾其大半生精力、商家投入為數可觀的資金,經歷五十多年不懈的研究和開發,得到的成果或者產品卻常常不能令人滿意。
原因是什么呢?從語言研究的角度來說,機器翻譯系統分析、理解和生成自然語言的能力都還不到位,處理不了的語言現象很多:有的是句子結構層次弄錯了,有的是結構關系弄錯了,有的是成分之間的語義關系弄錯了,有的是詞義辨識錯了,還有的錯誤是源語和目標語之間的對比差異造成的。下面是機器翻譯處理漢語動結式不成功的幾個例子(來自三個機器翻譯系統)。
先看生成的情況,機器翻譯目前還很難生成漢語的動結式,所以我們很少在漢語譯文里見到含有動結式的句子。對于下面這個英譯漢的例子,三個系統都不能翻譯成“他把地掃干凈了”:
He swept the floor clean. * 他干凈地掃地了。
* 他清掃清潔的地板。
* 他清掃地板干凈。
再看漢語動結式翻譯成英語的例子,它們可以說明目前機器翻譯系統分析和理解漢語動結式的能力:
他踢壞了三雙鞋!*He plays three pairs of evil shoes.
*He kicked three pairs of shoes bad.
*Him kick spoil 3 pairs of shoes.
這段路把媽媽走累了。*The way make mother tired after the walk.
*This section of way was walked mother tired(ly).
*This road mother walk tired.
大家吃膩了剩菜。*Everybody has fedded up with the leftovers.
*That everybody ate greasy(ly)surplus vegetable.
*All eat,is loathe to leave vegetable.
下面我們只討論動結式的生成問題,其中不包括以下三種情況:1)補語用“得”字連接的;2)補語虛化的,如:“抓住”、“買著”、“看完”、“辦成”等;3)補語和動結式的賓語有固定搭配關系的,如:“說走了板”、“看愣了神”、“苦出了頭”等等。
2.機器翻譯中的動結式問題
為了說明機器翻譯如何處理動結式述語結構,我們需要先看看機器翻譯的過程。下圖說明了機器翻譯的原理,也是機器翻譯的整個過程。
附圖
圖1 機器翻譯的過程
顯然,這是一個理想化的機器翻譯過程。從S到I再到T的過程是中介語言的翻譯策略,中介語言通常是某種獨立于源語和目標語的邏輯表達式。如果是英譯漢,對英語的分析和理解要從表層深入到底層,得到描述句子意義的中介語言邏輯表達式。同樣地,漢語也要從底層到表層一步一步生成。分析時從表層到底層走得越深,生成時從底層回到表層的過程也就越復雜。因此,需要分別對這兩種語言的句法和語義系統作深入的研究。實際上目前大部分機器翻譯系統都作不到這個程度,常見的翻譯策略是直接法或轉換法,或直接和轉換相結合的混合方法。我們可以通過一個英譯漢的例子對直接法、轉換法和中介語言法這三種翻譯策略作一個比較:
You get good reception on your radio.(摘自某產品說明書)
譯句1 你得到好的接收在你的收音機上。
譯句2 你用你的收音機得到好的接收。
譯句3 你的收音機接收情況良好。
在機器翻譯系統中,用直接法可以得到譯句1;用基于句法的轉換法,再加上一些語義關系的分析,能得到譯句2;譯句3是基于理解的,用中介語言法有可能作到。顯然,前一節關于動結式英譯漢和漢譯英的例子,都不是基于理解的翻譯。
動結式的結構形式簡潔,語義關系復雜,在漢語里是很有特點的一種結構。呂叔湘先生(1986)曾用它說明漢語句法的靈活性。人們在從各種角度論述動結式述補結構的時候,常常會提到它在對外漢語教學當中是個難點。同樣,在機器翻譯中它也是個難題。在漢語翻譯成外語的系統里,難的是如何分析和理解動結式述補結構。在外語翻譯成漢語的系統里,難的是如何生成含有動結式的句子。
我們在這里只討論生成的情況。在這種情況下,源語(例如英語)往往沒有相當于漢語動結式的結構形式,也很難用轉換規則把英語的某些結構形式與漢語動結式聯系起來。所以除非用個別處理的辦法,采用直接法和轉換法翻譯策略的系統很難生成漢語的動結式譯文。要讓系統有生成動結式的能力,就要按中介語言法的思路,增加分析的深度,理解源語句子要表達的意思(各個成分的概念意義、成分之間的關系意義,句子的句式意義,等等),然后根據意義表達的需要,選擇動結式的一種結構形式,再生成表層的句子。目前我們對漢語的研究還不足以支持這樣的生成過程。所以在現有的機器翻譯系統輸出的漢語譯文當中,很難找到地道的含有動結式述補結構的句子。于是就有了下面的譯文:
He has made the question complicated.他已使問題復雜化。(他把問題搞復雜了。)
The children have had enough to eat.孩子們已吃了足夠。(孩子們吃飽了。)
這樣的譯文對機器翻譯來說就算不錯了,只是念起來有些別扭,有點“機器味兒”。
3.動結式的生成過程
機器翻譯譯文生成的任務是從要表達
【機器翻譯中漢語動結式生成的過程和困難】相關文章:
探析漢語詩詞英譯過程中的拙化現象03-20
淺探漢語詩詞英譯過程中的拙化現象12-05
論文寫作過程中的方法和手段03-20
服務創新過程中的員工和顧客管理03-22
漢語中結構話題的語用解釋和關系化03-18
探析多媒體在漢語聽說課堂中的應用和思考03-18
漢語中的數字文化06-01
追求“意料”和“意外”的生成03-19
試論對外漢語教學中的漢語課教學03-09