- 相關推薦
一種基于經典領域本體構建方法的改進研究
語義網是現在的熱門研究課題,而組建語義網的基石是領域本體的構建。如果沒有一個完善的本體,整個語義網的構建也只能是一座空中樓閣。所以本體構建在語義網研究中具有十分重要的地位。本體構建的探討主要包括三個方面,即本體構建方法、本體描述語言、本體構建工具。其中本體構建方法對本體構建過程的實施具有指導性的意義,直接決定了本體對知識的表示和邏輯推理能力。如果沒有一個好的構建方法的指導,就很難保證本體構建的規范化,進而對基于本體的后續應用也會產生巨大影響。
一、經典本體構建方法分析
國內外的研究小組根據各自的項目提出了很多本體構建方法,經典的本體構建方法有骨架法、評價法、METHONTOLOGY法、Bernerasetal(KACTUS)方法等等。骨架法對構建框架和各階段的指導方針有參考價值而且有本體評估的步驟,但是每一步卻沒有具體的方法和技術:評價法提出了本體獲取的新方法,明確提出了需求的問題,但是沒有文檔化過程和步驟的說明;METHONTOLOGY法有本體評估步驟,詳細描述了相關技術工具、知識來源,但是沒有具體的本體評估方法;Bernerasetal方法主要針對應用驅動的本體開發,但缺乏具體支持技術和本體評估、文檔化過程,不適合從無到有的本體構建。
二、本體構建方法的改進探索
針對現有本體構建方法的缺點,一些學者做了一些有益探索。筆者在其他學者研究的基礎上,結合自己的想法提出了一種
新的本體構建方案,具體步驟如下:
(一)領域本體需求分析。這個階段主要是要明確領域本體構建和應用目的、領域與范圍、表示方法、用途以及使用者等。
(二)考慮本體復用。明確要開發的領域是否存在有現成的本體。如果不存在己有本休,則轉入第(三〉步:如果存在現成本體,則需要進一步分析己有本體是否滿足需求,不滿足項目需求則轉入第(三)步,倘若滿足需求則進入第(五)步。
(三)分析本體結構,列出領域重要術語。這一階段可以采用半自動的方法從主題詞表、敘詞表、領域文獻庫或者關系數據庫中抽取關鍵術語和概念并加以整理,通過這一過程可以完成大部分的術語匯總,然后通過入工搜集或者本體的動態學習機制擴充完善術語。
(四)定義類和類層次關系。這一步可以細分為兩個小步驟即定義類和定義類層次關系。
1.定義領域本體中的類。在步驟(三)中羅列出的大量的概念和術語處于一種混亂無組織并且彼此之間沒有關聯的狀態,需要通過一定的邏輯規則對它們進行分類,形成不同的子領域。此外還需要對這些概念和術語的重要性進行評估,摒除那些超出領域范圍的概念和術語,盡可能簡潔和準確的表達出領域知識。
2.定義類之間的層次關系。建立類之間的層次關系一般有自頂向下、自底向上、綜合法等幾種方式。自頂向下定義類層次即首先定義領域中綜合性,概括性的類,然后逐步細化擴展自最細小的類。自底向上正好相反即先從最小類的定義開始,然后逐步向上級類定義。綜合法是首先定義許多非常顯而易見的概念,然后分別對它們進行恰當的歸納和細化,從一些頂層概念著手,將它們與一些中級概念關聯起來。在具體的項目實施中可以根據實際情況采用合適的方法。
(五)本體的檢驗和評價。由于領域知識的復雜性,領域邊界的模糊性,不同領域之間往往存在著交叉,本體的構建很難一步到位?梢愿鶕礼ruber所提出的五條指導原則來檢驗和評價本體。如果不符合要求則返回第(三)步重新進行本體分析并加以適當的修正,直至達到要求為止。此過程需要迭代進行。
(六)本體的存儲。本體建設完成后,需要存儲本體。本體的存儲可以采用。吼文檔形式或者存儲為關系數據庫形式。。吼格式存儲比較簡單,但是當文檔數量比較大時用關系數據庫存儲本體就比較方便,可以根據實際情況進行選擇。
三、結束語
隨著語義網研究的深入,本體構建方法也將逐漸成熟。而從各個項目工程中總結出來的方法,并不能適合每個項目的要求,需要根據項目的情況加以修改。本文總結了一些主要的經典本體構建方法的特點,提出了一種迭代的具有本體進化特性的本體構建方案,同時也試圖利用主題詞表、敘詞表、領域文獻庫等現有資源通過半自動的方式抽取專業術語及其等級關系,以減輕在沒有本體復用情況下本體構建的工作量。下一步的研究將通過實踐來檢驗這一模型,以期使這個本體構建模型更加完善化和相對通用化。
【一種基于經典領域本體構建方法的改進研究】相關文章:
學科領域知識本體建設方法研究10-03
基于本體的概念設計知識管理研究08-12
淺談基于語義web的高校畢業生就業信息服務系統本體構建研究10-19
專利資產評估方法的改進研究09-03
基于改進的Ostu閾值的運動目標分割方法07-26
基于環境視角的創業研究框架構建06-26
基于網格的聚類方法研究07-13
一種改進的粒子濾波算法的研究10-05