基于連續型條件屬性的模糊規則約簡算法
摘 要:針對粗糙集對于連續域屬性決策表的處理能力差與不容易獲得模糊集之間關系等問題,提出一種將模糊集與粗糙集結合起來的連續型條件屬性模糊規則約簡算法。該算法首先引入三角從屬度函數將連續屬性值轉換為模糊值,并運用離散模糊神經網絡方法獲得數據集之間關系。實例驗證表明,采用該算法,用戶可以根據實際決策需求和領域知識更改閾值,從而獲得滿意的模糊規則結果。
關鍵詞:條件屬性;連續型;隸屬度函數;模糊規則
Attribute reduction algorithms of fuzzy rules based on?continuous domain condition attributes
CUI Meng-tian?1,ZHU Hao-dong?2,ZHONG Yong?2?(1.School of Computer Science & Technology, Southwest University for Nationalities, Chengdu 610041, China;2.Chengdu Institute of ?Computer Applications, Chinese Academy of Sciences, Chengdu610041, China)
Abstract:To solve the problems of low adaptability for continuous domain reduction and the disadvantage of failing to obtain eventual relationship among the fuzzy sets,this paper proposed a new method of attribute reduction algorithms of decision table based on combining fuzzy set with rough set. First,transformed continuous attribute value into fuzzy value with triangular membership function,then provided algorithms of hard C-means(HCM) clustering to obtain relationship among the fuzzy sets.In the end,simulation results show the effectiveness of the proposed method through an illustrative example.
Key words:condition attributes; continuous; membership function; fuzzy rules
0 引言
粗糙集理論[1]是一種研究不精確、不確定性知識的數學工具,其主要思想和優點就是在保持分類能力不變的前提下,能夠通過知識約簡導出問題的決策或分類規則。屬性約簡就是該理論中一個非常重要的概念,它反映了一個決策表的本質信息,現已得到廣泛的應用[2]。
在實際情況中,大多數數據集的屬性值是連續型的。這些連續型數據大多具有較強的模糊性,概念之間的界限并不十分明確。由于傳統粗糙集理論十分適合處理離散域屬性決策表,對于連續域屬性決策表的處理能力非常有限,這就大大限制了它的應用。如果把粗糙集理論應用于連續性屬性,那么在使用該理論之前就必須對連續屬性進行離散化。然而,離散化后的屬性值沒有保留屬性值在實數值上存在的差異,這將導致某種程度的信息損失。所以,粗糙集理論需要與其他能夠處理不精確或不確定問題的理論結合起來,以擴展其應用范圍。
模糊集理論也是一種用于在建模中針對一些實驗數據中不確定性和模糊性問題的有力工具。其優點在于:模糊集理論提供了系統的、以語言表示這類信息的計算工具,通過使用由隸屬函數表示的語言變量,它還可以進行數值計算。合理選擇模糊規則是模糊推理系統的關鍵因素,它可以有效地對特定應用領域中的人類專門知識進行建模。Pawlak指出粗糙集理論和模糊集理論不是互相排斥的,而是可以相互補充的[3];Dubois等人[4]又進一步指出它們是處理不確定知識的兩種數學方法,是具有互補性質的。為此,本文提出了一種將粗糙集和模糊集結合起來的連續型條件屬性的模糊規則約簡算法。
1 相關定義
為了較好地描述本文算法,先給出下面的一些定義作?鋪墊。
定義1 連續域決策表S=〈U,C,D,V,f〉。其中:U是非空有限對象集合U={u?1,u?2,…,u?n};C={c?1,c?2,…,c?m}是條件屬性集合,每個屬性都是連續型屬性;D=5vajrimf是決策屬性。
對于?c?j∈C(j=1,2,…,m),都可以使用隸屬度函數將它的連續型屬性值轉換為模糊值。用I?j?k表示連續屬性c?j的第k個模糊區間,m?j表示c?j的模糊區間個數,μ?kij表示對象u?i(i=1,2,…,n)在模糊區間I?j?k的隸屬度,vij表示u?i在c?j的屬性值,則vij可表示如下:
vij=μ?1ij/I?j?1+μ?2ij/I?j?2+…+μ??m??j?ij/I??m??j??j(1)
定義2 對于連續域決策表S=〈U,C,D,V,f〉,對象u?i和u?s在連續型屬性c?j的相似度定義如下:
μc??j(u?i,u?s)=1-1m?j?m?jt=1|μ?tij-μ?1sj|(2)
定義3 對于連續域決策表S=〈U,C,D,V,f〉,對象u?i在連續型屬性c?j上的相似類可以定義如下:
sim?βc??j(u?i)={u?t|μc??j(u?i,u?t)≥β,t=1,2,…,n}(3)
其中:β為所給的相似度閾值。
定義4 對于連續域決策表S=〈U,C,D,V,f〉,連續型屬性c?j在U上劃分所形成的相似類集組成的向量定義如下:
simClassVector(c?j)=(sim?βc??j (u?i)|i=1,2,…,n)(4)
2 數字特征向量及其相似矩陣
在決策表中,每個屬性可以找到一個表示其特性的向量,這個向量可以稱為屬性的`數字特征向量。
定義5 對于連續域決策表S=〈U,C,D,V,f〉,假設連續型屬性c?i在U上劃分所形成的相似類集組成的向量定義為simClassVector(c?j)=(sim?βc??j (u?i)|i=1,2,…,n),則連續屬性c?i的數字特征向量可定義為
DCV(c?i)=(λit|λit=card(sim?βc??i(u?t)),t=1,2,…,n)(5)
模糊集理論的基礎是模糊關系,最簡單的表現方法就是相似關系。相似關系是指滿足自反性和對稱性的二元模糊關系。眾多相似關系可以構造成相似矩陣,相似矩陣的傳遞閉包是模糊等價關系,其每個λ截集都是通常意義下的等價關系。
定義6 對于連續域決策表S=〈U,C,D,V,f〉,連續屬性c?i(i=1,2,…,m)的數字特征向量DCV(c?i),連續屬性間的相似矩陣定義為[R]=(rij)m×n。其中[R]中每個元素定義為
rij=1-δ×?nk=1|λik-λjk|(6)
其中:i, j=1,2,…,m;0<δ<1為一個常數;m為條件屬性的總個數。
3 新的屬性約簡算法
本文所提出的新的屬性約簡算法適用于條件屬性是連續型的決策表,其描述如下:
輸入:連續域決策表S=〈U,C,D,V,f〉、相似度閾值β、相似矩陣元素常量系數δ、模糊等價矩陣的截集閾值λ。
輸出:滿意的主觀條件屬性約簡集和模糊規則集。
a)將決策表中每個屬性的連續值使用三角隸屬度函數轉換為模糊值;
b)根據β以及式(1)~(4)計算各個條件屬性的數字特征向量;
c)通過 HCM聚類方法獲得數據集之間的關系;
d)用遺傳算法實現全局搜索;
e)選取適當的閾值λ,從而獲得滿意的主觀條件屬性約?簡集;
f)根據該主觀條件屬性約簡集,導出相應的模糊規則集,算法結束。
4 實例
本文以柴油機的供油系統故障診斷為例,表1是由數據形成的故障診斷決策表[3,5]。其中:u?1,u?2,…,u?6分別表示系統的六種狀態;c?1、c?2、c?3為條件屬性,分別表示穩定修復精度、操作修復精度、魯棒度;d為決策屬性,表示修復效果。
表1 柴油機的供油系統故障診斷系統的連續域決策表
Uc?1c?2c?3d
u?115021
u?216100
u?315212
u?416211
u?515102
u?64020
根據文獻[6,7]提供的條件屬性分割方法以及文獻[8,9]所提供的三角隸屬度函數,每個連續屬性分成五個模糊區間,其中屬性不出現的那些模糊區間就不在模糊表中表示出來了,最終得到該系統的模糊決策表。
這里取β=0.8計算每個條件屬性下的各個相似類。
經計算c?1下的各個相似類為
sim??0.8c??1(u?1)={u?1}
sim??0.8c??1(u?2)={u?2,u?4,u?5}
sim??0.8c??1(u?3)={u?3,u?5,u?6}
sim??0.8c??1(u?4)={u?2,u?4}
sim??0.8c??1(u?5)={u?2,u?3,u?5,u?6}
sim??0.8c??1(u?2)={u?3,u?5,u?6}
所以,DCV(c?1)=(3,4,2,4,,3,1)。同理可得DCV(c?2)=(1,3,2,3,4,3),DCV(c?3)=(2,3,3,3,3,2)。
由各個條件屬性的數字特征向量,取δ=0.02,使用模糊矩陣閉包運算方法[9,10]可以求得
[t(R)]=10.560.56?0.5610.56?0.560.561
取λ=0.8可得
[t(R)]?λ=1 0 0?0 1 0?0 0 1
在模糊等價矩陣的截集閾值λ=0.8的條件下,各連續條件屬性是不相關的。因此表1的主觀約簡集為{c?1,c?2,c?3},這個結果與文獻[8]所得的結果完全一致。
通過這個實例說明,利用本文算法不僅能夠解決連續域決策表屬性約簡問題,而且還可以根據需要獲得主觀的屬性約簡集和一組模糊規則集,這說明本算法是可行的。
5 結束語
本文針對粗糙集對于連續域屬性決策表的處理能力差以及不容易獲得模糊集之間關系等問題,提出一種把模糊集和粗糙集結合起來的連續型條件屬性模糊規則約簡算法。實例驗證表明,采用該算法,用戶可以根據實際決策需要和領域知識更改閾值,從而獲得滿意的模糊規則結果。
參考文獻:
[1]
PAWLAK Z.AI and intelligent industrial applications:the rough set perspective[J].International Journal of Cybernetics and Systems,2003,31(4):227-252.
[2]PAWLAK Z,SKOWRON A.Rudiments of rough sets[J].Information Sciences,2007,177(1): 3-27.
[3]PAWLAK Z.Rough sets:theoretical aspects of reasoning about data[M].San Francisco:Kluwer Academic Publishers,1992.
[4]DUBOIS D,PRADE H.Rough fuzzy sets and fuzzy rough sets[J].International Journal of General Systems,1990,28(3):191-208.
[5]CHANG T H,WANG T C.Using the fuzzy multi-criteria decision making approach for measuring the possibility of successful knowledge management[J].Information Sciences,2009,179(4):355-370.
[6]何亞群,胡壽松.一種基于粗糙—模糊集集成模型的決策分析方法[J].控制與決策,2004,19(3):315-318.
[7] 錢進,葉飛躍,孟祥萍,等.一種基于新的條件信息量的屬性約簡算法[J].系統工程與電子技術,2007,29(12):54-57.
[8]LIU Wen-jun,XIAO Qi-mei.Fuzzy decision algorithm based on rough sets[J].Fuzzy Systems and Mathematics,2006,26(2):127-132.
[9]胡軍,王國胤.覆蓋粗糙集的模糊度[J].重慶郵電大學學報:自然科學版,2009,21(4):112-115.
[10]趙峰.一般模糊矩陣傳遞閉包的計算、簡化與應用[D].青島:青島海洋大學,2003.
【基于連續型條件屬性的模糊規則約簡算法】相關文章:
4.搜索引擎算法規則