- 相關推薦
機械人提供:基于LV-SVMs 的UUV NARX動態辨識模型(一)
基于LV-SVMs 的UUV NARX動態辨識模型提 要 鑒于水下無人控制機器人(UUV) 的動態控制越來越重要,本文針對當前辨識模型存在的所獲參數精確性不足,運用非線性黑箱辨識模型,提出了基于最小二乘支持向量機的UUV NARX 動態辨識模型。將該模型應用于辨識UUV 的兩個關鍵參數偏航角γ和x y 平面內的速度ν , 取得了良好的辨識效果。
主題詞 水下機器人 動態控制 非線性控制 參數識別 數學模型
水下無人控制機器人( UUV ———UnmannedUnderwater Vehicles) 目前已廣泛地運用到商業、科研、軍事等領域。但是,面對越來越長時間的工作量和種種未知的工作環境,對UUV 的動態控制也變得越來越復雜。因此,在UUV 中嵌入智能控制系統,以使UUV 能更好地完成復雜的任務。UUV的動態控制系統的輸出,若能與參考模型的理想輸出一致,則可以獲得良好的控制性能,因而參考模型直接影響到動態控制系統能否對UUV 的當前狀態作出正確判斷。但是,UUV 的水動力學方程異常復雜[ 1 ] ,為此在以往的研究中,都是通過簡化方程來獲得UUV 的相關系統參數的,如文獻[ 6 ]運用最小二乘法,文獻[ 7 ]運用卡爾曼濾波法,都取得了不錯的辨識效果。但這些簡化都存在不同程度的損耗,降低了所獲得參數的精確性。為了提高UUV 參數的精確性, 進一步提高UUV 的動態控制性能,本文提出了一種基于最小二乘支持向量機(LVOSVMS) 的非線性黑箱建模(BlackObox modeling) 方法,建立了基于最小二乘支持向量機的UUV NARX 動態辨識模型。
1 非線性黑箱辨識模型
非線性黑箱辨識模型的結構如圖1 所示。
圖1 非線性黑箱辨識模型結構圖
對于輸入向量ut = [ u(1) , u(2) , ⋯, u( t) ] 和輸出向量yt = [ y (1) , y (2) , ⋯, y ( t) ] , 構造函數如下[4 ] y ( t) = g (ψ( t) ) +ν( t) 。其中g (·) 為對y ( t) 的估計; ν( t) 為誤差項; ψ( t)=ψ( ut - 1 , yt- 1 ) 為回歸因子。g (·) 是從輸入向量ut ,到回歸因子和從回歸因子到輸出向量yt 這兩個映
射間的橋梁。
在實際應用中,已經建立了很多實用的非線性模型,常用的有:
(1) NFIR 模型,用u( t - k) 作為回歸因子;
(2) NARX 模型,用u( t - k) 和y ( t - k) 作為回歸因子;
(3) NOE 模型(也叫自回歸輸入/ 輸出模型或并行模型) ,用u( t - k) 和^y ( t - k) 作為回歸因子;
(4) NARMAX 模型,用u( t - k) , ^y ( t - k) 和ε( t - k) 作為回歸因子。
其中NOE 模型和NARMAX 模型對應于循環結構,即回歸因子包含非線性模型的估計輸出(注意,是非線性模型的輸出而不是真實未知系統的輸出) ,這種回歸容易使系統不穩定。NOE 模型在內部形成反饋,這也可能造成模型的不穩定性。NFIR模型,僅僅用u( t - k) 作為回歸因子,對于UUV 這樣復雜的系統,回歸因子中變量太少。為此,本文采用NARX 模型。
2 最小二乘支持向量機
2. 1 算法
LSOSVMs 是由Suyken J A K提出的一種新型的支持向量機[2 ] ,有別于傳統支持向量機采用二次規劃方法解決分類和函數估計問題。最小二乘支持向量機是采用多類核的機器學習,即采用核函數,根據Mercer 條件,從原始空間中抽取特征,將原始空間中的樣本映射為高維特征空間中的一個向量,以解決原始空間中線性不可分的問題。具體算法推導如下:對于給定的樣本數據集( xi , yi ) ( i = 1 ,2 , ⋯,l ; xi ∈Rn ; yi ∈Rn) , 利用高維特征空間中的函數:
y ( x) = ωTφ( x) + b;ω ∈ Rnh , b ∈R來擬合樣本集。非線性映射φ( x) 把數據集從輸入空間映射到高維特征空間。式中ω為權向量; b為偏置量。根據結構風險最小化原理,回歸問題轉化為約束優化問題:min J (ω, e) = 12ωTω +C2 Σli = 1e2is. t . yi = ωTφ( xi ) + b + ei式中C 為可調參數; ei ∈R 為誤差變量。建立Lagrange 函數:
L ( ω, b, e;α) = J (ω, e) - Σli = 1αi [ωTφ( xi ) + b + ei - yi ]
根據KKT 條件可得5L5ω = 0 →ω = Σli = 1αiφ( xi )5L5b= 0 → Σli = 1αi = 05L5ei= 0 αi = Cei5L5αi= 0 →ωTφ( xi ) + b + ei - y = 0
消去原始變量ω、ei 可得對偶問題:
0 I TvIv K + 1/ Cbα=0y 式中: Iv = (1 ,1 , ⋯,1) TKij = φ( xi ) Tφ( x j ) i , j = 1 ,2 , ⋯, l
y = ( y1 , y2 , ⋯, yi ) Tα = (α1 ,α2 , ⋯,αi )
通過求解上面的線性方程,求出α和b , 可得最小二乘模型:
y ( x) = Σαi K ( xi , x) + b
其中核函數K( xi , x) 是滿足Mercer 條件的任一對稱函數。常用的核函數有: (1) 線性核
K( xi , x) = x T x i ;
(2) 徑向基核
K( xi , x) = exp ( -‖x - xi ‖22σ2 ) ;
(3) 多項式核
K( xi , x) = ( x T x i + 1) d , d = 1 ,2 , ⋯, N本文采用徑向基核函數。
2. 2 核參數的選擇
由上述算法推導可知,對于采用徑向基核的最小二乘支持向量機的主要參數是正則化參數C和徑向基核參數σ ,這兩個參數在很大程度上決定了最小二乘支持向量機的學習能力和泛化能力。根據文獻[5 ]采用多層動態自適應優化方法。具體步驟如
下:
(1) 確定參數C 和σ取值范圍,依據最小二乘支持向量機原理,最大取值范圍是
C ∈ [0. 1 ,10000 ] ,σ ∈[0. 1 ,100 ] 。
(2) 在最大取值范圍內選取參數值,構建參數對( Ci ,σj ) 二維網格平面,其中
i = 1 ,2 , ⋯, m; j = 1 ,2 , ⋯, n 。例如,兩個參數各選取10 個數值,則構成10 ×10 網格平面和100 個( Ci ,σj ) 參數對。對于參數選取有兩種方法:第一種是,首先確定兩個參數的取值范圍,再根據所需參數對數進行均勻取值;第二種是,根據學習樣本的特征和經驗確定參數對值。
(3) 輸入每個網格結點的參數對( Ci ,σj ) 到最小二乘支持向量機中,采用學習樣本進行學習, 并輸出學習誤差。取最小誤差對應的節點值( Ci ,σj ) Emin 為最優參數對。
(4) 如果學習精度沒有達到所需要求, 則以( Ci ,σj ) Emin 為中心,構建新二維網絡平面,選取數值相近的參數值進一步學習,從而獲得更高精度的學習結果。這個新參數選取過程是自動執行的,經驗表明,一般以( Ci ,σj ) Emin 值的0. 01~5 倍為一個擴展網格寬度,構建新參數對( Ci ,σj ) 二維網格平面,其中i = 1 ,2 , ⋯, k ; j = 1 ,2 , ⋯, l 。以此類推,可構造多層參數優化網格平面,不斷優化最小二乘支持向量機參數,直到達到需要的學習精度。
3 UUV 動態辨識模型
UUV 的水下運動是一個及其復雜的過程,共包括六個自由度,每個自由度多個參數用來描述UUV 的狀態,這些參數之間都存在著非線性的關系。由文獻[1 ]可以知道,通過基本的物理學定理, 可以在加速度、速度、偏航角、橫滾角、UUV 推力、重力、浮力、阻力等之間建立一個6 自由度的非線性水動力方程。因此,可以采用LVOSVMs 非線性黑箱建模的方法對UUV 動態系統進行辨識。本文選取對UUV 運動姿態影響最大的兩個參數: X Y 平面內的速度v ,及偏航角γ來進行建模辨識。根據現有文獻,通過UUV 自帶的傳感器以及經過初步處理,可以得到與我們需要辨識的兩個參數之間存在非線性關系的參數有UUV 的加速度Ûv和UUV 推進器的推力τ ,運用這些參數建立UUV的非線性黑箱辨識模型。引入NARX 模型如下:yt = Σni =1ai y t - i + Σmj =1bj f ( ut- j ) + et , (1)
其中yt = ( vt , γt ) 為輸出項; f (·) 為一非線性函數, ut - j = ( Ûv t- j ,τt- j ) , yt- i = ( vt- i ,γt- i ) 為輸入項; et為誤差變量。由第一部分所述的LVOSVMs 原理,令f ( u) = ωTφ( u) + b0 , (2)選擇核函數
Ωk , l = K( uk , ul ) = φ( uk ) Tφ( ul ) ,把式(2) 代入式(1)
得yt = Σni =1ai y t - i + Σmj =1bj (ωTφ( u) + b0 ) + et 。(3)
令ωTj = bjωT , d = Σmj = 1bj b0 , 代入式(3) 得yt = Σni = 1ai y t- i + Σmj = 1ωTjφ( u) + d + et 。(4)
將回歸問題轉化為優化問題:min J (ωj , e) = 12 Σmj =1ωTjωj +C2 ΣNt = re2t, (5)
s. t . yt = Σni =1ai y t- i + Σmj = 1ωTj φ( ut- j ) + d + et ,(6)
ΣNk =1ωTjφ( uk ) = 0 , j = 1 ,2 , ⋯, m (7)
建立Lagrange 函數:
L (ωj , d , a , e;α,β) = J (ωj , e) - ΣNt = rαt { Σni = 1ai y t - i+ Σmj =1ωTjφ( ut- j ) + d + et - yt }
+ mj =1βj {ωTjφ( uk ) } 。
根據KKT 條件可得
5L5ωj= 0 →ωj = ΣNt = rαtφ( ut- j ) + Σmj =1βjφ( uk ) j = 1 ,2 , ⋯, m
5L5αi= 0 → ΣNt = rαt y t- i = 0 , i = 1 ,2 , ⋯, n
5L5 d= 0 → ΣNt = rαt = 0
5L5et= 0 →αt = Cet , t = r , ⋯, N
5L5αt= 0 → Eq. (6)
5L5βj= 0 → Eq. (7)
綜合以上各式得到
0 0 1 T 00 0 Y 0
1 Y T .K + C- 1 I K0
0 0 K0 T ‖Ω‖2F ·Imdaαβ=00y f0
其中 α = [αr ⋯αN ] T ;
β = [β1 ⋯βm ] T ;
a = [ a1 ⋯an ] T ;
y f = [ y r+1 ⋯yN ] T ;
Y =y r- 1 yr ⋯ yN - 1y r- 2 yr- 1 ⋯ yN - 2… … …y r- n y r- n+1 ⋯ yN - n;.Kp , q = Σmj = 1Ωp+ r- j , q+ r- j ;
K0p , q = Σnk = 1Ωk , p- q 。
通過以上線性方程求得α和d ,代入最小二乘模型即可得基于LVOSVMs 的UUV NARX 動態辯識模型:
f ( vt ,γt ) =αΣK( ut , u) + d
于是可得如圖2 所示的UUV 動態辨識模型的結構原理圖。
圖2 UUV 動態辨識模型的結構原理圖
4 辨識實例
為了檢驗本文所建立的辨識模型,我們設計了一個辨識實例,對上述模型進行了仿真試驗。軟件采用Matlab 。數據由文獻[ 1 ]中的UUV 水動力學方程產生。辨識測度采用如下性能指標:
(1) 辨識誤差為1
N ΣNi =1( yi - ^yi ) 2
其中yi 為期望輸出, ^yi 為辨識輸入。
(2) 訓練樣本采用在一百個時間單位內采集的數據,如圖3 所示。
圖3 訓練樣本
(3) 辨識過程。設置最小二乘支持向量機的參數C 和σ的取值范圍。采用兩層網格平面優化,根據非線性控制系統特征,在第1 參數優化層中,取
C =[0. 1 ,1 ,10 ,50 ,100 ,500 ,1000 ,2500 ,5000 ,10000 ] ,σ= [0. 1 ,0. 2 ,0. 5 ,1 ,5 ,10 ,15 ,25 ,50 ,100 ] , 即采用10 ×10 網格結構。獲得參數對如下: ①對于速度v ,( C,σ) 為(10000 ,5) ; ②對于偏航角γ , ( C,σ) 為(5000 ,10) 。
然后,在第二參數優化層中,以( Ci ,σj ) Emin 為網格平面中心,以( Ci ) Emin 值的±0. 1 倍值為C向擴展網格寬度,以(σj ) Emin的±0. 05 倍值為σ向擴展網格寬度,再次構建10 ×10 網格平面,獲得速度v 的最優參數對( Ci ,σj ) Emin為(15000 ,4. 25) ,偏航角γ的最優參數對( Ci ,σj ) Emin為(4500 ,15) 。利用以上最優參數對對速度v 和偏航角γ進行辨識結果如圖4 、圖5 所示。
對于速度v 的辨識誤差為0. 00213 ,偏航角γ的辨識誤差為0. 232 。上述結果表明,基于L SOSVMs
圖4 對速度進行辨識后的結果
實線為期望輸出,虛線為辨識輸出
圖5 對偏航角進行辨識后的結果
實線為期望輸出,虛線為辨識輸出
的UUV 非線性黑箱辨識模型的辨識精度較高,輸出的速度v 和偏航角γ與期望輸出相比,在不同的狀況下都取得了滿意的效果,表現出了很好的泛化能力。
5 結語
UUV 動態控制是保證UUV 能在復雜的水下環境中工作的關鍵。本文提出了一個基于L SOSVMs 的UUV 非線性黑箱辨識模型,將L SOSVMs應用于UUV 的動態控制辨識中,取得了滿意的效果,為今后UUV 的動態控制提供了一定的參考。
【機械人提供:基于LV-SVMs 的UUV NARX動態辨識模型(一)】相關文章:
基于最小二乘模型的Bayes參數辨識方法03-07
基于動態股權激勵模型的員工崗位分配新模式03-21
一種支持動態網站生成的模型與系統03-04
基于Blog的動態信息資源組織03-18
基于動態資源分配的WDM-PON結構研究基于動態資源分配的WDM-PON結03-07
基于改進遺傳算法的非線性儀表的參數辨識03-07
基于戰略系統的審計風險模型研究03-04
基于活動的日活動計劃模型研究11-22