人工免疫系統在手寫希臘字符識別中的應用

時間：2024-07-14 20:13:08 計算機應用畢業論文我要投稿

相關推薦

人工免疫系統在手寫希臘字符識別中的應用

　　摘要：基于自然免疫系統的人工免疫系統是人工神經網絡和進化計算之后的新型計算智能，以其強大的信息處理和問題解決能力被廣泛應用到眾多領域。本文提出了基于人工免疫系統的手寫希臘字符識別策略并進行了實驗仿真。利用3*3子網格算法對24*24字符圖像樣本提取64個特征參數，通過人工免疫算法訓練圖像樣本，建立24個抗體庫用于識別手寫希臘字符。另外，利用BP神經網絡進行了對比實驗。實驗結果表明，人工免疫系統模型在手寫希臘字符識別中較BP神經網絡具有更大的優勢。

　　【關鍵詞】模式識別人工免疫系統 BP神經網絡子網格

　　1 引言

　　希臘字母廣泛應用于數學、物理、生物和天文學中，手寫希臘字母的識別對于手寫公式識別是非常重要的。然而，目前手寫識別的相關研究主要集中在數字、英文字符、中文字符、阿拉伯字符的手寫識別中，手寫希臘字母還沒有很好的識別算法。因此，它的研究具有重要的理論和實踐價值。

　　人工免疫系統是基于脊椎動物免疫系統處理過程的計算系統，通過改變系統結構和函數增強其適應性。免疫算法應用了免疫系統的學習和記憶特征，因此廣泛用于解決數學、工程、信息技術等領域的計算問題。

　　本文將人工免疫系統用于識別手寫希臘字符識別并取得了較好的效果。

　　2 手寫希臘字符預處理

　　預處理是字符識別重要過程，有助于特征提取、提高識別正確率和識別效率。

　　本文對24個手寫希臘字母進行了初步識別。1680個原始字符圖像由70個學生完成，即每個字符類別為70個樣本。

　　預處理被應用于圖像樣本以消除與字符分類不相關因素的影響。首先，利用3*3 KNN 平滑濾波器進行去噪，使圖像的特征信息更加突出。其次，對手寫圖像樣本進行歸一化。歸一化方式包括位置、大小和灰度，使用線性拉伸與壓縮算法，將字符圖像歸一化為24*24。歸一化后，利用Pavlidis 算法盡可能地將字符比劃的寬度降低到一個像素。最后，使用閾值算法將圖像進行二值化。

　　3 手寫希臘字符特征提取

　　目前存在很多圖像特征提取方式，提取方式的選擇對于識別效果是至關重要的。本文采用了網格特征提取用于手寫希臘字符識別。

　　網格特征廣泛應用于字符識別。網格有兩種應用方式：彈性網格和固定網格。對于固定網格，字幅圖像被分割為多個固定大小的子網格。彈性網格中，根據像素分布概率動態決定網格線的位置，該方式被廣泛應用于漢字識別。

　　本文采用固定網格進行特征參數的提取，子網格的大小分別為2*2、3*3 和 4*4，并進行了編程實驗測試。根據實驗結果、AIS的自適應性、學習能力和計算效率，3*3子網格被用于特征提取更有利于實現字符分類，即使用3*3子網格從左到右、從上到下對24*24二進制手寫字符圖像進行掃描，系數即為3*3網格內的像素值之和，由此可得到64個特征系數。圖1即為從α、β、ε、Ψ和φ的350個字符樣本中隨機抽取的5個字符樣本的64個特征系數。圖a為在灰度值小于128時像素值為1、否則為0的二值化后子網格內像素值的累加，圖b則為在灰度值小于128時像素值為0、否則為1的二值化后子網格內像素值的累加。

　　由圖可知，以灰度值小于128時像素值為1、否則為0的二值化后的3*3子網格提取的64個系數可較好地實現字符分類。

　　4 基于AIS的手寫希臘字符識別

　　基于AIS的手寫希臘字符識別中，經人工免疫算法訓練，可得到24個字符識別模式庫，即抗體庫�？贵w和抗原由源自3*3子網格的64個特征系數構成，抗體是AIS訓練樣本，抗原是需要識別的字符。所有的抗體庫都可用于識別輸入樣本。

　　4.1 親和度函數

　　抗體與抗原的親和度函數描述的是兩者的匹配性，親和度與它們的距離成反比。本文將歐氏距離的倒數被定義為親和度函數。

　　抗體之間的親和度函數指的是抗體之間的相似性，表明抗體的多樣性。其親和度函數同上。

　　4.2 利用人工免疫算法構建抗體庫

　　模擬生物免疫系統的抗體與抗原識別關系的人工免疫算法用于建立抗體庫以識別手寫希臘字符。每個分類庫的建立步驟如下：

　　步驟1初始化：從每個字符類別的70個樣本中隨機抽取50個樣本作為抗原和抗體，其中，20個為初始抗體庫A，30個為抗原集;剩余的樣本用于測試。最大重復步數為50。

　　步驟2 親和度計算、交叉與變異概率的確定：依據定義的親和度函數，抗體與抗原、抗體與抗體的親和度分別計算出來。由于抗體庫中的兩個抗體不可能完全匹配，因此親和度不可能為1。如果親和度為1，一個抗體必須被剔除，重新選擇抗體補充到抗體庫中。如果抗體與相似字符的抗原的平均親和度大于設定的閾值，該抗體就會被刪除，新樣本就會被隨機選擇作為新的抗體以提高相似字符識別的正確率。

　　交叉與變異概率和抗體、抗原的親和度有關。親和度越高，概率則越低。大概率將加速親和度成熟，而低概率則有助于防止良好抗體中單一重要基因的丟失。因此，采用動態策略決定交叉與變異概率以提高運算效率和準確性。

　　步驟3 克隆算子：20個抗體子代通過克隆、交叉、變異獲得。

　　抗體克隆的規模與抗體與抗原、抗體與抗體的親和度有關，其隨著抗體間相似度的降低、抗體與抗原相似度的增加而增大，動態策略被用于設定克隆規模。20個克隆子代通過克隆得到。

　　交叉操作在一個克隆子代的所有抗體中執行。不同子代的抗體采用不同的交叉概率。交叉概率越高，執行的交叉操作越多;反之，相應的操作越少。另外，相對目標抗體而言，具有更高的親和度的抗體通常被用來與目標抗體執行交叉操作，每個交叉操作如下：

　　Two antibodies are selected from the different clone descendants and c1 is the object antibody.

　　從子代中任選兩個抗體，c1為目標抗體，

　　c1={x1， x2…xj-1， xj， xj+1…..x64}

　　c2={y1， y2…yj-1， yj， yj+1…..y64}

　　隨機選擇一個位置 j進行交叉操作，ci 轉換為di。

　　d1={x1，x2…，xj，yj+1…..y64}，

　　20個交叉子代通過交叉操作獲得。

　　交叉操作之后，多點變異操作以相同的變異概率在同一個交叉子代中進行變異操作，不同的交叉子代具有不同的變異概率，變異操作為某一抗體的隨機特征系數隨機比特單點按位邏輯變異。變異概率越高，執行變異的特征系數越多;反之，越少。在變異操作之后，獲得了20個變異子代。

　　步驟4 重新計算20個變異子代的抗體與抗原的親和度。

　　步驟5 克隆選擇：在克隆選擇中，從變異子代中選擇最好的個體去替代初始抗體，從而形成新的抗體群。如果變異子代的抗體與抗原的親和度大于來自于抗體庫A的ai抗體的親和度，ai就會被新抗體替代，形成下一代抗體庫A(k+1)。

　　步驟6 重復上述步驟，直到50次算法結束;否則將返回到第二步。

　　5 實驗結果

　　由50個學生完成的33個字符類別的1650個字符樣本用于字符識別。針對每個字符類別，隨機選擇20個樣本作為抗體庫，30個作為抗原，20個用于測試。本文還利用BP神經網絡做了對比實驗。表1列示了AIS和BP網絡的平均識別正確率。根據實驗結果，AIS的字符識別平均正確率要優于BP網絡。另外，人工免疫系統較BP網絡具有更高的靈活性。如果現行的網絡無法識別新樣本，對于AIS只需要對新樣本的抗體進行訓練后添加到現行的抗體庫中即可;然而，對于BP網絡，所有的新舊樣本必須進行重新訓練以獲得新的網絡拓撲結構和權重系數。

　　6 結論

　　本文提出了一種新的手寫希臘字符識別系統，免疫算法被用于構建字符分類器。實驗結果表明該算法可實現希臘字符準確分類。

　　作為一種新型的識別方式，需要更深入的研究以提高在實踐中應用能力，包括增加訓練樣本量、圖像描述標準化及系數優化。隨著上述因素的不斷改進，該識別系統將會逐步優化。

　　參考文獻

　　[1]J.D.Farmer，N.Packard and A.Perelson， (1986)"The immune system，adaptation and machine learning"，Physica D， vol.2，pp.187-204.

　　[2]D.Dasgupta (Editor)，Artificial Immune Systems and Their Applications， Springer-Verlag，Inc. Berlin，January 1999，ISBN 3-540-64390-7.

　　[3]V.Cutello and G.Nicosia(2002) "An Immunological Approach to Combinatorial Optimization Problems" Lecture Notes in Computer Science， Springer vol.2527，pp.361-370.

　　[4]L.N.de Castro and F.J.Von Zuben，(1999)"Artificial Immune Systems：Part I -Basic Theory and Applications"，School of Computing and Electrical Engineering，State University of Campinas，Brazil，No. DCA-RT 01/99.

　　[5]A lessand ro V in ciarell.i A Survey on Off-line Cursive Word，Recognition[J].Pattern Recognition，2002(35)：1433-1446.

　　[6]Trie O D，J ain A K，Taxt T.Feature Extraction Methods for Character Recognition-A Survey[J].Pattern Recognition，1996，29(4)：6412662.

　　[7]Gonzalez RC，Woods RE，"Digital image processing"，312-315，1992.

　　[8]Hecht-Nielson，R，"Theory of the back propagation Neural Network"，In Proceedings of the International Joint Conference on Neural Networks， 593-611，1989.

【人工免疫系統在手寫希臘字符識別中的應用】相關文章：

手寫簽名技術在銀行無紙化業務中的應用研究09-03

線條在面塑中的應用07-14

人工智能算法在自動化控制中的應用05-30

NUFFT在ISAR成像中的應用05-23

竹子在設計中的應用價值07-10

淺析力學在機械中的應用05-19