- 相關推薦
淺論當前軟件抗衰技術中存在的幾點問題
[摘要]計算系統(tǒng)軟件抗衰技術是隨著計算機技術的發(fā)展衍生出的一個新的研究方向,屬于計算機應用研究領域。它涉及系統(tǒng)性能檢測、故障診斷、軟件工程及可靠性分析等方面,主要針對當前計算機運行過程中普遍出現(xiàn)的性能衰退現(xiàn)象,研究其原因、檢測和評價方法、軟件抗衰策略及實現(xiàn)技術。本論文主要探討了當前軟件抗衰技術中存在的幾點問題。
[關鍵詞]軟件抗衰 軟件工程 計算機軟件
一、引言
軟件的體系結構為軟件系統(tǒng)的構造、行為和關鍵性質提供了一個高層的抽象,這種抽象包括對構成系統(tǒng)的元素的描述,對元素間交互的描述,對元素間組成模式的描述,以及對模式上的約束的描述。實現(xiàn)抗衰或自愈的軟件系統(tǒng)展示了能在運行時自適應以應對資源變動,系統(tǒng)故障等情況的能力,這種能力恰好是建立在這種對于軟件系統(tǒng)的高層抽象上的。
二、系統(tǒng)性能的監(jiān)控和采集
系統(tǒng)性能的監(jiān)控和性能數(shù)據(jù)的采集是實現(xiàn)系統(tǒng)抗衰的數(shù)據(jù)來源,是一個必不可少的環(huán)節(jié),因此需要設計一個能適應于分布式計算環(huán)境,并且盡可能少的干擾所監(jiān)控計算節(jié)點,可擴縮的性能監(jiān)控工具。
目前軟件系統(tǒng)正變的越來越復雜,龐大,能夠反映出系統(tǒng)性能的參數(shù)有成千上百,為了能夠實時的獲悉軟件系統(tǒng)所處的狀態(tài),需要高頻率的采集性能參數(shù)數(shù)據(jù),這對監(jiān)控工具的性能數(shù)據(jù)采集、編碼、傳輸、存儲提出了更高的要求。此外,隨著軟件抗衰粒度的細化,僅有系統(tǒng)級的監(jiān)控已經(jīng)不能滿足要求,因此需要監(jiān)控工具能夠實現(xiàn)進程級,甚至于線程級的性能監(jiān)控,從而為細粒度的抗衰策略的研究提供數(shù)據(jù)支持。
度量系統(tǒng)性能狀況的資源耗費參數(shù)有很多,各種資源耗費參數(shù)對于整體性能的影響是各不相同的,因此還需要對所確定的資源參數(shù)的權重進行分析。要確定可以衡量一個計算系統(tǒng)的性能的系統(tǒng)資源參數(shù)已不是很容易的問題,要分析其權重給出一個計算系統(tǒng)的合理的評價標準便更加困難,目前尚未檢索到有關這方面的研究報告,但是這方面的工作是非常必要的,它會影響到后期的策略制定。
三、系統(tǒng)性能衰退的檢測和量化
軟件系統(tǒng)運行時的狀態(tài)像人的狀態(tài)一樣可粗略的劃分為“健康”,“亞健康”和“不健康”等三大狀態(tài),狀態(tài)劃分的標準以及如何來量化是需要解決的問題。因為它是抗衰策略的制定和實施的重要依據(jù);同時“不健康”狀態(tài)有著一個比較龐大的范圍,也需要進一步細化,需要細粒度的刻畫衰退狀態(tài),劃分衰退的范圍,為細粒度的抗衰提供支持。目前這方面的研究主要是通過檢測軟件系統(tǒng)資源的占用和釋放情況、服務的響應時間和響應率來驗證軟件衰退出現(xiàn),但不能給出進一步更為細致的量化。
四、系統(tǒng)性能的預測
軟件系統(tǒng)的實時性能狀態(tài)能通過選擇性能參數(shù)來刻畫,通過性能衰退的檢測和量化確定,但光有系統(tǒng)狀態(tài)的歷史數(shù)據(jù)和實時數(shù)據(jù)對于軟件抗衰是不夠的,這是因為軟件系統(tǒng)未來的負載信息和性能狀態(tài)對于抗衰決策的制定同樣有著重要的影響,需要根據(jù)它們做出合理的抗衰決策,從而降低抗衰成本,同時提高可用性。目前這方面的研究工作主要集中是采用線性預測方式預測各種系統(tǒng)資源耗盡的時間估計,這種方式往往難于刻畫真正的衰退趨勢,誤差較大,因此有必要開展這方面的研究工作,提出符合精確性更高的預測方式。
五、軟件抗衰策略決策
軟件抗衰的目的是提高系統(tǒng)的可靠性,提供持續(xù)高質量的服務,同時降低服務的維護成本,因此軟件抗衰的時間決策和抗衰粒度決策是值得研究的重要內容。抗衰時間的選擇會極大地影響抗衰系統(tǒng),如果在系統(tǒng)負載高峰期實施,可能帶來較低的服務率,如果過早的實施,可能增加抗衰成本,過晚的實施,可能需要采用更高粒度的抗衰,也增加抗衰成本。由于在抗衰期間實施抗衰的部分不能正常提供服務,抗衰粒度的選擇又影響了抗衰成本和可用性。抗衰粒度過小,可能抗衰帶來的性能改善不明顯,需要頻的實施抗衰;粒度過大,抗衰實施期間造成的服務不可用時間較長。目前抗衰策略的決策研究工作基本上基于預先假設的狀態(tài)轉移概率和單位時間下各種粒度的抗衰成本,通過公式推導出能獲得最大的可用性、最低的抗衰成本的抗衰時間間隔。這種通過分析模型來基于很多假設得出的抗衰決策,在理論上講得通,而很難應用于實際系統(tǒng)抗衰的決策過程中。鑒于上述分析,有必要開展抗衰決策方面的研究工作,使得能夠做出適時適度的抗衰決策。
六、抗衰實施技術
直觀上解決衰退問題最有效的途徑是重啟整個系統(tǒng),恢復到初始狀態(tài),不能輕易選擇這種方式的理由是高的抗衰成本和低的系統(tǒng)可用性。因此,目前抗衰實施技術的研究主要集中在微重啟技術和遞歸重啟技術等方面,研究的目的就是以最小的抗衰粒度來到達抗衰目的、提高系統(tǒng)可用性,無論是微重啟,還是遞歸重啟技術,研究的難點都在于獲取模塊之間的關聯(lián)關系,而關聯(lián)關系的獲取可能來自靜態(tài)的系統(tǒng)體系結構視圖,也可能來自系統(tǒng)運行時的反射。對于有完整的設計文檔的系統(tǒng),問題變得很簡單,只需把文檔作為輸入就能解決問題,然而對于缺乏設計文檔的系統(tǒng),需要在運行時建立模塊之間的關聯(lián)關系,這也是研究的難點。
七、結語
計算系統(tǒng)自身總體結構的復雜化傾向己使人難以直接進行系統(tǒng)性能的衰退檢測和防護,因此需要研究一種新的技術—軟件抗衰技術。它能夠擺脫人的干預,自動地檢測和分析計算系統(tǒng)性能,并在性能出現(xiàn)衰退時及時采取必要的措施。該技術實施的關鍵是性能檢測與分析和抗衰策略的制定。應用了軟件抗衰技術的計算系統(tǒng)在運行時能自主地維持其高性能,為系統(tǒng)的高可信賴、高性能和高可靠性提供有力的保證。
【淺論當前軟件抗衰技術中存在的幾點問題】相關文章:
當前企業(yè)成本管理存在的問題及對策01-06
跟蹤審計中存在問題及對策05-27
畢業(yè)論文撰寫中存在的問題04-11
我國酒店管理中存在的問題論文05-04
探析當前農村財務管理存在問題及解決對策05-25
無機化學實驗中存在的問題及解決措施12-05
責任會計在應用中存在的問題及對策11-09