- 相關推薦
HACMP認證知識:應用程序監視
除了資源組管理以外,HACMP 還可以通過以下兩種方法之一監視應用程序:
應用程序進程監視:使用 RSCT 事件管理功能檢測進程是否終止。
應用程序自定義監視:基于您定義的監視方法(程序或腳本)來監視應用程序的運行狀況。
注意:不能將應用程序進程監視用于監視通過 Shell 腳本啟動的應用程序,或那些監視進程無法確定應用程序運行狀況的應用程序。
對于監視 Shell 腳本應用程序,必須使用自定義監視方法(例如,Apache Web 服務器)。
當應用程序監視處于活動狀態時,HACMP 的行為如下:
對于應用程序進程監視,一個內核 hook 將通知 HACMP 集群管理器所監視的進程已終止,HACMP 將啟動應用程序恢復過程。
要使恢復操作能夠進行,必須提供某種方法來清理和重新啟動應用程序(可以使用為應用程序服務器定義提供的應用程序啟動/停止腳本)。
HACMP 嘗試重新啟動應用程序,并等待應用程序穩定指定的時間,然后發送通知消息和/或實際將整個 RG 移動到另一個節點(節點優先級列表中的下一個節點)。
對于自定義應用程序監視(自定義方法),除了應用程序清理和重新啟動方法以外,還必須提供用于執行定期應用程序測試的程序/腳本。
要規劃進程監視器的配置,請檢查以下事項:
驗證該應用程序是否可以使用某個進程監視器進行監視。
檢查要監視的進程的名稱。必須使用準確的進程名稱來配置應用程序監視器。
指定擁有進程的用戶名,例如 root。請注意,該進程擁有者必須擁有要監視的所有進程。
指定要監視的應用程序的實例數量(進程數量)。缺省為一個實例。
指定在開始監視前的等待時間(以秒為單位)。
注意:在大多數情況下,此值不應該為零。例如,對于數據庫應用程序,您可能希望將監視延遲到啟動腳本和初始數據庫搜索已完成之后。
重新啟動數值,表示在采取任何其他操作之前嘗試重新啟動應用程序的次數。
在重置重新啟動數值前應用程序必須保持穩定的間隔(以秒為單位)。
要在應用程序無法在重新啟動數值內重新啟動時采取的操作。缺省選擇是通知,即運行一個事件來向集群通知故障情況。還可以指定故障轉移,在此情況下,包含故障應用程序的資源組將移動到對該資源組擁有下一個最高優先級的集群節點。
重新啟動方法(如果希望的話)。(如果“Restart Count”不為零,則這是必需的。)
如果計劃建立自定義監視方法,則還要檢查:
是否已指定了要用于檢查指定應用程序的程序/腳本。
關于運行該監視方法的頻度的輪詢間隔(以秒為單位)。如果監視器在此間隔內沒有響應,則認為應用程序出錯,并啟動恢復過程。
在用戶定義的監視方法未在輪詢間隔內返回時用于終止該監視器方法的信號。缺省信號為 SIGKILL。
開始監視前的等待時間(以秒為單位)。例如,對于數據庫應用程序,建議將監視延遲到啟動腳本和初始數據庫搜索已完成之后(否則,可能會認為應用程序出錯并啟動恢復過程)。
重新啟動數值,即在采取任何其他操作之前嘗試重新啟動應用程序的次數。
在重置重新啟動數值前應用程序必須保持穩定的間隔(以秒為單位)。
在應用程序無法在重新啟動數值內重新啟動時采取的操作。
【HACMP認證知識:應用程序監視】相關文章:
IBM認證知識:HACMP心跳檢測06-01
HACMP的歷史和發展08-19
SUN認證基本知識08-23
Adobe認證Photoshop冷知識10-12
ibm認證考試知識點08-05
IBM認證--基本知識介紹08-02
IBM XML認證知識點:Dtd09-01
Linux認證考試必考知識點09-02
XML認證考試知識點:Parser08-21