簡介
故障是系統(tǒng)不能執(zhí)行規(guī)定功能的狀態(tài)。通常而言,故障是指系統(tǒng)中部分元器件功能失效而導(dǎo)致整個系統(tǒng)功能惡化的事件。持久故障是指在完成修復(fù)性維護(hù)活動之前,產(chǎn)品(裝備)一直持續(xù)存在的一種故障。與之相對應(yīng)的臨時性故障是指產(chǎn)品(裝備)在很短時間內(nèi)發(fā)生的喪失某些局部功能的故障。這種故障發(fā)生后不需要修復(fù)或更換零部件,只需對故障部位進(jìn)行調(diào)整即可恢復(fù)器喪失的功能。
故障的分類及特征分類1.按故障的持續(xù)時間分類
按故障的持續(xù)時問可將故障分為永久故障、瞬時故障和間歇故障。永久故障由元器件的不可逆變化所引發(fā),其永久地改變元器件的原有邏輯。直到采取措施消除故障為止;瞬時故障的持續(xù)時間不超過一個指定的值。并只引起元器件當(dāng)前參數(shù)值的變化,而不會導(dǎo)致不可逆的變化;間歇故障是可重復(fù)出現(xiàn)的故障,主要由元件參數(shù)的變化、不正確的設(shè)計和工藝方面的原因所引發(fā)。
2.按故障的發(fā)生和發(fā)展進(jìn)程分類
按故障的發(fā)生和發(fā)展過程可將故障分為突發(fā)性故障和漸發(fā)性故障。突發(fā)性故障出現(xiàn)前無明顯的征兆,很難通過早期試驗(yàn)或測試來預(yù)測;漸發(fā)性故障是由于元器件老化等其他原因,導(dǎo)致設(shè)備性能逐漸下降并最終超出正確值而引發(fā)的故障。因此具有一定的規(guī)律性,可進(jìn)行狀態(tài)監(jiān)測和故障預(yù)防。
3.按故障發(fā)生的原因分類
按故障發(fā)生的原因?qū)⒐收戏譃橥庖蚬收虾蛢?nèi)因故障。外因故障是因人為操作不當(dāng)或環(huán)境條件惡化等外部因素造成的故障;內(nèi)因故障是因沒計或生產(chǎn)方面存在的缺陷和隱患而導(dǎo)致的故障。
4.按故障的部件分類
按故障的部件可將故障分為硬件故障和軟件故障。硬件故障是指故障因硬件系統(tǒng)失效。
5.按故障的嚴(yán)重程度分類
按故障的嚴(yán)重程度可將故障分為破壞性故障和非破壞性故障。破壞性故障既是突發(fā)性的又是永久性的.故障發(fā)生后往往危及設(shè)備和人身的安全:而非破壞性的故障一般是漸發(fā)性的又是局部的,故障發(fā)生后暫時不會危及設(shè)備和人身的安全。
6.按故障的相關(guān)性分類
按故障相關(guān)性可將故障分為相關(guān)故障和非相關(guān)故障。相關(guān)故障也稱間接故障,因設(shè)備其他元器件而引發(fā)。比較難診斷;非相關(guān)故障也稱直接故障,由元器件本身直接因素所引起。相對相關(guān)故障而言比較容易診斷。
除此之外。還可以按照故障的因果關(guān)系分成物理性故障和邏輯性故障,按故障的表征分為靜態(tài)故障和動態(tài)故障。按故障變量的值分為確定值故障和非確定值故障等。2
特征設(shè)備的故障一般具有如下五個基本特征:
(1)層次性。復(fù)雜的設(shè)備,可劃分為系統(tǒng)、子系統(tǒng)、部件、元件,表現(xiàn)一定的層次性,與之相關(guān)聯(lián),設(shè)備的故障也具有層次性的特征,即設(shè)備的故障可能出現(xiàn)在系統(tǒng)、子系統(tǒng)、部件、元件等不同的層次上。
(2)傳播性。元件的故障會導(dǎo)致部件的故障,部件的故障會引起系統(tǒng)的故障,故障會沿著部件一子系統(tǒng)一系統(tǒng)的路徑傳播。
(3)放射性。某一部件的故障可能會引起與之相關(guān)聯(lián)的部件發(fā)生故障。
(4)延時性。設(shè)備故障的發(fā)生、發(fā)展和傳播有一定的時間過程,設(shè)備故障的這種延時性特征為故障的前期預(yù)測預(yù)報提供了條件。
(5)不確定性。設(shè)備故障的發(fā)生具有隨機(jī)性、模糊性、不可確知性。3
SAP DB的持久性故障定義持久性故障的標(biāo)準(zhǔn)為了盡可能地降低由于資源中的瞬態(tài)故障引起的中斷所帶來的影響,故障監(jiān)視器將重新啟動資源以響應(yīng)這類故障。 對于持久性故障,需要比重新啟動資源更具破壞性的操作:
對于 SAP DB 資源,故障監(jiān)視器將資源故障切換到其它節(jié)點(diǎn)。 SAP DB 資源是故障切換資源。
對于 SAP xserver 資源,故障監(jiān)視器將使該資源脫機(jī)。 SAP xserver 是可伸縮資源。
如果在指定的重試間隔內(nèi)嘗試重新啟動資源的次數(shù)超過了指定的閾值,則故障監(jiān)視器將認(rèn)為故障是持久性的。 為持久性故障定義標(biāo)準(zhǔn)使您能夠根據(jù)群集的性能特點(diǎn)和可用性要求來設(shè)置閾值和重試間隔。
閾值和重試間隔與其它特性的相關(guān)性重新啟動一次出現(xiàn)故障的資源所需的最長時間是以下特性的值的總和:
Thorough_probe_interval 系統(tǒng)特性
Probe_timeout 擴(kuò)展特性
為了確保在重試間隔內(nèi)達(dá)到閾值之前您具有足夠的時間,請使用以下表達(dá)式來計算重試間隔和閾值:
retry-interval ≥ threshold × (thorough-probe-interval + probe-timeout)
用來設(shè)置閾值和重試間隔的系統(tǒng)特性要設(shè)置閾值和重試間隔,請設(shè)置以下系統(tǒng)特性:
要設(shè)置閾值,請將 Retry_count 系統(tǒng)特性設(shè)置為允許的最大重啟次數(shù)。
要設(shè)置重試間隔,請將 Retry_interval 系統(tǒng)特性設(shè)置為所需的間隔(以秒為單位)。
為每個包含需要調(diào)節(jié)的 Sun Cluster HA for SAP DB 故障監(jiān)視器的資源設(shè)置這些特性。表中顯示了這些資源的資源類型。
|| ||
重試間隔的其它影響除了定義持久性故障標(biāo)準(zhǔn)以外,重試間隔還影響故障監(jiān)視器對以下故障做出的響應(yīng):
SAP DB 故障監(jiān)視器檢測到 SAP xserver 不可用。 如果 SAP DB 故障監(jiān)視器在重試間隔內(nèi)兩次檢測到 SAP xserver 不可用,則 SAP DB 故障監(jiān)視器將重新啟動 SAP xserver。
持久性系統(tǒng)錯誤。持久性系統(tǒng)錯誤是指在重試間隔內(nèi)發(fā)生四次的系統(tǒng)錯誤。 如果發(fā)生持久性系統(tǒng)錯誤,故障監(jiān)視器將重新啟動 SAP xserver。4