冗余技術(shù)就是增加多余的設備,以保證系統更加可靠、安全地工作。冗余的分類(lèi)方法多種多樣,按照在系統中所處的位置,冗余可分為元件級、部件級和系統級;按照冗余的程度可分為1:1冗余、 1:2冗余、1:n冗余等多種。在當前元器件可靠性不斷提高的情況下,和其它形式的冗余方式相比,1:1的部件級熱冗余是一種有效而又相對簡(jiǎn)單、配置靈活的冗余技術(shù)實(shí)現方式,如I/O卡件冗余、電源冗余、主控制器冗余等。因此,目前國內外主流的過(guò)程控制系統中大多采用了這種方式。當然,在某些局部設計中也有采用元件級或多種冗余方式組合的成功范例。二個(gè)部件組成的并聯(lián)系統(互為冗余)與單部件相比,平均無(wú)故障時(shí)間是原來(lái)的1.5倍。
但它并不是兩個(gè)部件簡(jiǎn)單的并聯(lián)運行,而是需要硬件、軟件、通訊等協(xié)同工作來(lái)實(shí)現。將互為冗余的兩個(gè)部件構成一個(gè)有機的整體,通常包括以下多個(gè)技術(shù)要點(diǎn):
1)信息同步技術(shù)
它是工作、備用部件之間實(shí)現無(wú)擾動(dòng)(Bumpless)切換技術(shù)的前提,只有按控制實(shí)時(shí)性要求進(jìn)行高速有效的信息同步,保證工作、備用部件步調一致地工作,才能實(shí)現冗余部件之間的無(wú)擾動(dòng)切換。
在熱備用工作方式下,其中一塊處于工作狀態(tài)(工作卡),實(shí)現系統的數據采集、運算、控制輸出、網(wǎng)絡(luò )通訊等功能;而另一塊處于備用狀態(tài)(備用卡),它實(shí)時(shí)跟蹤工作卡的內部控制狀態(tài)(即狀態(tài)同步)。工作/備用卡件之間的正/負邏輯是互斥的,即一個(gè)為工作卡,另一個(gè)必定是備用卡;而且它們之間有冗余控制電路(又稱(chēng)工作/備用控制電路)和信息通訊電路,以協(xié)調兩塊卡件同時(shí)而且有序地運行,保證對外輸入輸出特性的同一性,即對于用戶(hù)使用而言,可以認為只有一個(gè)部件。一般在設計中,工作、備用部件之間通過(guò)高速的冗余通訊通道(串行或并行)實(shí)現運行狀態(tài)互檢和控制狀態(tài)的同步(如組態(tài)信息、輸出閥位、控制參數等)。
2)故障檢測技術(shù)
為了保證系統在出現故障時(shí)及時(shí)將冗余部分投入工作,必須有高精確的在線(xiàn)故障檢測技術(shù),實(shí)現故障發(fā)現、故障定位、故障隔離和故障報警。故障檢測包括電源、微處理器、數據通訊鏈路、數據總線(xiàn)及I/O狀態(tài)等。其中故障診斷包括故障自診斷和故障互檢(工作、備用卡件之間的相互檢查)
3) 故障仲裁技術(shù)和切換技術(shù)
精確及時(shí)地發(fā)現故障后,還需要及時(shí)確定故障的部位、分析故障的嚴重性,依賴(lài)前文提到的冗余控制電路,對工作、備用故障狀態(tài)進(jìn)行分析、比較和仲裁,以判定是否需要進(jìn)行工作/備用之間的狀態(tài)切換??刂茩嗲袚Q到冗余備用部件還必須保證快速、安全、無(wú)擾動(dòng)。當處于工作狀態(tài)的部件出現故障(斷電、復位、軟件故障、硬件故障等)或者工作部件的故障較備用部件嚴重時(shí),備用部件必須快速地無(wú)擾動(dòng)地接替工作部件的所有控制任務(wù),對現場(chǎng)控制不造成任何影響。同時(shí)要求切換時(shí)間應為毫秒級,甚至是微秒級,這樣就不會(huì )因為該部件的故障而造成外部控制對象的失控或檢測信息失效等等。另外,還需要盡快通過(guò)網(wǎng)絡(luò )通訊或就地LED顯示進(jìn)行報警,通知用戶(hù)出現故障的部件和故障情況,以便進(jìn)行及時(shí)維護。
4)熱插拔技術(shù)
為了保證容錯系統具有高可靠性,必須盡量減少系統的平均修復時(shí)間MTBR。要做到這一點(diǎn),在設計上應努力提高單元的獨立性、可修復性、故障可維護性。實(shí)現故障部件的在線(xiàn)維護和更換也是冗余技術(shù)的重要組成部分,它是實(shí)現控制系統故障部件快速修復技術(shù)的關(guān)鍵。部件的熱插拔功能可以在不中斷系統正??刂乒δ艿那闆r下增加或更換組件,使系統平穩地運行。
5)故障隔離技術(shù)
冗余設計時(shí),必須考慮工作、備用部件之間的故障應該做到盡可能互不影響或影響的概率相當小(0.01%),即可認為故障是隔離的。這樣可以保證:處于備用狀態(tài)的部件發(fā)生故障時(shí),不會(huì )影響冗余工作部件或其他關(guān)聯(lián)部件的正常運行,保證冗余的有效性。
1)主控制卡/器即CPU的冗余
2) 電源系統冗余
3) 網(wǎng)絡(luò )系統冗余
采用冗余網(wǎng)卡和冗余網(wǎng)絡(luò )接口。正常工作時(shí),冗余的兩條數據高速通路同時(shí)并行運行,自動(dòng)分攤網(wǎng)絡(luò )流量,并考慮了負載均衡的冗余設計,使系統網(wǎng)絡(luò )通信帶寬提高。當其中一路故障(網(wǎng)卡損壞或出現線(xiàn)路故障)時(shí),另一路自動(dòng)地承擔全部通信負載,保證通信的正常進(jìn)行。
4)冷卻系統冗余
利用控制柜內可自動(dòng)切換的冗余風(fēng)扇,對風(fēng)扇和機柜內溫度進(jìn)行實(shí)時(shí)監測,發(fā)現工作風(fēng)扇故障或柜內溫度過(guò)高時(shí)都會(huì )自動(dòng)報警,并自動(dòng)啟動(dòng)備用風(fēng)扇。