糯米文學吧

位置:首頁 > 範文 > 工作方案

運維應急預案3篇

在日常學習、工作和生活中,有時會出現一些意料之外的事件或事故,為了減小事故造成的危害,通常需要預先編制一份完整的應急預案。那麼問題來了,應急預案應該怎麼寫?以下是小編為大家整理的運維應急預案,歡迎大家借鑑與參考,希望對大家有所幫助。

運維應急預案3篇

運維應急預案1

隨着網絡信息化建設的不斷深入,加強機房各類設備、系統以及信息與網絡安全等方面應對突發事件的處理能力將是我們目前面臨的一項重要任務。為確保系統安全與穩定,以保證正常運行為宗旨,按照“預防為主,積極處置”的原則,本着建立一個有效處置突發事件,反應迅速、處置有力的安全體系的目標,將正在發生或已發生事故的損害程度減輕到最低,特制定本應急處置預案。

一、系統故障流程説明

1.故障發生獲取途徑

1.1監控系統告警發現故障

1.2用户發現故障

1.3維護中心發現故障

2.故障受理

系統故障發生後,運維人員立即響應,並向相關人員瞭解系統故障情況。

3.信息研判處理

運維人員根據瞭解到的系統故障情況進行分析判斷,以確定採用哪種處理方式。

4.故障解除

故障解除時間由運維人員及現場技術人員根據現場的'實際進展情況,在與用户協調後確認故障解決。

5.結果處理

故障解決後,書寫詳細的故障報告提交給相關人員。

二、日常維護

1.正常工作日內,對設備及系統的運行情況做監控,發生異常情況及時處理。

2.節假日期間,保持通信暢通,遇有問題,儘快及時解決。

3.認真做好數據備份工作,定期做好數據庫的備份,每週檢查服務器的運行和備份情況。

4.故障處理

1.故障流程

編寫故障文檔

解決故障

綜合判斷,快速查找原因

查看系統、應用日誌、其它異常等

服務器提示的硬件錯誤信息

軟件故障

硬件故障

判定

故障發生

2.故障預案

2.1發生通信線路中斷、路由故障、流量異常等,經初步判斷後及時聯繫IDC機房或者其它相關人員,配合他們及時解決網絡故障。

2.2發生服務器軟件系統故障,如有備份服務器,立即切換到備機上;如果沒有備機,以快速解決為首要目標,故障出現的原因後續去排查;總之優先保證服務器能正常運行。

2.3發生大流量網絡攻擊時,立即聯繫IDC機房及時處理。

2.4發生服務器硬件故障後,聯繫硬件設備廠商,要求其快速上門處理。

2.5發生業務數據損壞時,檢查和備份當前業務系統數據,再調用備份數據來恢復。

運維應急預案2

一、日常應對緊急故障的準備

為應對緊急故障發生日常應做到以下幾點:

1、建立應急小隊

故障急小隊應由維保人員(吳育羣、王鑫、王程)組成,每次緊急事故的處理人員應根據事故的大小和現場確定,每次事故派遣人員應不少於兩人。

2、備用易壞部位的備品備件

為確保發生緊急故障時能及時更換損壞部件,應購買相對應的備品備件以作應對,如法蘭、彎頭、墊片、噴頭、模塊、探頭、手報、繼電器、小型抽水泵等。

3、保持通話暢通

維保人員應保持24小時電話暢通,隨時接聽緊急電話,確保及時趕到現場。

4、對用户單位進行消防操作培訓,強化消防意識

平時對用户單位安保人員進行消防操作培訓,如關閉蓄水閥門,控制閥,開啟關閉配電箱、控制箱等有助於對突發事件的處理和控制,減少財產損失。

二、發生緊急故障時應對方法

在緊急故障發生時維保人員應在2小時之內趕到故障發生地點,進行維保搶修。

1、接到維保單位緊急故障電話,首先應詢問具體故障情況,包括故障發生時間、故障部位、故障現象、故障持續時間、故障危害程度。

如故障比較嚴重,應讓用户單位保衞人員立即將故障發生現場戒嚴起來,阻止外來人員進入故障現場,以免發生不必要的人員傷害。

2、瞭解緊急故障的情況後,應趕緊制定故障解決方案。

為減少故障時間、避免財產損失,故障解決方案應在維保人員到達前制定完成。故障解決方案至少應在兩套,一套主用,一套備用。制定的故障解決方案,應是安全的、可行的、符合故障現場要求及國家規範的、能夠達到解決故障效果並且不帶來任何損失的'方案。緊急故障的解決方案制定應由維保負責人員及維保人員共同參與討論,維保負責人員制定,並得到部門領導審批同意。緊急故障解決方案應包括以下內容:

(1)故障分析

(2)解決方法

(3)執行步驟

(4)執行人員的職責及分配

(5)需要協助的事項

如需用户單位人員協助,應在到達故障現場之前聯繫好,並將需要協助的事項交代與用户單位協助人員,提前準備好。

3、解決緊急故障應按提前制定的方案逐步執行,不得隨意更改。

在執行方案過程中維保人員應注意用電安全、用水安全、機械使用安全。不得隨意亂接亂搭電線,不得隨意拆卸閥門。在用電前應測試電流電壓;在拆卸閥門管件之前應確定拆卸的位置是否準確,管道內是否待壓待水及老化程度等;在使用機械時應安操作規範使用。

4、故障解決完畢之後,應做詳細的記錄留底,便於以後的維保及故障原因的查明。

故障解決記錄應做成表格形式,一試兩份,用户單位一份,維保單位一份,並讓用户確認簽字,證明故障解決。為了故障再次發生,還應制作故障彙總記錄,故障彙總記錄應包括故障發生的時間、地點、原因及故障解決的經過、結果。為下次解決緊急故障節約時間,積累經驗。

運維應急預案3

1.編制目的

建立健全項目事故應急機制,提高XXXXXXXX應對項目實施過程中突發事故的能力,保持實施體系穩定,保障客户方權益和客户滿意度,促進業務健康、可持續發展

1.1.編制依據

依據XXXXXXXXPMO發佈《項目質量事故預防與處理制度》,制定本預案。

1.2.事故分級

按照突發事故嚴重性和緊急程度,突發質量事故分為特別重大質量事故、嚴重質量事故、一般質量事故和輕微質量事故四級。

a)重大:由於項目組的不規範操作、不規範管理,對系統生產環境造成嚴重的數據丟失、系統崩潰、當機,以及造成重大經濟損失,嚴重影響客户滿意的質量事故,定義為重大質量事故。

b)嚴重:由於項目組不規範的情況下對系統生產環境所做操作,而造成對系統生產環境的.嚴重影響(如造成數據丟失、數據混亂)、造成一定程度經濟損失,但能通過應急措施補救、挽回部分損失的事故,定義為嚴重質量事故。

c)一般:由於項目組在未得到客户方授權的情況下對系統生產環境所做操作,而造成對系統生產環境數據損壞或混亂,但未造成較大程度經濟損失,通過應急措施可以有效保證數據完備的事故,定義為一般質量事故。

d)輕微:未對系統生產環境造成數據影響,但不符合規範化操作和管理要求,對系統整理質量存在較大風險,且造成項目資產的不完整,造成輕微經濟損失的。如未對代碼做及時定期的備份,導致代碼版本的不完整或代碼版本管理混亂的,定義為輕微質量事故。

1.3.適用範圍

本預案適用於XXXXXXXX負責實施、管理的全部項目。2.組織指揮與職責

2.1.應急責任人

項目經理為項目應急責任人。

2.2.應急協調人

項目經理必須在發生質量事故後2小時內,向所在部門經理客觀反饋問題,由項目經理初步判定項目事故等級。

級別在一般(包含)以下的事故,由項目經理作為應急處理協調人,負責總體監督、協調。

級別在嚴重(包含)以上的事故,由部門經理作為應急處理協調人,負責總體監督、協調。

2.3.專家組

實施支持中心作為實施專家團隊,負責應急處理支持,由應急責任人在接到事故時,進行協調通報。

級別在嚴重(包含)以上的事故,實施專家團隊必須指定專人蔘與事故應急處理,負責支持進行項目影響評估、損失彌補方案等工作。

2.4.涉及外包項目

整體或部分外包項目發生事故時,外包商必須指派項目經理的直屬上級作為應急處理外包方協調人,外包方項目經理作為外包方負責人,由外包方負責人直接參與項目事故應急處理,協調人負責資源協調;涉及外包人員事故,該人員必須直接參與應急處理。事故應急處理完畢後再根據公司制度對上述公司或個人執行懲罰。

2.5.涉及第三方供應商

涉及第三方供應商的項目事故,第三方商必須指派專人負責,直接參與項目事故應急處理,事故應急處理完畢後再根據公司制度執行懲罰。

3.事故處理程序

3.1.事故響應事故發生後,應成立事故應急處理小組,由責任人、協調人、專家組組成,第一時間響應事故處理。

3.2.事故通報

根據《項目質量事故預防與處理制度》和事故級別,及時進行內部通報,內部通報後即時向客户方相應人員進行通報。

3.3.事故分析

事故發生2個工作日內,應急責任人必須到達客户現場,並由專家組或其他技術人員開始事故分析,找尋事故發生原因,進行事故損失評估,制定修復方案。

3.4.修復

根據事故原因,修復系統問題,杜絕後續問題復現。根據修復方案,進行事故修復,降低事故損失。

3.5.善後

出具系統事故報告,並由客户方簽字,至客户方簽字標誌事故處理結束。

標籤:運維 應急 預案