“養(yǎng)兵千日,用在一時(shí),但在最關(guān)鍵的時(shí)刻,你們卻掉鏈子了”,面對(duì)CEO的嚴(yán)厲批評(píng)?!癈IO最痛苦的事情是什么?”我用心思考著這個(gè)問(wèn)題。公司與員工在面臨IT危機(jī)時(shí)都經(jīng)受了一場(chǎng)最大的考驗(yàn)。隨之而來(lái)的是,IT危機(jī)管理成為這段時(shí)間使用最頻繁的一個(gè)詞。也是讓我作為CIO聽到最頭痛的一個(gè)詞。

  隨著技術(shù)的發(fā)展,企業(yè)運(yùn)營(yíng)越來(lái)越依賴于IT系統(tǒng)的穩(wěn)定運(yùn)行。對(duì)于CIO來(lái)說(shuō),保障IT系統(tǒng)正常運(yùn)行非常重要。IT危機(jī)有各種各樣,可分為兩大類:一是企業(yè)外部引起的危機(jī),可能是天災(zāi)也可能是人禍。比如臺(tái)灣地震和南亞海嘯影響網(wǎng)絡(luò)通信,暴雨臺(tái)風(fēng)或911事件等等; 二是企業(yè)內(nèi)部因素所引起的危機(jī),如系統(tǒng)崩潰、系統(tǒng)災(zāi)難,或最簡(jiǎn)單的掉電使數(shù)據(jù)備份失敗,還有頻繁的病毒和木馬的攻擊等。

   IT危機(jī)癥狀分析

  IT危機(jī)是指使企業(yè)在IT方面遭受嚴(yán)重?fù)p失或面臨嚴(yán)重?fù)p失威脅的突發(fā)事件。這種突發(fā)事件在很短時(shí)間內(nèi)波及很廣層面,對(duì)公司正常運(yùn)作產(chǎn)生嚴(yán)重影響。因此,我們是應(yīng)該在IT危機(jī)發(fā)生之后才想到IT危機(jī)管理,還是應(yīng)時(shí)刻提防IT危機(jī)的發(fā)生、并建立IT危機(jī)管理體系呢?要回答這個(gè)問(wèn)題,應(yīng)該先回答這樣一個(gè)問(wèn)題:如何理解IT危機(jī)

  IT危機(jī)在一般情況下都具有三個(gè)特點(diǎn):(1)突發(fā)性。IT危機(jī)往往都是不期而至,令人措手不及,例如木馬病毒的攻擊。(2)威脅性。IT危機(jī)的出現(xiàn)往往威脅到公司業(yè)務(wù)運(yùn)作,甚至危及企業(yè)的生存與發(fā)展,例如造成關(guān)鍵數(shù)據(jù)掉失和損壞。(3)緊迫性。當(dāng)IT危機(jī)出現(xiàn)時(shí),對(duì)危機(jī)做出的反應(yīng)和處理的時(shí)間十分緊迫,任何延遲都會(huì)帶來(lái)更大的損失,一點(diǎn)點(diǎn)的失誤都會(huì)釀成軒然大波。

  因此,面對(duì)IT危機(jī),切不可有僥幸的鴕鳥心理一樣,把頭埋在沙土里,那樣即使回避了一時(shí)的問(wèn)題,卻可能為更大的IT危害播下了種子。像鴕鳥一樣的逃避態(tài)度,隨便把頭埋在沙里,殊不知自己大大的屁股正露在外面。

   IT危機(jī)預(yù)警系統(tǒng)的建立

  風(fēng)云變化萬(wàn)千,只有未雨綢繆的人才能坦然應(yīng)對(duì)IT危機(jī)。IT危機(jī)總是突然的、出人意料地爆發(fā),這是CIO必須面對(duì)的一個(gè)重要考驗(yàn)。而IT危機(jī)管理的最好辦法就是準(zhǔn)確預(yù)見(jiàn),這是成本最低、最簡(jiǎn)便的方法。最基本的做法是建立起IT危機(jī)管理計(jì)劃, 即Crisis Management Plan(CMP),它包括明確定義IT危機(jī)管理人員的角色、職責(zé)和權(quán)限,識(shí)別IT危機(jī)類型和反應(yīng)對(duì)策程序,以及確認(rèn)所需的資源。另外,還需要事先制定各級(jí)計(jì)劃,比如IT緊急反應(yīng)計(jì)劃、業(yè)務(wù)持續(xù)計(jì)劃、IT災(zāi)難恢復(fù)計(jì)劃等。

  首先,必須建立IT危機(jī)預(yù)警系統(tǒng)。

  IT危機(jī)是不可避免的,所以必須為危機(jī)做好準(zhǔn)備。要想在危機(jī)來(lái)臨時(shí)做到不被動(dòng),光有危機(jī)意識(shí)是不夠的,必須未雨綢繆,建立IT危機(jī)預(yù)警系統(tǒng)。及時(shí)捕捉企業(yè)危機(jī)征兆,為各種危機(jī)提供切實(shí)可行的應(yīng)對(duì)措施。

  要預(yù)防IT危機(jī),首先要將所有可能的突發(fā)IT危機(jī)事件一一列舉出來(lái),考慮其可能發(fā)生的后果,并且估計(jì)預(yù)防所需的花費(fèi)。這樣做可能很費(fèi)事,但卻很必要。我們強(qiáng)調(diào)不能只是坐以待斃,應(yīng)該在危機(jī)發(fā)生之前,做好相關(guān)的準(zhǔn)備工作,才能從容不迫的應(yīng)變。因此,對(duì)企業(yè)來(lái)說(shuō),必須列出一張IT危機(jī)評(píng)估表,詳列出可能發(fā)生的危機(jī),并且評(píng)估它們的等級(jí),依發(fā)生的可能性從最可能到不太可能依序排列。例如針對(duì)IT災(zāi)難備份,CIO應(yīng)該根據(jù)業(yè)務(wù)實(shí)際需要制定好詳細(xì)的災(zāi)備計(jì)劃,備份時(shí)間間隔、備份類型,本地備份還是異地備份等。

  因此,當(dāng)各種突發(fā)IT危機(jī)發(fā)生時(shí),明確應(yīng)該采取什么樣的對(duì)策,通過(guò)什么樣的程序進(jìn)行有效處理,確定什么人員在什么時(shí)間做什么事,這是危機(jī)預(yù)警系統(tǒng)建立的關(guān)鍵。主要包括以下三個(gè)方面:

  (1)組建IT危機(jī)管理小組

  建立IT危機(jī)預(yù)警系統(tǒng)的一項(xiàng)重要工作是成立IT危機(jī)小組。只有做好組織上的準(zhǔn)備,有備而無(wú)患,才能更好的應(yīng)對(duì)IT危機(jī)的爆發(fā)。小組的主要作用在于全面清晰的對(duì)企業(yè)可能面對(duì)的各種危機(jī)進(jìn)行預(yù)測(cè),為處理危機(jī)制定有關(guān)的策略和步驟。對(duì)管理組員進(jìn)行IT危機(jī)培訓(xùn),在遇到危機(jī)時(shí),能夠全面、快速的處理危機(jī)。

  (2)確定IT危機(jī)級(jí)別

  不同的IT危機(jī)狀態(tài),有不同的處理方法。沒(méi)有事先確定IT危機(jī)級(jí)別列表,會(huì)給危機(jī)處理帶來(lái)很大的混亂和不便。企業(yè)必須先定危機(jī)級(jí)別,并制定相應(yīng)的危機(jī)處理方法,只有這樣,才能在危機(jī)來(lái)臨時(shí),做到“兵來(lái)將擋,水來(lái)土淹”。例如在可能遇到的各類危機(jī)可分為三級(jí):一般事件,緊急事件和重大事件,并形成IT危機(jī)級(jí)別詳細(xì)列表說(shuō)明。

  (3)確立IT危機(jī)處理程序和實(shí)施細(xì)則

  只有制定IT危機(jī)管理制度、流程、策略和IT災(zāi)難恢復(fù)計(jì)劃,才能確保在危機(jī)洶涌而來(lái)時(shí)能夠理智冷靜,胸有成竹。這些流程在業(yè)務(wù)正常時(shí)不起作用,但是IT危機(jī)發(fā)生時(shí)會(huì)及時(shí)啟動(dòng)并有效運(yùn)轉(zhuǎn),對(duì)危機(jī)的處理發(fā)揮重要作用。這樣一旦危機(jī)出現(xiàn),各部門、員工知道做什么,而不必依靠某一個(gè)關(guān)鍵人物的急中生智力挽狂瀾。在IT危機(jī)發(fā)生時(shí),要處理的工作何其繁雜,而這一切都需要在極短時(shí)間內(nèi)完成。如果事前沒(méi)有周全的計(jì)劃、能夠立即付諸實(shí)施的制度和流程、能夠立即投入角色并展開工作的人員,則可以預(yù)見(jiàn)在IT危機(jī)發(fā)生時(shí)反應(yīng)遲緩、內(nèi)外混亂將無(wú)法避免。

   其次,應(yīng)該進(jìn)行IT危機(jī)模擬預(yù)演。

  應(yīng)根據(jù)IT危機(jī)應(yīng)變計(jì)劃進(jìn)行定期的摸擬預(yù)演。IT危機(jī)演習(xí)是為了評(píng)估危機(jī)預(yù)警系統(tǒng)能否有效地實(shí)施。定期的模擬訓(xùn)練不僅可以提高IT危機(jī)小組的快速反應(yīng)能力,強(qiáng)化危機(jī)管理意識(shí),還可以檢測(cè)已擬定的危機(jī)應(yīng)變計(jì)劃是否充實(shí)、可行,找出IT危機(jī)預(yù)警準(zhǔn)備中的不足,可以及時(shí)改善。

  制定好IT危機(jī)計(jì)劃后,并不是萬(wàn)事大吉,束之高閣,不經(jīng)過(guò)演練的計(jì)劃無(wú)異于紙上談兵。很多企業(yè)沒(méi)有意識(shí)到這一點(diǎn),企業(yè)往往花費(fèi)了大量的人力和物力制定了IT危機(jī)預(yù)警系統(tǒng),以為萬(wàn)事大吉了。殊不知,在IT危機(jī)狀態(tài)下這些措施并不一定有效。

  處理IT危機(jī)的方法

  雖然IT危機(jī)管理的重點(diǎn)是預(yù)防危機(jī),預(yù)防危機(jī)的措施也可以做得相當(dāng)周密。但是IT危機(jī)誘因復(fù)雜多變,危機(jī)仍是防不勝防。因此,IT危機(jī)管理的另一項(xiàng)職能就是處理已經(jīng)發(fā)生的危機(jī),把危機(jī)損失和影響減少到最低程度。

  危機(jī)爆發(fā)時(shí)的破壞力最大,因此本階段的危機(jī)管理也最重要。第一步要做的就是遏制危機(jī),這要求危機(jī)處理在最短的時(shí)間內(nèi)掌握并控制危機(jī)形勢(shì),將損失降至最低。第二步要做的是防止危機(jī)的蔓延,把危機(jī)限定在一定的范圍之內(nèi)。在日?;顒?dòng)中,IT危機(jī)就像感冒病毒一樣,種類繁多防不勝肪。那么如何進(jìn)行危機(jī)管理呢

  (1)在危機(jī)處理時(shí),要立即調(diào)查情況、以控制事態(tài)的發(fā)展,啟動(dòng)危機(jī)處理小組對(duì)IT危機(jī)的狀況做一個(gè)全面的分析:危機(jī)產(chǎn)生的原因是什么,內(nèi)因還是外因?危機(jī)發(fā)展的狀況及趨勢(shì)如何?這些問(wèn)題必須弄清楚,因?yàn)檫@將是采取補(bǔ)救措施的直接依據(jù)。在這個(gè)階段,速度是關(guān)鍵,危機(jī)不等人。在IT危機(jī)發(fā)生后最短的時(shí)間內(nèi)做出反應(yīng)采取相應(yīng)措施,根據(jù)不同情況確定工作的優(yōu)先次序,把損失變?yōu)樽钚 ?/p>

  (2)一旦找出IT危機(jī)產(chǎn)生的原因,必須立刻制定相應(yīng)的危機(jī)計(jì)劃和對(duì)策。危機(jī)管理計(jì)劃必須是具體的、可以操作的,不應(yīng)該有任何含糊之辭。危機(jī)管理計(jì)劃應(yīng)明確所涉及部門及人員的權(quán)利和責(zé)任,對(duì)人員進(jìn)行有效配置,做到事事有人管,從而在危機(jī)來(lái)臨時(shí)都能夠迅速找到自已的位置。如果危機(jī)管理計(jì)劃混亂,雜亂無(wú)章,相關(guān)人員就會(huì)反應(yīng)遲鈍、迷茫無(wú)助或混亂不堪。

  (3)應(yīng)有輕重緩急,主次優(yōu)劣的區(qū)分。首先對(duì)IT危機(jī)管理的目標(biāo)應(yīng)有優(yōu)先序列,其次對(duì)一系列多種同時(shí)發(fā)生的危機(jī)也應(yīng)先應(yīng)先急后緩,先重后輕。

  (4)必須有IT危機(jī)管理的預(yù)算。IT危機(jī)處理必須根據(jù)自身的人力、物力、財(cái)力資源為基礎(chǔ),而不能以IT危機(jī)事件的種類為依據(jù),否則危機(jī)處理只會(huì)成為水中月,鏡中花,沒(méi)有任何現(xiàn)實(shí)意義。

  檢驗(yàn)危機(jī)管理是否有效的步驟

  危機(jī)是一種潛在的危險(xiǎn),危機(jī)管理正如在“刀尖上的舞蹈”一樣。危機(jī)管理絕不是危機(jī)出現(xiàn)以后才開始管理,而是要在危機(jī)發(fā)生之前采取措施,做到未雨綢繆。否則危機(jī)處理不好就會(huì)產(chǎn)生惡劣的后果。作為CIO,就要時(shí)時(shí)檢驗(yàn)和測(cè)試公司的危機(jī)管理是否有效。

  這里提供檢驗(yàn)危機(jī)管理是否有效的兩個(gè)步驟:

  第一,如果在非辦公時(shí)間出現(xiàn)危機(jī),公司有什么樣的內(nèi)部溝通系統(tǒng)?例如星期天遇到危機(jī),需要多長(zhǎng)時(shí)間消息傳達(dá)到每一位相關(guān)責(zé)任人

  危機(jī)處理小組的成立也是必要的準(zhǔn)備工作,這些成員必須提供二十四小時(shí)的聯(lián)絡(luò)方式,例如電話以及e-mail,當(dāng)危機(jī)發(fā)生時(shí),自然而然形成一個(gè)通訊網(wǎng) ,每個(gè)人都適時(shí)扮演適當(dāng)?shù)慕巧?。這個(gè)危機(jī)處理小組必須在危機(jī)發(fā)生前就成立,因?yàn)楫?dāng)危機(jī)發(fā)生時(shí) ,每個(gè)人都手忙腳亂、毫無(wú)頭緒,屆時(shí)再成立已經(jīng)太晚。

  第二,針對(duì)IT危機(jī)類型,公司有什么樣的應(yīng)急反應(yīng)計(jì)劃?這項(xiàng)計(jì)劃最后一次更新是什么時(shí)候?以前有沒(méi)有預(yù)演過(guò)以確認(rèn)它是否有效?它與公司其他的反應(yīng)計(jì)劃能否匹配

  典型的危機(jī)管理處理都會(huì)有一個(gè)時(shí)間表。例如當(dāng)危機(jī)發(fā)生時(shí),應(yīng)該做些什么,找出真正的實(shí)情為何,決定何時(shí)要響應(yīng)危機(jī)。依照危機(jī)的狀況不同,蔓延的情況也會(huì)有所差異。有些可能十二小時(shí)內(nèi)可以解決,有些則需要花上幾天到數(shù)個(gè)禮拜的時(shí)間。一般來(lái)說(shuō),危機(jī)發(fā)生的頭幾天,通常是比較緊張的時(shí)候,企業(yè)必須和時(shí)間賽跑,分秒必爭(zhēng)。

  測(cè)試危機(jī)管理的常用方法

  過(guò)去,我們?cè)谔幚碚J鹿蕰r(shí)通常也會(huì)形成一些危機(jī)管理的準(zhǔn)則和措施,但這些原則已經(jīng)不能滿足今天的需要。我們現(xiàn)在需要培養(yǎng)對(duì)正常以及非正常事故進(jìn)行綜合思考的能力,這里提供幾種常用的測(cè)試方法。

  (1)危機(jī)轉(zhuǎn)盤

  預(yù)防非正常事故的方法有好多種,其中隨機(jī)地思考這類事故就是一個(gè)好的方法,隨機(jī)思考的工具之一就是危機(jī)轉(zhuǎn)盤。危機(jī)轉(zhuǎn)盤是像小孩子游戲中用到的那種帶箭頭的轉(zhuǎn)盤,在轉(zhuǎn)盤上列出公司可能面臨的所有危機(jī)的種類。這個(gè)方法很有效,因?yàn)镃IO都習(xí)慣做常見(jiàn)的危機(jī)規(guī)劃,而精心策劃的隨機(jī)選擇方法可以轉(zhuǎn)移他們的參照點(diǎn),逼迫CIO跳出自己的思維定勢(shì)。

 ?、儆蒊T團(tuán)隊(duì)成員輪流轉(zhuǎn)動(dòng)轉(zhuǎn)盤。轉(zhuǎn)盤停止時(shí),根據(jù)箭頭所指的IT危機(jī)種類,討論大家能想到的所有正常的和非正常的危機(jī)。任何一種可能性都不能排除,不管這種想法看上去是多么可笑,因?yàn)槊恳环N想法都可能顛覆CIO對(duì)自己已知情況的根本觀念,改變大家對(duì)公司可能面對(duì)哪些危機(jī)的想法。

 ?、谌缓?,把兩個(gè)或兩個(gè)以上的非正常危機(jī)組合在一起。當(dāng)然,這種情況在現(xiàn)實(shí)中發(fā)生的可能性就更小了。但是一旦發(fā)生,危險(xiǎn)系數(shù)就更大。這迫使大家接受這樣的事實(shí),即:非正常災(zāi)難經(jīng)常是大規(guī)模發(fā)生的。這也幫助CIO聯(lián)想起一些新的危機(jī),這些危機(jī)大家以前從未想到可能會(huì)發(fā)生在自己的公司或行業(yè)中。

  (2)扮演內(nèi)鬼

  進(jìn)行危機(jī)預(yù)防工作時(shí),許多公司依賴自己的員工來(lái)研究應(yīng)該預(yù)防的危機(jī),因?yàn)閱T工最了解公司的情況。然而,由于員工非常了解公司的情況,考慮就會(huì)常常受限于習(xí)慣。因此大家并不能有效的從反面思考問(wèn)題,或者說(shuō)像壞人那樣思考。一些特殊的方法能幫助CIO做到這一點(diǎn),角色扮演就是其中之一。

  在進(jìn)行訓(xùn)練時(shí),CIO和IT成員組成測(cè)試小組,把自己想象成“內(nèi)鬼”或恐怖分子。這樣,大家就能暫時(shí)拋開習(xí)慣的理性思考方式和道德標(biāo)準(zhǔn),利用自己對(duì)公司產(chǎn)品、流程和制度的熟悉,想出從內(nèi)部或外部破壞公司的方法。當(dāng)大家采用“恐怖分子”的視角時(shí),往往上爬能指出哪些地方能制造最大的破壞,和如何制造這樣的破壞。這種方法經(jīng)??梢愿淖児緦?duì)IT危機(jī)的態(tài)度。

  (3)間諜游戲

  還有一種更極端的測(cè)試方法,例如大膽地邀請(qǐng)外人測(cè)試公司對(duì)危機(jī)處理的脆弱性。我們認(rèn)為員工太了解公司,或者身陷公司的日常運(yùn)營(yíng)中,因此不能采用完全不同的角度來(lái)看問(wèn)題。創(chuàng)造性地利用無(wú)偏見(jiàn)的專家,能幫助公司打破思維慣性,不再用否定的觀點(diǎn)看待危機(jī),認(rèn)為“這不可能在我們公司發(fā)生”。

  這種戲劇性的緊張練習(xí)能幫助CIO接受現(xiàn)實(shí),認(rèn)識(shí)到可能某一天也要處理此類危機(jī)。罪犯的心態(tài)與大多數(shù)人完全不同,在很多情況下CIO只有把這種心態(tài)帶入公司,才能真正地弄清楚罪犯會(huì)如何思考問(wèn)題。例如,一些曾經(jīng)是黑客高手的安全顧問(wèn)發(fā)現(xiàn)公司最容易被黑客侵入的領(lǐng)域,這些問(wèn)題不是軟件或者系統(tǒng)缺陷造成的,而是員工的無(wú)心之過(guò)帶來(lái)的。此前,大多數(shù)CIO都不會(huì)認(rèn)為,這些無(wú)心之過(guò)也會(huì)對(duì)網(wǎng)絡(luò)安全帶來(lái)威脅。

  古語(yǔ)云:“人無(wú)遠(yuǎn)慮,必有近憂”。既然IT危機(jī)不可避免,只有防范危機(jī)未然中,才能扭轉(zhuǎn)IT危機(jī)于旦夕之間。危機(jī)是每個(gè)企業(yè)都不愿面對(duì)的事,但是在發(fā)生后吸收經(jīng)驗(yàn),一方面可以防止類似事件再發(fā)生,另一方面也可以在處理方式上更加成熟。平時(shí)多一些IT危機(jī)意識(shí),多制定幾套對(duì)付各種可能出現(xiàn)的IT危機(jī)之策略,危機(jī)來(lái)臨時(shí)就會(huì)鎮(zhèn)定從容得多。

責(zé)任編輯:admin