機房升溫的原因:冷機系統故障。
故障原因:缺水。
由於水路循環受到影響,導致整個機房裡所有的主冷機服務異常,連帶著備用的冷機也一起完蛋。
然後,補水了,結果由於冷卻系統的群控邏輯,無法單機獨立啟動,必須手動修改配置。
等工程師改完了,才重新啟動。
查原因用了三小時三十四分鐘。
補水用了兩小時五十七分鐘。
人工修改冷機的群控邏輯用了三小時三十二分鐘。
所以,早上五點發生的問題,直到剛剛才解決。
中途還因為傻逼的自來水消防噴淋裝置,徹底毀了一個房間裡的伺服器。
這家建築設計院就是之前安夏成功推銷了軟體的那家接了援非業務的,院長朱洪濤給錢挺痛快。所以安夏在做數據中心的時候,也想到了他們。
這次帶隊過來的人是總工杜力,在來之前他們內部已經撕過一輪了。
冷機故障,正常情況下第一個要找的是暖通。
暖通工程師說:「關我什麼事?是我讓冷機沒水的嗎?是弱電的錯!沒水了群控都查不出來。」
弱電工程師說:「關我什麼事!我的程序沒錯!是給排水的錯……」
給排水工程師說:「啊對!是,我,我有罪!但是負責機房監管的人就一點責任都沒有嗎?」
於是,杜力親自帶著給排水工程師過來謝罪。
如果有可能的話,最好能把鍋甩回給紫金科技,建築行業一出生產責任事故,不是賠錢就是坐牢。
他們也不想的。
機房斷氣的責任事故有兩件事要往下追:
第一,冷機的水到底是怎麼沒的。
第二,誰出的主意,在機房裡用自來水噴淋做為消防手段的。
第一件事的責任方無論如何都有給排水工程師的鍋,甩是甩不掉了,他最多拉著機房監管人員共沉淪。
杜力向安夏再三道歉,表示會馬上親自到現場查明事故原因。
下午五點,龍運來了。
他接到消息的時間是早上五點十分,早飯午飯都沒吃,連軸轉到現在,解決了機房的問題之後,又急匆匆地趕來向安夏匯報。
什麼時候機房出現了什麼事,什麼時候機房全面恢復。
