サーバルームのエアコンが壊れた!

この猛暑の折,職場のサーバルーム (厳密には「サーバルーム」ではないけどサーバ類のある部屋) のエアコンが壊れるという恐ろしい事態が起こった.



事件の発端は先週の土曜日.夜になってメールチェックすると,なにやら数十通ものメールが届いている.[2005-11-10] で書いた Solaris サーバの温度監視スクリプトが,15 分ごとに警告を送ってきているのだった.

メールによると CPU の温度は 74 ℃,昼から少しずつ上昇しており,このペースでは明日の朝には 80 ℃ に達するだろう.

幸い頑丈なサーバなのでまだぴんぴんしているが,こんな温度ははじめてだ.自宅からリモートログインして,ファンなどをチェックしたが異状はない.そもそも 2 つある CPU がどちらも過熱してるのも不思議だ.冷房を誰かうっかり切っちゃったのか? …まさかな.そんなわけねーな.

と,まさかとは思ったが問題の切り分けのため,「考えにくいことですが」との前置きつきで職場にメールを送ってみると,休出してた人間からすぐに返信.

「推測どおり冷房が止まっていました.」「動き出す気配がありません.」

ちょwwwww

マジでエアコン壊れてるのか.半ばギャグで言ったのに.ていうかこのタイミングでか.よりによってこの暑さの中,ピンポイントでサーバルーム.しかも悪いことにエアコン等の担当者は休暇で海外逃亡しており,水曜まで帰って来ないってどんだけ.



とりあえず,このまま温度が上昇し続けるとまずいので,土日はサーバ類をすべてシャットダウン.また日曜は休出した後輩に,職場に転がってた扇風機をサーバラックに向けて回してもらうという気休め程度の対策をとる.さらに,前からサーバを別の部屋に移す話が出ていたので,この機会に移してしまおうという話になった.



というわけで,本日苦労して大量のサーバを他の部屋に移し,夕方にようやくサービス再開.移設で何もトラブルがなかったのは幸い.壊れたエアコンの方は現在修理待ちです.



いやー,こんなギャグみたいなこと本当にあるんですねえ.東京トホホ会に出したいくらいだ.しかし温度監視スクリプト仕込んでおいてほんとに良かった.