気まぐれSE日記

地方でエンジニアしてます

今日のお仕事 HDD障害

復旧作業

昨日言っていたとおり、Maxtorのディスク交換作業になりました。

結局、1年経っても環境(温度)か、OSの問題なのかわかりません。


↓温度はmuninで調べているのですが、 やはりMaxtorは夏は40度超えるなどで
環境的に厳しかったのかも...?でもこんなので壊れても困る。(グラフでは青いの方です)






ともかく、TurboLinux 10 Serverと MaxtorSATAディスクの相性はなんかおかしい。
(サーバ本体は、NEC Express 5800 110 Rh-1hです)


今日も、保守用の在庫がMaxtorのディスクしかないのでまたMaxtor
ディスク(容量は同じ250GB、交換後のHDDは時期的にSATA150⇒SATA300になった)
に交換したのですが、さっそく変なエラー



hdb: status timeout: status=0xd0 { Busy }

ide: failed opcode was: unknown
hdb: no DRQ after issuing MULTWRITE_EXT
ide0: reset: success


このエラーは、なんで出るのかよくわからん。


このエラーが出ると動作がヤケに重くなるので、先が思いやられる状態です。



今度は絶対他のメーカー(サーバもHDDもOSもね)にしてみます。



データの吸い出し

バックアップも取っていましたが、
漏れがあったので試しにイカレタHDDをつないで読み込んでみました。


HDDを取り外したすぐは、熱がこもっているせいか全く認識しなかったのですが
1〜2時間後につないでみたところ認識できました。


fsckかけると、あるセクタだけ全く読めない?らしくタイムアウトするのが5回ほどあり
それ以外は良くある不良ファイルを削りますか?(y/n)が100個くらいあって
それはパスできました。


やっぱり熱かなあ...。