2012/07/02

何かがヤヴァイ

先日鯖を変えたのですが、RAIDに問題があるようです。
ランダムアクセスな負荷をかけるとreadに失敗してもなにも文句を言わないまま壊れたデータを送り付けてくるという・・・

最初原因がわからず、クライアントマシンでデータがおかしくなるという症状が出たため、ネットワークを疑っていたのですが違いました(鯖上でやってもランダムでおかしなデータになる)。
次に疑ったのはソフトウェアRAIDで、CPUの電圧を下げすぎてるからか?というものでしたが、結果は白。
BIOSのセッティングをすべて定格にしてもだめでした。
で、最終的になんだったかというと、単純にRAIDのHDDの異常。
症状がランダム(特定ファイルではなく、チェックするたびに異なるファイルで異常がでる)なためHDDは疑っていなかったのですが、どうもHDDのディスクというより基板?が怪しそう。
2chにつながっているHDDのSMARTを見たらC5が1になってました(生値は確認できず 後に別マシンに繋いでみたところFFE0とかになっていたような気が)

とりあえず今は昔買っておいた予備のHDDをつなげて再ビルド中です。
おかしくなった奴も0fill中。
これで直ればいいんですけどね。

'12/07/13
と思っていたのははるか昔
どうやらメモリが「壊れた」ようです。
にわかには信じがたいですが、以前は通ったはずの通常設定(XMPのデフォルトとか定格=1333MHzとか)でもエラーを吐きます。
特定の2枚のメモリを別マシンに付け替えると別マシンがエラーを吐きます。
そのメモリを抜くと正常動作になります。
ってことはこのメモリが壊れてるんじゃね?といったところで。


0 件のコメント:

コメントを投稿