- 締切済み
NFS mount できず fsck もこける
Solaris 2.7 を使っています. このマシンを NFS client として (以下 clt),他のサーバ (以下 svr) を NFS mount していたのですが,昨日突然 NFS write failed for server svr: error 5 (RPC: Timed out) などとなって NFS mount できなくなりました.ただし mount(1M) でみると mount されていて,umount しようとすると busy といわれます. clt を再起動しようと思い,/usr/ucb/shutdown -r now したところ, Syncing file systems... 3 2 2 2 2 2 2 2 2 2 2 2 などと数字が続いた挙句に cannot sync -- giving up となり,再起動後の fsck でも / があるディスクのエラーが修復できません.ディスクが死にかけているのかも知れませんが,/ なのではずすこともできません. また,fsck をかけようと shutdown でシングルユーザモードにしようとしても umount できないのでうまくいかず,lom から ok プロンプトを出そうとしても break というコマンドがないと言われます. 対処法などありましたらお知らせいただけると幸いです.よろしくお願いいたします.
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- foobar
- ベストアンサー率44% (1423/3185)
fsckの挙動はOSによって若干差異が合ったような気がします。 (安全のためにmountしてあるファイルシステムに対して修正をする/しないといったあたりで) 一度、マニュアルでfsckの挙動(コマンドオプションを含めて)確認された方が良いかも知れません。 fsck をかける度に出てくるメッセージ(ブロックの番号やファイルの番号)は同じでしょうか? もし同じ番号が報告されるようだと、(上記fsckの仕様により)修正がHDDにかけられていないかもしれません。 (安全のためには、レスキューディスクで起動したり、OSをシングルユーザモードにしたりしてfsckをかけるべきでしょう) (感覚的には、fsckで不具合修正すれば大丈夫そうな気もしますが、 ディスク不良と繋がっている可能性もあるので、なんとも言い難いです)
- foobar
- ベストアンサー率44% (1423/3185)
srv側でのチェックはされましたでしょうか? ご質問に書かれている状況から推測すると、srv側で問題(ファイルシステムの異常等)が起きているように思います。
補足
早速の回答どうもありがとうございます. srv 側で fsck をかけたところ,/ のあるディスクで # fsck ** /dev/rdsk/c0t0d0s0 ** Currently Mounted on / ** Phase 1 - Check Blocks and Sizes INCORRECT BLOCK COUNT I=81101 (8 should be 2) CORRECT? y ** Phase 2 - Check Pathnames ** Phase 3 - Check Connectivity ** Phase 4 - Check Reference Counts LINK COUNT FILE I=81179 OWNER=root MODE=100664 SIZE=1713 MTIME=Mar 24 01:07 2005 COUNT 2 SHOULD BE 1 ADJUST? y ** Phase 5 - Check Cyl groups FREE BLK COUNT(S) WRONG IN SUPERBLK SALVAGE? y 2540 files, 47119 used, 242946 free (386 frags, 30320 blocks, 0.1% fragmentation) ***** FILE SYSTEM WAS MODIFIED ***** となりました(他のディスクは大丈夫だったようですが).しかし,y で修復したつもりだったのですが,この後,何度 fsck しても同様に引っかかり消えてくれません. このような場合.このハードディスクはもう危ないということになりますでしょうか? 新しいハードディスクを用意して dd するしかないのでしょうか(すぐに HD が用意できないので,できれば他の方法で対処したく思います).
お礼
ありがとうございます. 結論からいいますと,NFS クライアントとサーバがつながっていたスイッチングハブの調子が悪かったようで,ハブを取り替えたらなぜか調子が戻りました.再起動を繰り返すうちに sync もできるようになりました.因果関係はよくわかりませんが... fsck の結果は,調子が悪い間はずっと同じメッセージが出ていました.アドバイス頂いたとおり Solaris の fsck(1M) を調べましたが,mount されたファイルシステムは fix しないようですね.boot -s でシングルユーザモードに入ったつもりでしたが,/ は mount されていたのかも知れません. ともかくありがとうございました.