• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:予期せずサーバが停止した場合の原因究明方法 )

予期せずサーバが停止した場合の原因究明方法

このQ&Aのポイント
  • 予期せずサーバが停止した場合の原因究明方法とは?原因として考えられるものや対応方法について紹介します。
  • サーバが予期せず停止する現象について、原因究明と対策をご紹介します。ハードの状態や起動メッセージの内容などに注目しましょう。
  • サーバが突然停止した場合の原因追及と対応方法について解説します。具体的な現象や機器構成にも触れながら、トラブルシューティングのポイントをお伝えします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

とっかかりとして。 ・停止した時に誰かログインしていたか。何か作業をしていたかを確認。 ・/var/log/以下のファイル(特にmessages)でその時間帯に何か記録されていないか確認する。(ハードウエアエラーとか、アタックの形跡とか) ・sda5がどこにマウントされるデバイスか知りませんが、HDDに何らかのエラーが出ていた可能性は濃厚です。RAIDユーティリティをインストールしていると思いますので、HDDエラーがないか確認する。Expressをお使いなら保守に入っているでしょうからサポートデスクに連絡、問い合わせる。HDD故障なら無償で交換できます。 ・kernel panicなどOSのエラーが疑われる場合はRedHatに問い合わせる。 ・coreファイルを探してみる

f-yamazaki
質問者

お礼

回答ありがとうございます。 1)ログイン&作業  停止時にログインしての作業はないはずです。サーバとしてのWebアプリの動作はおこなわれていました。 2)ログ  当日は13:40ごろ停止し14:30ごろ再起動したのですが、messagesを見たらその日のログは、再起動直後からしかログは残っていませんでした。  他には、cron、secure、Apacheのaccess.log、error.logなどを見てみましたが、停止時に通常時と違ったようなログは無いように見えました。 3)HDDエラー  ・自分ではRAIDユーティリティーというものを余り意識していなく、インストールされているか否かがあいまいなのですが、後ほど確認してみます。  ・保守については、正直なところNECのサポート体制がよく理解できず Club Express -> PPサポート と問い合わせして 蹴られたところです。(PPサポートは、Linux サービスセット Liteでの登録だったため、障害対応はダメとのことです。)  後ほど、ハード系の窓口に問い合わせしてみようと思います。 4)kernel panic  単語としては聞いたことがあるのですが、Linuxで実際に目の当たりにしたことがないので、パニックになったのかどうかが判断つきかねています。 5)core  findで検索をしてみたところ、再起動した時刻に「./dev/core」というものが作成されていたようです。coreについても、自分で対処したことがなくどのように扱ったものかわかりかねている状態です。 非常に参考になりました。 もし、この回答からなにか推測できることがあったら教えていただけると幸いです。 ありがとうございます。

その他の回答 (1)

  • manjorin
  • ベストアンサー率42% (79/185)
回答No.2

ちょっと調べたところ、ipmiが使えるようなので、 selを拾って解析してみてはいかがですか

f-yamazaki
質問者

お礼

ありがとうございます。 ただ、私のほうでは ipmi も sel も単語自体はじめてみたものです。 調べたところipmiは、なんとなく用途はわかりましたが、具体的にどう利用するのかわからず、selにいたっては、ちょっと何者かもわからないといったレベルです。 もし、追加情報へのポインタなどありましたら、教えていただけると幸いです。

関連するQ&A