• 締切済み

サーバの不具合の原因の探し方

こんにちは。 現在、ドメインの管理およびファイルの管理(ファイルサーバとしても利用)を役割としているサーバが1台あります。 ここ2ヶ月ぐらいの間に  ・自動シャットダウンする(「落ちる」という現象が起きる)  ・クライアントからフォルダを開くのに時間がかかる などの現象が起きています。 また、起動自体も遅いです。 「そろそろ買い替えか?」という話になっているのですが、 本当に買い替えなのか問題になっている箇所を探し出す必要があると 考えているのですが、どのように探す?調査する?ことをすればよいのか、困っています。 すいませんが、調査の仕方をご存知の方、教えてもらえませんか。 よろしくお願いします。

みんなの回答

  • POWERVAULT
  • ベストアンサー率39% (573/1467)
回答No.5

DELLとかHPならマネージメントソフトのエラー履歴を見ればハードの不具合であれば何で落ちたのか判るようですけど。 他メーカーのは使ってないので不明。 私もたまにDELLのPE2600が落ちる事がありますが、何の履歴もないのでコレはソフトが原因かも。

すると、全ての回答が全文表示されます。
  • xcrOSgS2wY
  • ベストアンサー率50% (1006/1985)
回答No.4

サーバが落ちる瞬間の目撃者はおりますでしょうか。 (a) もしサーバが、まるで電源を落としたように(あるいはリセットボタンを押したように)いきなり再起動したのであれば、ハードウェアの障害が強く疑われます。(ソフトウェアが原因の可能性も皆無ではありませんが、下記(b)の場合よりも可能性は低くなります。) (b) いったん青画面が出てから自動的に再起動したのであれば、ハードウェアの障害のほか、ソフトウェア(ドライバ)の不良の可能性もあります。 (c) いずれでもなく、見た目上正常にシャットダウンして再起動しているのであれば、何かリモートシャットダウンを引き起こすようなツールを知らないうちに誰かがインストールしたのかもしれません。 どれに該当するのかお分かりにならない場合は 「No.1516019 質問:ログオンオフの日時って調べられるんでしょうか?」 http://oshiete1.goo.ne.jp/kotaeru.php3?q=1516019 の手順で、システムログのイベントを見てください。 正常にシャットダウンしてから再起動している場合は、Windowsの起動イベントと終了イベントがちゃんと対になって記録されます。(上記の(c)の場合に当たります。) シャットダウンされずに落ちて再起動している場合は、Windowsの起動イベントの直前に終了イベントが記録されていないのが分かります。(上記の(a)か(b)の場合に当たります。) サーバが落ちる状況が(c)であればソフト的なものですから、インストールされているソフトを徹底的に洗ってください。ひょっとすると 「No.1519933 質問:アプリケーションの起動履歴 」 http://oshiete1.goo.ne.jp/kotaeru.php3?q=1519933 の手順でプログラムの起動・終了を監視し、シャットダウン直前に起動されたアプリケーションを探すのも有効かもしれません。 落ちる状況が(a)か(b)の場合(たいていはこちらなのですが)はちょっとやっかいですが、まず(a)と(b)の切り分けを行いましょう。 コントロールパネル→システム→詳細タブ→起動/回復(S)...→システムエラーの欄で「システムログにイベントを書き込む(L)」にチェックを入れ、デバッグ情報の書き込みの欄で「カーネルメモリダンプ」または「完全メモリダンプ」を選択します。(この2つの違いは、カーネルメモリダンプでは数十MB程度のファイルが作成されますが、完全メモリダンプではメモリ実装量に応じて数百MBのファイルになる場合もあるという点です。HDD容量と相談して決めてください。) このように設定しておくと、青画面で落ちるとシステムログにイベントが残るようになるので、再度落ちたときに、それらしいイベントがシステムログにあるかどうか探してください。もしあれば落ちる状況が(b)ですし、なければ(a)ということになります。メモリダンプファイルの内容の読み方は長くなるので、この回答では省略します。(必要そうなときに、回答への補足か新しい質問でお尋ねください。) さて次はハードウェアの障害かソフトウェアの障害かの切り分けです。これもやっかいで、奇麗に切り分けられるとは限らないのですが・・・ ハードウェアの障害の場合は落ちる前に何かしらの異常が発生していて、それがログに記録されているということが多々あります。システムログをざっと調べて、致命的なエラーと思わしきイベントが記録されていないか調べてみてください。記録があるようであれば、そのイベントの発生源を調べてください。例えば仮にその発生源がFtdiskであれば、FtdiskはRAIDなどのディスク制御を行うドライバなので、HDDがおかしくなっているかもしれない、と予想できます。 ログに何も異常の兆候がないようですと、あとはハード的な設定をいろいろ変えてみるか、ダンプファイルを読むかということになりますが、回答がだいぶ長くなったのでひとまずここで区切ることにします。ここまで試してみてどうにも切り分けられない、という感じであれば、また続きを考えてみましょう。

すると、全ての回答が全文表示されます。
回答No.3

>  ・自動シャットダウンする(「落ちる」という現象が起きる) >  ・クライアントからフォルダを開くのに時間がかかる シャットダウンの問題はCPUの過熱防止機構が働いて、強制的に落ちている可能性も。 #最近は特に暑いですね、、、、 起動の遅さは他の方が指摘のように、アプリケーションによるため何とも言えませんが、極端に遅いようであれば、HDDの不良セクタかも。

rahinata
質問者

補足

最近は暑いですよね。 と言いながらサーバは壁際に置いてあったりします。

すると、全ての回答が全文表示されます。
  • monda
  • ベストアンサー率87% (50/57)
回答No.2

確かに質問内容だけだと「さぁ?」としか言えませんが。 まずはメモリの状態からチェック。 OSが記載されていないので分かりませんが、Linux系なら vmstat -r の出力からキツイところを探す、Window系なら タスクマネージャからコミットチャージの状態を見る、 プロセスの状態を見る、といったところでしょう。 ソフトウェア要因ならある程度はこれで絞れるでしょう。 あとはハードウェアに diagnostic ユーティリティが 付属していたら走らせてみる、とか。 ハードウェア要因が見つかるかもしれません。 同じ構成のものがもうひとつあるなら、相互に比べてみる のもひとつの方法です。 現在の構成(特に組み込んであるプログラムやサービス)を 提示されるともう少しくわしく分かるかも知れません。

rahinata
質問者

補足

失礼しました。 OSはWindows Server 2000(SP4適用)です。 コミットチャージで確認してみました。 メモリの使用率は14%程度のようです。 組み込んであるプログラムはほとんどありません。 Acrobatや解凍圧縮ツールぐらいです。 サービスはDNS、DHCP、telnetなどが動いています。 すいません、初心者なもので。

すると、全ての回答が全文表示されます。
回答No.1

はじめまして。 質問の内容だけでは少し情報不足ですが、ファイルの管理(ファイルサーバとしても利用)とありますのでデータの肥大化が原因の一つ。 あと、調べるとしたらログファイルが無意味に貯まっていませんか?

rahinata
質問者

補足

早速の回答、ありがとうございます。 データの肥大化とのことでしたが、このPCにはCドライブとDドライブが あり、どちらも半分は超していません。 Dドライブにデータが入っており、Cドライブにアプリケーションが インストールされています。 (C:4GB/10GB、D:5GB/30GB) 半分でも遅くなる原因と考えるべきなのでしょうか。 ログファイルですが、確かにたまっています。 10日に一度ぐらいの割合で、「ログが一杯です」というエラーが出ます。 エラーに記載のあるURLへ接続して調べたことはありますが、 どういうことか良く分からないエラーで、そのままにしてあったりします。 ちなみに今のPCは  CELELON 733Mhz  メモリが512MB  クライアント接続数が10台未満 です。

すると、全ての回答が全文表示されます。

関連するQ&A