※ ChatGPTを利用し、要約された質問です(原文:システムの動作不安定)
システムの動作不安定、熱暴走以外の原因は?
このQ&Aのポイント
工場内で生産管理のシステムが突然動作不安定になりました。サーバーとminiPCの熱暴走を疑っていますが、他の原因は何が考えられるでしょうか?
工場内の気温は30度未満でラックは通気が良く、サーバーの動作不安定は清掃によって改善されました。しかし、miniPCも同様の症状がでており熱暴走が原因ではないかと考えています。
システムは3ヶ月間問題なく動作していましたが、最近はminiPCが無反応になります。ソフトウェアやハードウェアの問題はなく、他の原因を調べています。
工場内で生産管理のシステムを運用しています。東南アジアのある国からです。現在の気温は34度です。
サーバー1台に対し、2つの生産ライン。それぞれのラインには、miniPCが1台ずつ、入力用のタッチパネルが2台ずつあります。
このシステム上には、上記のように合計7台のマシンがネットワーク接続されています。
ここ3ヶ月間は問題なく動いていましたが、今週火曜日から突然動作不安定になりました。最初はサーバーが不安定になり、筐体内の清掃を行ったところ、動作は安定しました。
ところが、今度は同じサーバーラック内に収めてあるminiPCが動作不安定を引き起こすようになりました。
工場は、電化製品を製造する工場で、サーバーラックは生産ラインの横に置いてあります。工場内の気温は30度に届かないくらいで、ラックは通気をよくしています。
サーバーは熱暴走が原因だと推定でき、清掃を行うことで動作は改善していますが、miniPCも同じように熱暴走が考えられますでしょうか?
現在、熱暴走を疑って、miniPCに冷却用のファンを取り付け、外部から強制的に冷やそうとしています。miniPCの筐体は全体が放熱フィンのようになっているタイプです。
ここまでに考えたことは、
・これまで3ヶ月問題なく動作してきたシステムなので、ソースコード上のエラーとは考えにくい。
・動作不安定の状況はminiPCが無反応になるため、このハードの障害。
・設置環境は確かにベストではないが、室内であること、周りに熱源がないこと、を考慮して使用に耐えうるものとの判断。
・サーバーおよびminiPCのリソースはきわめて安定。データベースも接続数、クエリ数などきわめて安定しているため、ソフト的な問題ではない。
などです。
データベースとのやり取りは、miniPCからデータベースへレコードを書き込み、タッチパネル端末がその内容を参照して画面に表示するという単純なものです。
これが熱暴走以外に考えられるとしたらどんなものがあるでしょうか?
お礼
YUI_AIさん、 気にかけていただいてありがとうございます。 その後ですが、少し進展がありました。 まず熱暴走を疑っていたのですが、メーカーであるVIAに問わ合わせたところ、気温70度までの動作を保証するということでした。米国ではレースカーに搭載して使用されているそうです。 しかし、サーバラックの中の空気の流れも確保するために、大量にファンを取りつけ、ラックの空気取り入れ口から全体に空気が流れるようにしました。 現状、.NET Runtime 2.0 Error Reporting ID:5000という.Net 2.0のバグが影響している可能性があり、この部分のソースを書きなおして、様子を見ているところです。 ネットで書かれている現象は、我々が遭遇している状況に酷似しています。 いずれにしても、YUI_AIさんのアドバイスは我々の焦っている気持ちを一度原点に戻し、落ち着いて考えるいい機会になりました。 ありがとうございました。