- ベストアンサー
2重化されたサーバが運用停止することはあるのか?
こんにちは 2重化されたサーバの1系が止まり、2系で運用しております。メーカに確認したところ、故障の原因は、1系のOSファイルの重要な一部が壊れたとのことです。復旧する際、予備機のサーバと交換して、ソフトを再インストールする必要があると聞いたのですが、1系のOSファイルのみを再インストールして、復旧しないのでしょうか?交換時、一時、運用が停止(数時間)するらしいのですが、そのようなことはあるのでしょうか? 素人なので良く分からないのですが、運用停止させないようにするため、2重化しているはずですが、なぜこのようなことが起こるのでしょうか?
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
保守契約先の作業に疑問がある場合は、保守契約先に遠慮なく聞いた方が良いですよ。 >運用停止させないようにするため、2重化しているはずですが、なぜこのようなことが起こるのでしょうか? 可能性として高そうなのは、システム装置そのものに欠陥がある事が判明した等でしょうか。 >1系のOSファイルの重要な一部が壊れたとのことです。 OSファイルの重要な一部が自然に不可抗力で壊れる。なんてことは滅多にあっては困ります。 直接の原因はそうであったとして、さらに突っ込んで、 それが起こったのは「何故か?」がボイントと思います。 RAIDカードのファームウェアやドライバのバージョンが古すぎてOSのパッチ適用で破綻した・・・ 2系にもOSのパッチ適用すれば同じ道を辿ることが目に見えているので対応が必要とか、 パッチ適用に失敗したのでなければ、ハードウェア上の深刻な不具合、 例えばRAIDカードのファームウェアの不具合、使用部品の不良とかで交換が必要 同じ部品を使用している2系も予防交換しておかないとヤバそう等 もしくは、システムの構成変更作業前には必ず「システム全体を停止して完全バックアップを行わせて貰えないでしょうか?」と聞くことになっているのでマニュアル通りに打診している。 その方が万一の場合でも復旧が容易。 「運用停止させないようにするため、2重化している」と言っても、予期せず営業時間中に止まるのは困るので2重化しているが、夜間なら止めてOKという場合は多いです。 「止めて良いのなら止めて作業させてほしい」と打診されているだけという事はありませんか? いずれにせよ、保守契約先に遠慮なく質問するべき事と思います。
その他の回答 (3)
ANo.2の修正 「100%停止不能」は「100%停止不可」と読み替えてください。 申し訳ありません。
はじめまして jcg02524です。 「2重化」という言葉ですが、基本的に「停止させないシステム」という目的としては正しいと感じています。 問題は「どこを2重化しているか」です。 ※これはシステム構成したメーカーと委託した会社の考えを聞かないとわかりません。 「2重化」の定義に対する要求レベルについて考える必要があります。コンピュータの世界には「可用性」と言う言葉が存在します。 特に24時間365日の稼動要求であっても1年間でどれだけ止めることができるかの要求が会社として存在します。 例えばなのですが・・・ 年間を通じて「100%停止不能」「1日位なら大丈夫」「数時間なら大丈夫」といった具合に要求レベルが異なります。(例:電源設備に関する定期点検を含む) ※当然、停止時間が少なくなるようにコンピュータシステムを構成する場合にはかなりのコストが掛かってきます。通常、会社としては導入コストに対して停止時間の許容範囲を明確にしています。 (「100%停止不能」の場合には内容と規模にもよりますが簡単に億単位のお金が動きます) 一度、「可用性」の定義について会社側のシステム部門に確認するほうが確実だと思います。
お礼
お返事有難う御座います。 >いずれにせよ、保守契約先に遠慮なく質問するべき事と思います。 質問して、原因もよく解りました。導入時に事情があり、どうしようもないことがわかりました。
- yamato1957
- ベストアンサー率24% (2279/9313)
正常な方も止める?。普通はありえません。サーバーの構築時に設定ミスかチョンボしたのでは?。メーカーのスキルが低いかも知れませんね。
補足
お返事有難う御座います。 >メーカーのスキルが低いかも知れませんね。 よくわかりません。 ご意見を、参考にさせて頂きます。
お礼
お返事有難う御座います。 >※当然、停止時間が少なくなるようにコンピュータシステムを構成する場合にはかなりのコストが掛かってきます。 了解しました。導入時に複雑な事情があったようです。まあ、今となっては仕方がないと諦めています。