• ベストアンサー

DBバックアップ方式検討

入社3ヶ月のペーペーです。先週初めてOracleに触れました。今週なぜかDBバックアップの方式検討なぞを任されております。 前提条件として ・完全回復。 ・取得タイミングは日次および週次 ・取得可能な時間帯は日次で夜20:00~翌朝08:00の間、週次で土曜08:00~日曜24:00 ・全面障害、部分テーブル障害の双方に対応可能であること ・リカバリ時間は傷害検知から1時間以内 …を出されています。これに対し、 ・アーカイブログモードで運用 ・週次でコールドバックアップ取得 ・日次でホットバックアップ取得  →日次でDB停止時間は30分しか取れないので   コールドは無理だろう  →完全回復を求めるならば論理バックアップは   使えないだろう 思っているのですが、方式検討の際にこのほか勘案しなければならないのはどのような事でしょうか?また増分バックアップや差分バックアップを日次で取得するというのは、普通にホットバックアップを取得するのとどのように違いが出てくるのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.4

>週次でコールドを取る時にもこの作業は必要ですか? >日次のホットの時は、バックアップ中の変更履歴がREDOに書き込まれるとのこと、 >からこの操作が必要なのかな、と現時点ではイメージしていますが… >見当違いな事を言っていたら申し訳ありません。 コールドって停止してバックアップを取るんですよね?認識的にはあっていると思います。 コールドは一貫性バックアップなのでREDOログはバックアップする必要はないです。 >制御ファイルを多重化することで対応出来ませんか? 制御ファイルが全損した(多重化したものすべて破壊された)場合は?ってことです。 #私はRMANでバックアップしてますがリカバリーカタログは使ってないです(^^;。 >皆さんならどのように決めるのでしょうか…? 私はDBのエディション(SE/EE)、バージョン、DB全体容量、バックアップ時間、DBが停止可能かどうか、リカバリに求められる時間などでバックアップ計画を決めます。 (聞きたい事の回答になってないと思いますが(^^;)

since1983
質問者

補足

初めに頂いたご回答に対してですが、ご指摘の通り リカバリの許容時間1時間というのは私の誤解でした。 DBサーバがクラスタ化されているので、副DBサーバに 切り替えれば1時間も掛からずサービスは復活する、 とのことでした。またSANに障害が発生した時の リカバリ時間は、相応にとってもらえるようです。 具体的な許容時間は聞くことが出来ませんでしたが。 ○制御ファイルの全損 改めて確認したところ、 今回DBサーバはクラスタ化されていて、そこにSANを マウントしてデータファイルを置くとのことです。 ということはSANが壊れたら多重化も意味無しですね。 その場合は前日取得したバックアップで復旧できる 範囲まで復旧でOKとのことでした。 何となく私のほうも何を聞きたかったのか、 不明瞭になってきました。 というのも、リカバリ許容時間のところで 勘違いをしていたため、それが間違いと分かった今、 週次でコールド、日次でアーカイブログを取れば 充分じゃないかとも思われてきたからです…。 もう少し前提条件と知識を整理して再度考えてみます。

その他の回答 (4)

  • MZ-80B
  • ベストアンサー率56% (46/81)
回答No.5

インスタンスリカバリとメディアリカバリについて混同されていませんか? 障害の種類とリカバリについて区別がついていないようですので バックアップ・リカバリマニュアルを一読することをお勧めします。

  • entree
  • ベストアンサー率55% (405/735)
回答No.3

> ○許容リカバリ時間について > 現時点で詳しいことは分からず、また分かっていても > あまり書くのは良くない事なんですが、証券会社の > 口座を管理するDBで、口座数は4~5万程度です。 > この規模で許容リカバリ時間1時間はきついですか? 口座数より、データ件数やバイト数、更新頻度を考慮する必要があります。 > ○完全回復について > 多重化したオンラインREDOの全てがだめになった場合は > アーカイブログで戻せる限りのところまで戻す、という > つもりでいます。方針として完全回復を目標にする、 > ということです。 であれば、バックアップの直後に REDO ログ・ファイルのアーカイブを行い、アーカイブ・ログをバックアップする必要がありますね。ちなみに、カレント REDO ログ・ファイルが全損した場合は不完全リカバリとなります。 > ○全面障害について > メディア障害を含む、とのことです。外部メディアに > バックアップ退避~については、2世代は別筐体HDDに、 > それより前の1世代はテープに出す、とのことです。 > 意味がはっきりわかって聞いていたわけではないですが 稼動用 HDD の障害、1 世代前バックアップ用 HDD 障害が同時に発生した場合、2 世代前バックアップから戻す必要があるかと思いますので、その時間についても見積もる必要があるかどうかを明確にする必要があるかと思います。 > ○リカバリカタログ使用有無 > リカバリカタログはRMAN使用時に必要となるものです > よね?RMANを使わない、というのは現実的ではありま せんか? Oracle では RMAN かつリカバリ・カタログの利用を推奨していますが、リカバリ・カタログは必須ではないため、別に使用しなくても問題はありません。ただし、リカバ・リカタログが存在しない場合、制御ファイルが全損した場合のリカバリが極めて困難になります。

since1983
質問者

補足

回答ありがとうございます。 ○口座数より、データ件数やバイト数、更新頻度… データ容量の見積もりがはっきりしてきた時点で再度考えたいと思います。 ○バックアップの直後に REDO ログ・ファイルのアーカイブを行い、アーカイブ・ログをバックアップ… 週次でコールドを取る時にもこの作業は必要ですか?日次のホットの時は、バックアップ中の変更履歴がREDOに書き込まれるとのこと、だからこの操作が必要なのかな、と現時点ではイメージしていますが…見当違いな事を言っていたら申し訳ありません。 ○全面障害について 二重障害のことまでは考えなくて良いとのことでした。 ○リカバリカタログについて 制御ファイルを多重化することで対応出来ませんか?これだとバックアップ中にメディア障害が発生すると、そのときのバックアップ情報を格納している制御ファイルが失われるから…という認識でよろしいでしょうか?

回答No.2

>・完全回復。 一部破壊状態によっては完全復旧できない場合があります(アクティブのオンラインREDO全破損とか・・・)。 >・リカバリ時間は傷害検知から1時間以内 10gでかつ比較的小さいDBなら新機能を駆使して可能にできるかも。(ただし、バックアップファイルが運用データファイルになっちゃいますが。) それ以外の場合、完全回復はk_o_r_o_c_h_a_nさんのおっしゃるように難しいと思います。 (30分でコールドバックアップができないサイズならなおさら・・・) >・全面障害、部分テーブル障害の双方に対応可能であること 全面障害は何を想定しますか? ディスク障害とかも入りますか? 外部メディアへのバックアップファイルの退避とかも必要そうですね。 >方式検討の際にこのほか勘案しなければならないのはどのような事でしょうか? リカバリーカタログの使用有無とか、使う場合のリカバリーカタログのバックアップとか・・・。 >また増分バックアップや差分バックアップを日次で >取得するというのは、普通にホットバックアップを >取得するのとどのように違いが出てくるのでしょ >うか? バックアップ時間できるだけ短くしたい場合やバックアップファイルサイズを小さくしたい場合等に増分/差分のバックアップを使います。 #処理時間は10g以前ではあまりあてにできないですけど。 増分/差分バックアップは対象表領域の全体バックアップをリストア後に適用する必要が出てきます(前回のバックアップの差分や増分になるわけですから)。よってリカバリーする時間と手順は増えることになります。

since1983
質問者

補足

自分でも書きながら分かっていない部分があって…。申し訳ありません。 ○許容リカバリ時間について 現時点で詳しいことは分からず、また分かっていても あまり書くのは良くない事なんですが、証券会社の 口座を管理するDBで、口座数は4~5万程度です。 この規模で許容リカバリ時間1時間はきついですか? ○完全回復について 多重化したオンラインREDOの全てがだめになった場合は アーカイブログで戻せる限りのところまで戻す、という つもりでいます。方針として完全回復を目標にする、 ということです。 ○全面障害について メディア障害を含む、とのことです。外部メディアに バックアップ退避~については、2世代は別筐体HDDに、 それより前の1世代はテープに出す、とのことです。 意味がはっきりわかって聞いていたわけではないですが ○リカバリカタログ使用有無 リカバリカタログはRMAN使用時に必要となるものです よね?RMANを使わない、というのは現実的ではありませんか? …結局、週次でオフラインのフルバックアップ取得は 99%決定事項なのですが、日次で何を組み合わせるか、 確たる論拠を持って決めるに至っていません。 皆さんならどのように決めるのでしょうか…?

回答No.1

バックアップとリストアそれぞれに要する時間は? >・リカバリ時間は傷害検知から1時間以内 大規模障害時に、1時間で全リストア及びリカバリ処理が出来るだけの能力があるんですか? そうでなければ、”障害検知から1時間以内”での復旧など無理な話です。 1時間以内を厳守するなら、スタンバイなど他の手段を考える必要が出てくるかと思います。

関連するQ&A