• ベストアンサー

RAID5が理解できない(理論です)

基本情報の勉強中です。 RAIDに関しては余り詳しく突っ込んだ問題は出ないため、 RAID0のストライピング、RAID1のミラーリングぐらいは理解していたつもりなんですが、 RAID5は、「パリティだ」ぐらいにいいかげんにしか知りませんでした。 そこでちょっと調べたんですが、どういうことかどんどんわからなくなってきました。 (1)HDD1台分の容量が減るということ。 パリティも分散されるんですよね?? はじめはパリティように1台使うといわれて、ふむふむ と思っていたんですが、分散記録であれば、1台分丸まる減らなくても、パリティ容量分減るだけなのでは・・・??? それともパリティとはそんなに容量が大きいのでしょうか? HDD3台のときは1台分、4台のときも1台分・・・?? パリティの容量が減るのは何故・・・??? (2)HDD1台が壊れても完全である。 例えば3台だとしたら、 データA、データB、パリティ をそれぞれに書き込みますよね? このときデータBの入ったHDDがこわれた場合、 パリティで復旧しますよね?? データAの場合も同じ・・・。 これって逆にパリティだけでデータA、データBの両方のデータになりうるってことでしょうか? つまりは安全性を無視したら、パリティHDDだけで、通常の2倍の容量を実現できる・・・?????? それとも故障といっても、ちょっと壊れかけ(一部失われたとか?)を想定して「故障」といっているのでしょうか?? とんちんかんな事を聞いているかもしれませんが、 何卒よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#20957
noname#20957
回答No.2

パリティの考え方に関して ブロック長が8bitで4台の場合、データ8bitx3とパリティ8bit(データ8bitx3のXOR演算結果)を4台に書き込むため、 最終的にHD台数-1のデータを格納できますよ、という話。 「パリティと残ったデータから失ったデータを復旧する」のです。 残存データとパリティを使って演算しなければ復号は不可能ですよ。 実際に4台想定でパリティ演算してみれば早いですよw

azicyan
質問者

お礼

>データ8bitx3のXOR演算結果 ああーーー、なるほどーーー(^o^) そう言うことだったんですね! >「パリティと残ったデータから失ったデータを復旧する」 この点をちょっと読み違えていました。A,BのデータでBが壊れた場合、Bの中に残ったデータを使うのかと・・・。 でも壊れたら、データ残るのかな??? なんて考えてしまいました。 わかりました。助かりました!

すると、全ての回答が全文表示されます。

その他の回答 (6)

回答No.7

ちなみにRAIDに関して知識が増えたと思いますので ここいらへんでカキコします。 RAID5では仕様上の欠点である同時に2台以上の HDDが壊れると、復旧どころかファイルシステムが 壊れます。 運用には十分注意してください。

azicyan
質問者

お礼

!!!???!? やはり! ちょっと違和感があったんですよ。 RAID0がストライピングで、分散記録する。 パフォーマンスはあがるが、分散記録なので1台がクラッシュしたらすべてのデータがだめになる・・・。 RAID1はミラーリングだからまた違いますけど、 RAID5になるとまた分散記録するんだ・・・ん・・・? という違和感がありました。 まさにデメリット!ですね!! とてもよくわかりました! 結局は安全性を考えればミラーリングが良いということですね。 ありがとうございました!

すると、全ての回答が全文表示されます。
  • i-q
  • ベストアンサー率28% (989/3465)
回答No.6

 オンボ-ドのRAID機能はRAID5には対応していません、RAIDカードも対応していないものもありますから注意してほしいです。 それとこれは恥ずかしいことですが、当時RAIDカードを買ってきて付けようとしたら、フルサイズ(奥行約31cm )というとても大きなカードでケースには入らなかったです・・・。ケースを買い換える予定はありましたがRAIDが稼動したのはそれから1ヶ月後でした。 今は熱や騒音、休止モードやスタンバイに対応していないことから使用していませんが、自分もお金がたまったら、また挑戦したいと思っています。  下記URLにRAID5対応カードが載ってますが、別にSDRAMメモリ(256MBまで)をつける必要があります。他の製品にはメモリがボード上に搭載されているものもあり、RAID5にはキャッシュが必要でカードの大きさにも注意が必要です。

参考URL:
http://jp.promise.com/product/card_detail_jap.asp?product_id=176#
azicyan
質問者

お礼

体験談をありがとうございます。 そうたやすく導入できるわけではないのですね。 >熱や騒音、休止モードやスタンバイに対応していないことから ムムム。そうなんですね・・・ 僕はやらないと思います(爆 >別にSDRAMメモリ(256MBまで)をつける必要があります うーむ。かなり敷居は高いのですね。 知識として覚えておきます。 とても参考になりました。 ありがとうございました!!!

すると、全ての回答が全文表示されます。
  • i-q
  • ベストアンサー率28% (989/3465)
回答No.5

実際RAID5はすごいですよ。仕組みはもうつかめたと思いますが。自分はRAID5を実際に使っていたので実感しました 。  導入前は漠然とHDDが壊れたら直してくれるんだろうなと思っていましたが、そうではなくデータを常に監視して一部でも壊れてたら直してくれるんです。HDDが100GBや200GBになると、BMP、JPEGなどの画像の色がおかしくなっていたり、壊れて開けなくなる動画などのファイルが発生しますが、RAID5ではそれが起こりません。  実際にファイルが壊れると、起動中でもRAIDボード上のスピーカからビープ音が鳴り復旧中であることを知らせます。復旧中でもHDDにはアクセス可能です。

azicyan
質問者

お礼

そうなんですね! なんとなく仕組みを理解し始めると、 これっていい!!と思うようになり、 自分でも使ってみたいです(*^_^*) で、昨日ぼんやりパーツショップを見ていたら RAID機能付きというのが結構ありました。 RAID5が通常付いているんでしょうか・・・

すると、全ての回答が全文表示されます。
noname#6829
noname#6829
回答No.4

ちょっと初歩的なアプローチで考えてみましょう(^^ パリティ(偶奇性)というのが、ビットデータの検証の手段のひとつとしてよく登場します。これは、決まったビット数のデータを足し合わせた結果の最小桁(1か0のどちらかですね)に対し、それにさらに加えた結果が常に「ある値(0とか1とか決めておきます)」になるように調整する1ビットの値 というデータだ、ということはおわかりと思います。例えば、3ビットのデータに1ビットの偶数パリティ、となっていて、データが「101」だったらパリティは「0」、データが「001」だったらパリティは「1」となりますね。で、この時 (1)データの値のある桁がエラーによってわからなくなったら、残りの桁とパリティ値から逆算で求めることができます:「0x0」となっていて偶数パリティに「0」が記録されていたらxは0。「01y」で偶数パリティが「0」となっていたらyは1ですね。また、データの桁が全部揃っていれば、パリティ情報は損失してもまた計算すればよいだけです。要するに、このシステムでは、一そろいの値の中でどれか1ビットが損失しても、残りが無事なら損失した値を再計算で出せる、という仕組みです。 (2)この例の「データ」と「パリティ値」を、それぞれ別々のディスクに分散したものが RAID-5 と考えればわかりやすいです。つまり、補完用のデータなので、これによって情報量が増えるということはありません。補完用のデータにディスク1台分使うということになるので、有効なデータ容量は残りの台数分しかないわけです(前のビットの例で言えば「000」などの3ビット分がデータ、パリティビットはこれによって決まる値なのでこれ自体はユーザが保存しようとするデータの容量には使えない)。 (3)これだけで、「ディスクどれか1台分のデータが失われても、残りのディスク全部のデータが揃っていれば失われたディスク分のデータは回復できる」システムが完成しますが、RAID-5 では さらにこのパリティデータを1つのディスクにかためて置くのではなく、複数のディスクに一定の割合ずつパリティの置き場所を分散する、という形をとっています。この理由については、いろいろお読みの資料の中に書いてあるのではないかと思います。 がんばって! p(^o^)q

azicyan
質問者

お礼

ご丁寧に畏れ入ります。 やっとわかってきました。 自分の知識がいかに付け焼刃であるかと思うと 恥かしいです。 1台分のパリティという意味がようやくわかりました。 でも、教えていただいてよかったです(*^_^*) ありがとうございました!

すると、全ての回答が全文表示されます。
noname#20957
noname#20957
回答No.3

追記、または蛇足。 >安全性を無視したら、パリティHDDだけで・・・ パリティだけで復号は不可能ですが、そもそもデータの信頼性向上、対障害性能向上の為の技術ですから、データの圧縮伸張技術の方面のお話はRAIDとは混ぜないでしょう。

azicyan
質問者

お礼

手元にあった資料がですね、 図で説明してあったんですが、 AB2つ分のデータがCに入っている? ように見えたんです。 私の理解力も確かに足りないです(恥 ありがとうございました!

すると、全ての回答が全文表示されます。
  • MetalRack
  • ベストアンサー率14% (298/2040)
回答No.1

データA、データB、パリティCとします。 簡単な説明の為に、A+B=Cという論理で構成されるとします。 Aのデータが壊れたら、残っているBとCのデータから C-B=AとしてAが復元できます。 同様にBが壊れたらC-A=Bとして復元。 Cが壊れたらA+B=Cとして夫々のデータを復元できるということです。 そのためには、本来のデータ以外の補正用のデータとして1/3増しになるということです。 これを基に、資料など読めば理解できるのではないでしょうか。

azicyan
質問者

お礼

畏れ入ります。 >Aのデータが壊れたら、残っているBとCのデータから Aのデータの復旧にBのデータも使うのですね! ありがとうございます!

すると、全ての回答が全文表示されます。

関連するQ&A