• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:ハッシュ値が一致したデータは完全に同一ですか)

ハッシュ値が一致したデータは完全に同一ですか

このQ&Aのポイント
  • 同じデータからは、必ず同じハッシュ値が求められるが、少しでもデータが異なると違うハッシュ値が算定される、とよく言われますよね。
  • (たとえば50GB級並みの)巨大ファイル2つがあるとします。この2つのファイルは、99.999…%同一ですが、僅か1ビットだけ、どこか違いがあるとします。
  • もし、そうであれば、ハッシュ値が一致したデータは、完全に同一のデータと判断していいのでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
  • angkor_h
  • ベストアンサー率35% (551/1557)
回答No.1

誤り検出の確率(信頼性)の問題です。 「僅か1ビットだけ、どこか違いがあるとします。」と言うのは、場所まで規定すれば同一でしょうが、場所が違えば…数が違えば… 100%一致を目指すには、全く同じデーターを違う経路から入手して、全てのビット照合が必要です。 > (たとえば50GB級並みの)巨大ファイル、HDDをバックアップした際の確認が目的 危険ですね。 小さいファイル単位が集合して50GBであれば、損失はファイル単位に分散されます。 HDDバックアップ(容量が大きい)ならば、複数のHDDにバックアップしたほうが安心(ハッシュ確認も含む)です。 書き込み時の正常確認が、長い時間を於いた後の読み出しの正常を補償するものではありませんので。

gummiis
質問者

お礼

ご回答ありがとうございます。参考になりました。ありがとうございます。

その他の回答 (1)

回答No.2

1ビットの違いなら、違うハッシュになります。 意図的に同じハッシュになるように、数ヶ所を改変すれば、 違うファイルで、同じハッシュができます。 意図的でなければ、その確率をゼロに近くなります。 意図的であれば、インチキハッシュだらけです。

gummiis
質問者

お礼

ご回答ありがとうございます。やはりそうでしたか。安心しました。ありがとうございました。

関連するQ&A