• ベストアンサー

メディアのフォーマットによる文字の認識

メディアのフォーマットによって異なる文字が同じ文字として認識されることがあったようですが、その理由は何でしょうか。 1、OSが大文字と小文字を混同する。 2、シフトJISの持つ根本的な問題。 3、JISコードとシフトJISコードの変換テーブルによる問題。 4、UnicodeとシフトJISの変換テーブルによる問題。 この中に正解はありますでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • harawo
  • ベストアンサー率58% (3742/6450)
回答No.1

Mac OS 標準(HFS)フォーマットではおっしゃることが起きます。 Mac OS 拡張(HFS+)にすると日本語でファイル名を付けてもそういう問題は起きません。 ※Mac OS XはHFS+のみ読み書きできる。HFSは2GB以上のボリュームを扱えない。HFSは時間をローカルで管理するので、インターネットで世界中のサーバーのデータにアクセスできる環境では、問題が起きる。などなど文字コード以外についても、HFSはすでに時代遅れのフォーマットと考えていいでしょう。 HFSは表面上日本語などの2バイト文字を扱えるように見えますが、内部では1バイトとして扱っており、2バイト文字は分割して1バイト文字ふたつと見なしています。これが一点。 もう一点は、Mac OSは大文字と小文字の区別をしないということ。 「HANABI」「hanabi」「Hanabi」どれも同じと見なします。それはMS-DOSでも同じです。つまりWindows OSも大文字と小文字の区別をしません。 ※HFS+は、内部ではUnicodeで処理しており、1バイト文字を2バイトとして扱い、日本語などの2バイト文字をそのまま扱います。 そういうわけで「1、OSが大文字と小文字を混同する。」が正解となるわけですが、混同しているのでなく、区別していないことは誤解のないようお願いします。 ※Mac OS XはUNIXをベースにしているので、大文字と小文字を区別します。

enoran
質問者

お礼

ありがとうございました。混同ではなく、区別していない・・・ですね。 Mac OS Xのことはまだよくわかっていません。勉強します。