• ベストアンサー

「"」、「&」が文字化けしてしまいます

「"」が&quot、「&」が&ampに文字化けしてしまいます。 ネットの小説をテキストファイル(UTF-8)に変換してダウンロードしたのですが、ファイルを開くと上記のような状態になってしまいました。 HTMLのことや文字コードのこと、メタ文字やエスケープのことも調べたのですが、いまひとつ理解できません。他の部分は普通に読めるので、「"」、「&」だけを変換したいのですが、そういうことができるソフトや方法はないでしょうか。 アドバイスよろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

これを文字化けと言っていいものかどうかの問題はありますが、 UTF-8とアスキーコード(ASCIIコード)の関係を調べると 何故そのようなことになったのかが分かると思います。 ここで説明を始めるととんでもない文字数になってしまいそうなので、 時間のある時にご自分で調べてみてください。 ところで、ダウンロードしたファイルがテキストファイルなのですから、 そのファイルはワードパッドのようなソフトで開くことができますよね。 であれば、そのソフトの置換機能を使って置き換えてしまえばよいの ではないでしょうか。 ワードパッドを例にとりますと、 メニューの〔編集〕→〔置換〕で、検索する文字列に「&quot」を、 置換後の文字列に「&」を入れて〔すべて置換〕にします。 もう1つのほうも同様に処理すれば簡単に修正できるでしょう。 これはワープロソフトでの基本的な編集方法です。 以上、ご参考になれば幸いです。

その他の回答 (1)

  • bardfish
  • ベストアンサー率28% (5029/17766)
回答No.2

ダウンロードしたテキストはエンコード前のソース。UTF-8とかS-JISとかの文字コードとは基本的に無関係です。 HTMLでは使えない文字が幾つかあり、そのひとつが「~」や「&」です。 構文や文法などの解釈の都合ですから&ampという代替え単語をHTMLの予約語として使用しています。 で、&quotを~に、&ampを&に変換するにはテキストエディタの置き換え機能を使います。 Windowsなら最初から入っているメモ帳でもできますよ。 メモ帳じゃなくてもワープロソフトでも可能です。

関連するQ&A