- ベストアンサー
昔のサイトで文字化けしている文章の文字種と解読方法について知りたい
- 昔のサイトで文字化けしている文章がありますが、文字種が特定できず解読方法がわかりません。エンコードされている可能性もありますが、詳細は分かりません。
- 昔のサイトで文字化けしている文章を読みたいのですが、文字種が特定できず解読できません。エンコードされている可能性も考えられます。
- 昔のサイトで文字化けしている文章がありますが、何の文字種かわかりません。エンコードされている可能性もあるので、詳しい方に回答をお願いします。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
一見してShift_JISからLatin-1(別名: Windows1252、ISO-8859-1、西欧)への文字化けとわかりますが、 文字コードを変えても読めないというところからするに、 「文字化けした文字列を別の文字コードで保存してしまった」状況と考えられます。 こうなると完全な復元は不可能です。 部分的な復元でよければ、その文字列をコピーし、保存時に文字コードが選べるテキストエディタでLatin-1として保存し、そのファイルをShift_JISで開けば読めるでしょう。 例えばお示しの文は 「いつまでこのペ?[ジが続くの?H?@なんて思ってた・なたの」 と復元できます。
その他の回答 (3)
- nitto3
- ベストアンサー率21% (2656/12205)
メモ帳で開けばいいです。
- coai
- ベストアンサー率50% (152/301)
>詳細は全く分かっておりません わざわざ、詳細なんか調べなくても、読めるようになればいいんでしょ? メニューから「文字エンコーディング」を選んで、その中にある「日本語(○○)」ってのを、かたっぱしから試してみればいい。 自動判別で失敗(文字化け)してるんだから、自動じゃなくて手動で指定してやればいいってこと。 >エンコード出来た人はいるらしいので解読不可能ということはないのでしょうが…… という事なので、おそらくどれかで当たる。 当たって読めるようになれば、「ああ、このサイトの文字コードは○○だったんだな」と判るけど、そんなの別に忘れてしまっても構わない。 再度そのサイトを読む際に、またかたっぱしから試みても大した手間ではない。
補足
文字エンコーディングも言語関係なく片っ端から試してみたのですがどれも駄目でした…… WeybackMachine(http://archive.org/web/)で保存されたサイトであることが何か関係しているのでしょうか? それと関係あるのかは分かりませんが、一部の文字は文字エンコーディング指定無しで読めます。
- Kaneyan-R
- ベストアンサー率42% (1340/3127)
日本語のサイトなら、「シフトJIS(≒Windows CP932)」か「EUC(euc-jp)」か「Unicode(UTF-8)」のいずれか。 「JIS(ISO-2022-JP)」ってこともあるかもしれないけど、大抵OS標準の文字コード使うだろうから、「sjis」か「euc-jp」。 ブログ等、公のサービスとかなら「euc-jp」。 ここ10年くらいならグローバル対応で「UTF-8」の場合もある。 エンコードタイプを変えれば、普通に読めるはずですが? そのサイトのURLを開示すれば、回答する側で、簡単に確認できるんですけどね。
お礼
試してみたところ仰るとおり完全な復元は無理でしたが読むには読めました! 内容がある程度分かれば十分なのでこれで満足です! ありがとうございました!