- 締切済み
:HTMLを取得すると文字化けしてしまう・・・
ASP.NET C#.NETにて「URL」を入れ実行すると そのHPのHTMLを取得してブラウザ内テキストボックスに表示するPGM なのですが、2バイト文字部分が化けて仕舞います。 エンコードの問題だと思うのですが、ご存じの方御願いします。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- bikkuri
- ベストアンサー率33% (23/68)
回答No.2
日本語部分の文字コードがsjisじゃないので化けていると思います。 日本語のWEPページは、通常sjis,euc,jisなどの文字コードが使われています。 これらはWEBサーバーのOSによる傾向がありますが、 文字コードはページの作成者が自由に決められますから、 あてにできません(というかOSはわからないと思う) HTML内に、文字コードを指定する記述があるのもありますが、 基本的に文字コードの自動判定と変換が必要でしょう。 文字コードの判定と変換をするモジュールやライブラリ を探しましょう WEBブラウザも自動判定していますが、たまに間違うので 完全に判定するのは難しいです。
- honnsuki
- ベストアンサー率18% (62/329)
回答No.1
リナックス、UNIXはEUCにしないと、うまく行かないと聞いたことがありますが、あまり詳しくないので。