• 締切済み

:HTMLを取得すると文字化けしてしまう・・・

ASP.NET C#.NETにて「URL」を入れ実行すると そのHPのHTMLを取得してブラウザ内テキストボックスに表示するPGM なのですが、2バイト文字部分が化けて仕舞います。 エンコードの問題だと思うのですが、ご存じの方御願いします。

みんなの回答

  • bikkuri
  • ベストアンサー率33% (23/68)
回答No.2

日本語部分の文字コードがsjisじゃないので化けていると思います。 日本語のWEPページは、通常sjis,euc,jisなどの文字コードが使われています。 これらはWEBサーバーのOSによる傾向がありますが、 文字コードはページの作成者が自由に決められますから、 あてにできません(というかOSはわからないと思う) HTML内に、文字コードを指定する記述があるのもありますが、 基本的に文字コードの自動判定と変換が必要でしょう。 文字コードの判定と変換をするモジュールやライブラリ を探しましょう WEBブラウザも自動判定していますが、たまに間違うので 完全に判定するのは難しいです。

  • honnsuki
  • ベストアンサー率18% (62/329)
回答No.1

リナックス、UNIXはEUCにしないと、うまく行かないと聞いたことがありますが、あまり詳しくないので。

関連するQ&A