• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:javaで作るwebアプリで扱う文字コード(日本語)について)

javaで作るwebアプリで扱う文字コード(日本語)について

このQ&Aのポイント
  • javaで作るごく普通のwebアプリで扱う文字コード(日本語)についての質問です。
  • javaのデフォルト文字コードはUTF-8等だそうですが、クライアントがLinuxマシンの場合、入力テキストファイルはEUC-JPであることが想定されます。
  • 質問は、EUC-JPのテキストからUTF-8への変換がJVMによって自動的に行われるかどうか、およびクライアントのOSのデフォルトの文字コードをUTF-8に変更する必要があるかどうかについてです。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

 Bruce Eckel, "Thinking in Java (4th Edition)" (Prentice Hall, 2006) によると、p.922~p.923に、次のようにあります。 Java 1.1 made some significant modifications to the fundamental I/O stream library. When you see the Reader and Writer classes, your first thought (like mine) might be that these were meant to replace the InputStream and OutputStream classes. But that’s not the case. Although some aspects of the original streams library are deprecated (if you use them you will receive a warning from the compiler), the InputStream and OutputStream classes still provide valuable functionality in the form of byte-oriented I/O, whereas the Reader and Writer classes provide Unicode-compliant, character-based I/O. In addition: 1. Java 1.1 added new classes into the InputStream and OutputStream hierarchy, so it’s obvious those hierarchies weren’t being replaced. 2. There are times when you must use classes from the “byte” hierarchy in combination with classes in the “character” hierarchy. To accomplish this, there are “adapter” classes: InputStreamReader converts an InputStream to a Reader and OutputStreamWriter converts an OutputStream to a Writer. The most important reason for the Reader and Writer hierachies is for internationalization. The old I/O stream hierarchy supports only 8-bit byte streams and doesn't handle the 16-bit Unicode characters well. Since Unicode is used for internationalization (and Java's native char is 16-bit Unicode), the Reader and Writer hierarchies were added to support Unicode in all I/O operations. In addition, the new libraries are designed for faster operations than the old. >Linuxマシンの時は、入力テキストファイルは普通、EUC-JPと思います。 私の環境ではUTF-8です。 >関連する他のアプリケーションやミドルウェア >がUTF-8で動作するのかの検証は必要ないですよね? あります。(レガシーなものを使う場合等)  もっとも、こういう文字コードの問題を解決するためにUnicodeが多くの方々の多大の努力によって開発されたにも関わらず、未だにUnicodeを使わずに、単にWindowsマシンだというだけで、ShiftJISを使う人が未だにあとをたたないのは、全くはた迷惑な話で、改善していって欲しいもんです。

aneja
質問者

お礼

お礼が遅くなって、大変申し訳ありませんでした。ご回答、どうもありがとうございました。 Linuxマシンは最近はUTF-8になっているのですね。自分が使っていたものが古かったです。

その他の回答 (1)

  • askaaska
  • ベストアンサー率35% (1455/4149)
回答No.1

1. 自動では、やってくれないわ。 一般的にはファイルを読み込むStreamに指定するのよ。 2. コード内で処理できるから わざわざOSの設定をいぢる必要はないわ。 でも他のミドルウェアと連携する場合は きちんとテストしてね。 作り手として当然の作業だわ。

aneja
質問者

お礼

こんにちは。ご回答ありがとうございます。 InputStreamReader とかで文字コードを指定すればいいんですね。 自分で調べるヒントをいただけました。ありがとうございました。

関連するQ&A