• ベストアンサー

文字コードについて(小説サイトを運営しています)

HTML5が正式勧告されたら移行予定のため、文字コードを全てUTF-8に変更しました。 執筆速度が速いため、現在ある200ファイルほどを早めに変えておこうと思い、変えたのですが(Shift_JISは非推奨ですし、大手小説サイトの文字コードもUTF-8という理由です) スクリプトなど組み込むつもりのないテキストのみのサイトです。 今、悩んでおります。この場合、将来性を考慮した上で(Shift_JISが廃れてゆく可能性)どちらの文字コードにすべきでしょうか? 一部のページに環境依存文字を使用してあるだけです。 当方はHTMLの勉強中の作家です。現在、文字化け対策で悩んでおります。

質問者が選んだベストアンサー

  • ベストアンサー
noname#140045
noname#140045
回答No.2

HTML5だけでなく、時代はShift-JISやEUCに逆戻りすることはありませんから、もうUTF-8に変換したのならば、それをアップすればいいと思いますが、何か問題でもあるのでしょうか。

noname#226929
質問者

お礼

いえ…、日本語(たまに英単語も)のみのページUTF-8を使用することの是非について悩んでおります。 確かにドイツ語や環境依存文字を使用しているページもあります(UTF-8にすることにより正常に表示されるようになりました(全てアップロード済みです)。 Shift-JISから文字コードを変更するに当たり、私の周りのWebに携わる人に意見を聞いたところ、皆さん「UTF-8ねぇ…。Shift-JISのほうが…」と、あまり良い反応が返って来なかったことが少々気にはなりましたが、マイクロソフト社のHP然り、けっこうUTF-8のところが目立ち、ひょっとしてこれからはUTF-8が主流になるのでは?と判断してUTF-8に変更してから2ヶ月目ですが、特に文字化け等は起こっていないです。 それとこれだけグローバルな社会になってきておりますし…。 ただ、(記号は除いて)日本語のみのページもUTF-8で統一することにより、何か不都合はあるのか。それが気になってJISに戻すべきか悩んでおりました。 逆戻りすることはないんですね!安心しました(文字コード一括変換ソフトを使うと全ページが文字化けしてしまうため、手作業で変更したので、もし戻すのならば、ファイル数が膨大になる前に戻したほうが良いので検索をかけては悩んでおりました)。

その他の回答 (2)

  • Chaire
  • ベストアンサー率60% (79/130)
回答No.3

はっきり申し上げますが、馬鹿げています。 > Shift_JISは非推奨ですし そのような事実はありません。そもそも、XML が UTF-8/16 をデフォルト文字コードにしたのは、Unicode を経由することによって「全ての文字コード」を許容するため、もっと言えばページ制作者が文字コードで悩まないようにするためです。HTML5 もその流れに沿い「全ての文字コード」を許容します。 プログラマにとっては、Shift_JIS で多少の問題があるのは周知の通りです。ですが、質問者ご自身はページをプログラム処理する予定がないとのことですから、何の関係もありません。 もちろん、これから書くページはプログラムしやすく多国語文字も使える UTF-8 にする、という方針はアリです。しかし、それに合わせて過去の全てのページの文字コードを変更するのは、「制作者が文字コードで悩まないようにする」という XML の精神に反していますし、HTML5 とも無関係です。それは、単純に「統一されてないと気が済まない」という気持ちの問題でしかありません。 また、前回 <meta charset> に関して質問されていますが、これももともと  Content-Type: text/html; charset=Shift_JIS という HTTP ヘッダの代わりに、HTML 文書の方に  <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> と書いても良い、という HTML 4.0 規定がもとになっています。ところが、これを  <meta http-equiv=Content-Type content=text/html; charset=Shift_JIS> のように誤って引用符を消してしまう制作者・ツールがあり、このためブラウザは昔から、あたかも「charset 属性」なるものがあるかのように処理してきたのです。ならば、いっそのことこの「charset 属性」を標準化してしまおう、というのが HTML5 の  <meta charset=Shift_JIS> につながります。 要するに、この書式はもともと「記述ミスの救済措置」だったのです。HTML5 規定には「短いからもうこっちを使っちゃいなよ」と書かれていますが、当然ながらもともとの「正式な」記述も受け付けます。なぜ、もともと正しく書かれていたものを「記述ミスの救済措置」に合わせて修正する必要がありますか。 HTML5 の主眼は、過去に制作された Web ページの活用にあります。それは古い規格もそうですし、HTML として間違いだらけのものも、WWW ができて十数年に蓄積されたもの全てを、です。その方向性・方法論の善し悪しを論じることはしませんが、少なくとも、HTML5 規格が「古いページもそのまま残せるよう」に知恵を絞っているのに、いちいち古いページを直すのは、HTML5 の方針そのものを否定しているのではないですか。カタチだけ HTML5 になっても、虚しいだけでしょう。 作家さんであれば、むしろ要素タイプの意味論、例えば HTML5 における「段落」とは何か(これは HTML5 規定で定義されています)、見出しと結び付いて文章のアウトラインを構築する section 要素、場面転換の hr 要素、語句に様々なニュアンスを添えるフレーズ要素などをきちんと使うことの方が先決ではないでしょうか。ひとりよがりのマークアップでは「伝える」ことが難しくなります。

noname#226929
質問者

お礼

ありがとうございます。…すみません、勘違いしておりました。「推奨されていないけれど非推奨というほどでもない」という認識で宜しいのでしょうか。 HTML5のタグの本を買って勉強しておりますが、ブラウザが対応していないことなどから「現時点でタグを取り入れるのはまだ早い」と思い、余裕があるときに移行準備を進めていたところです。 確かに文字コードの変更によりファイルのサイズは大きくなりましたけれど、JISでは表示されなかった部分も表示されるようになりましたし。 外部CSSをUTF-8にしてあります。 それと先月から勉強し始めた ひよっこの私にもう少し分かりやすく説明してくだされば幸いでした(前回)。

回答No.1

こんなこと言ったら、怒られてしまうかもしれませんが、小説を公開するなら、PDFがいいのではないかと。

noname#226929
質問者

お礼

ありがとうございます。 ケータイからも閲覧できるようWebで公開しているため、PDFでは困るんです。

関連するQ&A