• 締切済み

文字コード変換時の文字化けについて

HP-UX上で、文字コードUTF8のファイルをiconvにてSJISに変換して利用しています。 その際、¥(全角円マーク)、―(全角ダッシュ)、‐(全角ハイフン) などが文字化けしてしまいます。 shell内にて処理できればよいので、iconvでなくても結構ですが、文字化けしない方法をご存じ方がいらっしゃれば教えていただけると幸いです。 よろしくおねがいいたします。

みんなの回答

  • salsberry
  • ベストアンサー率69% (495/711)
回答No.2

> SJISで818F(¥)になってほしいところが、E383BB(・)に化けてしまいます。 それは不思議ですね。 Ubuntu Linuxのiconvでは3文字とも問題なく変換できました。また、nkfでもOKでした。

  • salsberry
  • ベストアンサー率69% (495/711)
回答No.1

HP-UXでのマッピングがどうなっているかは知りませんが、 ・「¥」(UTF8: EF BF A5)がSJISで818Fに ・「―」(UTF8: E2 80 95)がSJISで815Cに ・「‐」(UTF8: E2 80 90)がSJISで815Dに ならないということですか? 誤解を防ぐため、iconvで得られる結果と期待している結果を文字コード付きで示してください。

mya87
質問者

お礼

回答ありがとうございます。またレスが遅れて申し訳ありません。 salsberryさんが書いていただいたとおり、SJISで818F(¥)に なってほしいところが、E383BB(・)に化けてしまいます。 どうやらiconvの制約?のようなので、nkfなど違うコマンドで 実行できないか確認しようと思います。

関連するQ&A