• ベストアンサー

常用漢字?でない文字を判定する方法を探しています。

文字コードがUTF8のファイルがあります。 この中に、SJISで表示できない文字があり、常用漢字?でない文字を判定する方法を探しています。 文字コードに詳しい方教えてください。 アルゴリズムは、perlでもCでも構いません。

質問者が選んだベストアンサー

  • ベストアンサー
  • sakusaker7
  • ベストアンサー率62% (800/1280)
回答No.2

UTF-8→SJISで変換できない漢字をチェックしたいということでしょうか。 だとして、 この場合のSJISというのは本当のSJISか、 WindowsやMacの拡張が入ったSJISか あるいはさらに別のものですか? Perlでいうと、Encode::from_toで変換するときに、 変換できない文字をどうするかという指定ができます。 HTML等の数値参照にするとか、Fatal Errorにするとか ゲタ文字(〓)にするとか。 Cだと使用する変換手段にもよるのでなんとも。

その他の回答 (1)

noname#39970
noname#39970
回答No.1

>SJISで表示できない文字があり、 >常用漢字?でない文字を判定する方法 SJISの範囲を調べたいの? 常用漢字を調べたいの? 後者なら一覧を作成して索引として引くしかない http://www.google.co.jp/search?q=%E5%B8%B8%E7%94%A8%E6%BC%A2%E5%AD%97%E5%88%A4%E5%AE%9A&hl=ja&lr=lang_ja の筈・・・

関連するQ&A