- ベストアンサー
第1水準、第2水準以外の文字の抽出について
CSV形式のファイルの中に、第1水準、第2水準以外の文字(外字)が使用されているためにあるソフトに落とし込みが出来ません。どの文字が使われているのか特定できません。第1水準、第2水準以外の文字(外字)を抽出・検索する方法を教えてください。できれば、外字を第1水準、第2水準の文字に置き換えます。よろしくお願いします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
外字でしょうか? 外字でしたら、基本的にはそのパソコンのユーザーが独自に登録した文字ですので、登録した本人でなければ分からないと思います。代表的なものとして、上半分が「土」(士でなくて)になった「吉」字などが推測できます。 お尋ねのケースは、いわゆるJIS漢字(第2水準までに規定されている漢字)以外の漢字が使われているらしい、ということではないでしょうか? JISは現在、第4水準までの規定がありますが、第3、第4の漢字はパソコンでは使えません(JISコードなどから呼び出せない、という意味であって、パソコンに表示、印刷などが不可能、と言っているワケではありません)。 さて、仮にその文字が、「産」の上のほうの「ソ」形の部分が「メ」形になった文字と仮定しましょう。この字はJIS(第4まででも)に規定されていませんが、Unicodeで規定されています(Unicode:7522)。同様の文字はほかにも沢山あります。これが、「・」などで表示されてしまっているものと推測します。 「・」を、「.doc」ファイル(WORD)などにコピーしてください。これで「メの産」が確認できるかもしれません。あるいは「・」を選択(反転表示)して、フォントを変更してください。WORDでしたら、初期設定はMS明朝などになっていると思いますが、これを、SimSun、MingLiU、New Batang、Arial Unicode MSなどにすることで、「メの産」に変わるでしょうから、当初の「.csv」ファイルの「・」を「ソの産」に置き換えてください。
その他の回答 (1)
- PrintScree
- ベストアンサー率25% (538/2091)
プログラムや文字コードについてのスキルがどの程度あるか分かりませんので、Windows・S-JISベースで概略だけ。 外字の文字コードはF040から始まります。 複数のフォント毎に外字が割り当てられている場合、内字(S-JIS標準コード)に置き換えるためには、外字ファイル全ての内容を印刷しておかないと把握は不可能です。