ベストアンサー

第1水準、第2水準以外の文字の抽出について

2006/07/07 12:26

CSV形式のファイルの中に、第1水準、第2水準以外の文字（外字）が使用されているためにあるソフトに落とし込みが出来ません。どの文字が使われているのか特定できません。第1水準、第2水準以外の文字（外字）を抽出・検索する方法を教えてください。できれば、外字を第1水準、第2水準の文字に置き換えます。よろしくお願いします。

y3640006
お礼率59% (13/22)

オフィス系ソフト
回答数2
ありがとう数0

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

ChM
ベストアンサー率56% (875/1559)

2006/07/11 10:11 回答No.2

外字でしょうか？外字でしたら、基本的にはそのパソコンのユーザーが独自に登録した文字ですので、登録した本人でなければ分からないと思います。代表的なものとして、上半分が「土」(士でなくて)になった「吉」字などが推測できます。お尋ねのケースは、いわゆるJIS漢字(第２水準までに規定されている漢字)以外の漢字が使われているらしい、ということではないでしょうか？ JISは現在、第４水準までの規定がありますが、第３、第４の漢字はパソコンでは使えません(JISコードなどから呼び出せない、という意味であって、パソコンに表示、印刷などが不可能、と言っているワケではありません)。さて、仮にその文字が、「産」の上のほうの「ソ」形の部分が「メ」形になった文字と仮定しましょう。この字はJIS(第４まででも)に規定されていませんが、Unicodeで規定されています(Unicode：7522)。同様の文字はほかにも沢山あります。これが、「・」などで表示されてしまっているものと推測します。「・」を、「.doc」ファイル(WORD)などにコピーしてください。これで「メの産」が確認できるかもしれません。あるいは「・」を選択(反転表示)して、フォントを変更してください。WORDでしたら、初期設定はMS明朝などになっていると思いますが、これを、SimSun、MingLiU、New Batang、Arial Unicode MSなどにすることで、「メの産」に変わるでしょうから、当初の「.csv」ファイルの「・」を「ソの産」に置き換えてください。

その他の回答 (1)

PrintScree
ベストアンサー率25% (538/2091)

2006/07/07 12:52 回答No.1

プログラムや文字コードについてのスキルがどの程度あるか分かりませんので、Windows・S-JISベースで概略だけ。外字の文字コードはF040から始まります。複数のフォント毎に外字が割り当てられている場合、内字(S-JIS標準コード)に置き換えるためには、外字ファイル全ての内容を印刷しておかないと把握は不可能です。