締切済み

Unicodeの文字がどれか、調べたいです

2013/05/25 20:26

ある文章をメモ帳で保存しようとしたら「このファイルはANCIテキストファイルで保存すると失われてしまうUnicode形式の文字を含んでいます。Unicodeの情報を保存するには、[文字コード]から[Unicode]を選択してください」と出ました。どれがUnicodeの文字なのかを調べる方法を探しましたが、アテになるのが全くありません。また、「[文字コード]から[Unicode]を選択する」という言葉の意味も分かりません。文字コード表を開きましたが、その後詰まりました。限りなく分かりやすい説明をお願いします！

legbeamedge
お礼率12% (4/33)

Windows 7
回答数3
ありがとう数0

みんなの回答 （3）
専門家の回答

みんなの回答

garamond
ベストアンサー率53% (1119/2111)

2013/05/26 13:39 回答No.3

今後のために回避策の一助になれば：文書作成前に言語バー[ツール]アイコンをクリック＞プロパティ　↓ 【Microsoft **** のプロパティ】 [変換]タブ＞[詳細設定]ボタン　↓ 【変換】変換文字制限「JIS X 0208 文字で構成された単語のみ変換候補に表示する」を選択 [OK]ボタン [OK]ボタンこうしておくと、「おうがい」を変換したときに「鴎外」は出てきますが、「鷗外」は出てきません。「かもめ」を変換しても、「鷗」は出てきません。 ★ただし変換によらず、Unicodeを使ってコード入力したり、ほかで使われているものをコピー＆ペーストした場合にはメモ帳に表示できてしまいます。

vaidurya
ベストアンサー率45% (2714/5983)

2013/05/25 23:09 回答No.2

まぁ、別に、Unicodeで保存した上で nkfとかでシフトJISに変換すればいいんですけどね。 (nkfはUnicodeが無かった時代、ネットでは必須のツールで、MS-DOS版やWindows版もあるはずです) それで、Unicodeの文字があれば、普通に抜け落ちるかあるいは文字化けします。 (文字化けするという変換ソフトを見たことはありませんが) 抜け落ちた箇所が探しにくい場合はシフトJIS化したファイルを、あらためてUnicodeに変換し diffなどのファイル比較ツールで確認すればいいでしょう。 (diffはUNIX系のコマンドですが、対応するWindows用コマンドがあるはずです) diffコマンドでは、以下のように、行単位で違う行を表示します。 (双方の2行目に違いがあると表示されています) $ diff temp.txt temp.s2u 2c2 < 吉野家と言えば、漢字が本来は𠮷野屋で、世に言うつちよしである。 --- > 吉野家と言えば、漢字が本来は野屋で、世に言うつちよしである。こういう特別な事情のある漢字は日本語で多々使われているので知らないうちに使っているようなこともめずらしくは無いと思います。そういう意味では、そろそろシフトJISなんか使わないのが良いんじゃないですか? もともとシフトJISは日本特有のうえに、MacのシフトJISとWindowsのシフトJISには一部食い違う部分があったため、今やMacOSXもLinuxなどもUnicodeが標準。 MS Word文書などは、文字コードの問題は自動的に回避されるのでテキストファイルとして保存されているものを、一括してnkfなどでUnicodeに統一すれば今後、そういったトラブルは避けられるんじゃないかと思います。まぁ、Windowsは使わないので、どこでどう制限が生じるかは知りませんが率先してUnicodeを推進してきたMicrosoftのWindowsがいちばんUnicodeの恩恵を受け難いということは無いと思います。

koi1234
ベストアンサー率53% (1866/3459)

2013/05/25 22:23 回答No.1

>どれがUnicodeの文字なのか通常作成しに開いたコードがそのまま扱われるのではどこかほかのファイルなどからコピー＆ペーストで張り付けた部分がありませんか？その部分が一番怪しいと思います（メモリ操作なので具体的な確認方法は知りません）張り付け元のデータの文字コード調べるしかないかと思いますそういったことを一切していないなら原因は分かりません >「[文字コード]から[Unicode]を選択する」という言葉の意味名前を付けて保存を押すことで文字コードの設定欄が表示されると思いますそこでUnicode選択すればいいかと思います