- 締切済み
Unicodeの文字がどれか、調べたいです
ある文章をメモ帳で保存しようとしたら「このファイルはANCIテキストファイルで保存すると失われてしまうUnicode形式の文字を含んでいます。Unicodeの情報を保存するには、[文字コード]から[Unicode]を選択してください」と出ました。どれがUnicodeの文字なのかを調べる方法を探しましたが、アテになるのが全くありません。また、「[文字コード]から[Unicode]を選択する」という言葉の意味も分かりません。文字コード表を開きましたが、その後詰まりました。 限りなく分かりやすい説明をお願いします!
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- garamond
- ベストアンサー率53% (1119/2111)
今後のために回避策の一助になれば: 文書作成前に 言語バー[ツール]アイコンをクリック>プロパティ ↓ 【Microsoft **** のプロパティ】 [変換]タブ>[詳細設定]ボタン ↓ 【変換】 変換文字制限 「JIS X 0208 文字で構成された単語のみ変換候補に表示する」を選択 [OK]ボタン [OK]ボタン こうしておくと、「おうがい」を変換したときに「鴎外」は出てきますが、「鷗外」は出てきません。 「かもめ」を変換しても、「鷗」は出てきません。 ★ただし変換によらず、Unicodeを使ってコード入力したり、ほかで使われているものをコピー&ペーストした場合にはメモ帳に表示できてしまいます。
- vaidurya
- ベストアンサー率45% (2714/5983)
まぁ、別に、Unicodeで保存した上で nkfとかでシフトJISに変換すればいいんですけどね。 (nkfはUnicodeが無かった時代、ネットでは必須のツールで、MS-DOS版やWindows版もあるはずです) それで、Unicodeの文字があれば、普通に抜け落ちるか あるいは文字化けします。 (文字化けするという変換ソフトを見たことはありませんが) 抜け落ちた箇所が探しにくい場合は シフトJIS化したファイルを、あらためてUnicodeに変換し diffなどのファイル比較ツールで確認すればいいでしょう。 (diffはUNIX系のコマンドですが、対応するWindows用コマンドがあるはずです) diffコマンドでは、以下のように、行単位で違う行を表示します。 (双方の2行目に違いがあると表示されています) $ diff temp.txt temp.s2u 2c2 < 吉野家と言えば、漢字が本来は𠮷野屋で、世に言うつちよしである。 --- > 吉野家と言えば、漢字が本来は野屋で、世に言うつちよしである。 こういう特別な事情のある漢字は日本語で多々使われているので 知らないうちに使っているようなこともめずらしくは無いと思います。 そういう意味では、そろそろシフトJISなんか使わないのが良いんじゃないですか? もともとシフトJISは日本特有のうえに、MacのシフトJISとWindowsのシフトJISには 一部食い違う部分があったため、今やMacOSXもLinuxなどもUnicodeが標準。 MS Word文書などは、文字コードの問題は自動的に回避されるので テキストファイルとして保存されているものを、一括してnkfなどでUnicodeに統一すれば 今後、そういったトラブルは避けられるんじゃないかと思います。 まぁ、Windowsは使わないので、どこでどう制限が生じるかは知りませんが 率先してUnicodeを推進してきたMicrosoftのWindowsが いちばんUnicodeの恩恵を受け難いということは無いと思います。
- koi1234
- ベストアンサー率53% (1866/3459)
>どれがUnicodeの文字なのか 通常作成しに開いたコードがそのまま扱われるのでは どこかほかのファイルなどからコピー&ペーストで 張り付けた部分がありませんか?その部分が一番怪しいと思います (メモリ操作なので 具体的な確認方法は知りません) 張り付け元のデータの文字コード調べるしかないかと思います そういったことを一切していないなら原因は分かりません >「[文字コード]から[Unicode]を選択する」という言葉の意味 名前を付けて保存 を押すことで文字コードの設定欄が表示されると思います そこでUnicode選択すればいいかと思います