- ベストアンサー
特殊文字のコード番号について
- 特殊文字のコード番号を調べる方法と、特定の文字に対するコード番号の違いについて質問します。
- 特殊文字のコード番号を調べる方法について詳しく説明します。例えば、[ a ] の文字コードは 0061 (16進法)であり、[ ā ] の文字コードは 0101 (16進法)です。
- 特殊文字のコード番号を調べる方法では、一覧表から特定の文字のコード番号を取得しますが、ラテン語などで使われる一部の記号については一覧表に表示されない場合があります。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
それは合字によって実現された文字であり、1文字としてのコードを持っていないからでは? その文字をメモ帳にコピペすると明確になるのですが、その字は「ā」と「'」の2文字に分解されて表示されます。よってWordや文字コード表では、最初の「ā」のコードである0101が表示される…というわけです。つまりこの2つの文字が連続しているときは、そのようにくっつけて表示する仕組みがあるソフトだから、1文字に見えているだけにすぎない。 「ā́」だけをメモ帳にコピペしてセーブし、テキストではなく16進ダンプで表示すると、「FF FE 01 01 01 03」という結果になります。すなわちここからも、1文字ではないことがわかります。 ・はじめの「FF FE」は、Unicodeのバイト並びを指定しているもの(BOM)で、下位・上位の順に並んでいることを意味します。 ・次の「01 01」は、文字「ā」です。 ・最後の「01 03」は、文字「'」です。下位上位の順なので、これはコード0301の意味です。
その他の回答 (1)
合字として扱う組み合わせを知っていれば、表示はできなくても1文字として扱うことは可能ですから、それらのアプリは合字のパターンを知っていると言うことになります。これがアプリ独自判断なのか、OSが提供している機能かは判りませんが、後者かも知れませんね。 ただ、私が合字であると気付いたのは、メモ帳でBackspaceを押したら、アポストロフィだけが消え、āになったからです。しかし合字の部品単体では選択できませんでした。なので、もしひらがなが今のように濁音半濁音でそれぞれ独立した文字コードを持っていなかったとしたら、ひらがなの濁点や半濁点だけが消えるような実装になっていたでしょう。 特殊文字は、どこまでコードを与えるかは難しい問題です。キリがないので。漢字だけでもUnicodeを使い果たしてしまえるので、各国で妥協が生じるのは仕方ありません。
お礼
たびたびのご回答に感謝いたします。 訂正; 前回の補足で、合字の半分だけを消せないと書きましたが、間違いでした。おっしゃる通り、メモ帳で、アポストロフィだけを消すことが出来ました。アポストロフィだけをコピーすることが出来、他の母音と組み合わせて、別の合字も出来ました。 文字を入力すること: ....OS、 ....アプリ(ワード、エクセル、一太郎、メモ帳、秀丸 etc)、 ....文字変換(IME ATOK など)、 ....コード番号、フォント(Times New Roman など)、 ....キーボードなどのハードウェアの機構、 全部関係するのですね。よく考えて、最適な実用上の方法を探します。
補足
randensai2さん 有り難うございます。この様な細かい質問や、特殊な需要に対する質問には どなたも答えて下さらないと半ば諦めておりました。 私のような素人が、ワードのようなアプリケーションを使用するときには、 裏の機構、仕組み、プログラムを考えずに利用しています。 コード番号、フォント(Times New Roman など)程度には頭が行きますが、 それがどのようにして白と黒の点の配置に成るかまでは考えません。 更にその先に、ワードの仕組み、キーボードなどのハードウェアの機構があるのです。 randensai2さんのお答えで、可なりスッキリいたしました。 ==== 【可なり】と条件を附けてごめんなさい。 追加で伺います。 1.メモ帳でも、秀丸でも、そしてこの質問サイトでも、例に挙げた合字は二つに分かれます。しかし、片方だけ消去することは出来ません。二つは糊付けされているのです。何故でしょう。 2.この合字は、ワードでは「ā」の真上にアクセント記号が表示されます。「ā́」をワードの貼り付けてみて下さい。マイクルソフトがこの様な工夫をしたのでしょう。そして、一太郎でも同じように表示がされるのです。私たちユーザーにとって有り難いことです。アプリケーションメーカー同士が相談しているとは思えませんが。 3.この様な文字は、ある分野では頻繁に出てくるのです。言語学の分野では、通常の人は使わないアクセント記号を書くことが多いのです。簡単にキーボードから入力する方法があれば有り難いのですが。(特殊キーを組み合わせた簡易入力方法、あるいはマクロ)