- ベストアンサー
テキストエディターに表示ができない特殊な文字
- HTMLの文字列をテキストエディターに貼り付けると、特殊な文字が表示できないことがあります。
- 特殊な文字の正体やその表示方法についての具体的な情報が見つからないため、質問させていただきます。
- インターネットブラウザーやMicrosoft Wordでは表示できるのに、テキストエディターで表示できない理由が知りたいです。
- みんなの回答 (11)
- 専門家の回答
質問者が選んだベストアンサー
ANo.1です。 >TeraPad >オプション > 文字コード >初期文字コード: UTF-8 >保存文字コード: UTF-8 >というか、だったら、これらの設定は >いったい何なのでしょうか。 その場合の初期文字コードというのはTeraPadで文書作成する際に初期文字コードをUTF-8にしておくということのはずですし、保存についてもTeraPadで保存する際にデフォルトでUTF-8にするという設定項目ですよね。 今回のような質問の場合、どこかの誰かがどんな文字コードで作成したか判らない文書をどの文字コードで「解釈」するか?という設定を見る必要があるわけで・・・ TeraPadの場合、オプション設定で「文字コード/改行コードを自動認識する」という設定があるようです。このあたりを確認してみてはどうですか? 因みに… ブラウザはそのWebページがどんなHTML(またはXMLとか)のバージョンと文字コードで作成されているかをヘッダー情報から判断しそれによってソースを解釈して表示させますので、今回の質問で提示されたページならHTML4.01 Transitional で文字コードがUTF-8(charset=utf-8)となっていることを判断し、解釈できるブラウザなら(大抵はそうですが)当然文字化けはしません。 ただテキストエディター側ではブラウザが表示させた結果の文字がどの文字コードで書かれたものかを自動的に判断出来なければ結果として文字化けするということでしょう。 なお、今回のような質問の回答に対するヒントを検索するなら「発音記号 テキストエディター」いったキーワードのほうがヒットしやすいかと思いますよ。
その他の回答 (10)
- Safe_Mode
- ベストアンサー率48% (1329/2725)
>「コピペしているときに、ユーザーが気づかないだけで、 >文字コード情報も Windows OS が こっそりコピペしている」 >ということでしょう。 そうですね。OS側では文字コード情報もコピーしているはずです。 >TeraPad や VxEditor は、それを読み取る能力がない、 >にもかかわらず、設定には読み取れるかのような状態を >維持している。つまり不具合である、と想定されます。 提示されたURLのHTMLソースを見れば判りますが、「ǽ」については「ǽ」となっています。 ご存じだと思いますが、Webページ上で発音記号のような特殊文字を表示させるにはその特殊文字に対応したコード表に従って表記するので「ǽ」を表示させるならHTMLのソース上では「ǽ」と表記するわけですよね。 TeraPadをインストールして提示されたURLのHTMLソースを読み込んでみましたがちゃんと「ǽ」として表示されてましたので、文字コード情報を読み込んで表示させていることになるといえるでしょう。 TeraPadや秀丸エディター等はphpやHTMLの編集・作成に用いられる訳で、その際には特殊文字をそのまま表示してしまうと却って不具合なこととなるのを考えているのかもしれません。 このあたりは作者に直接問い合わせてみるのもありかと思います。
- ORUKA1951
- ベストアンサー率45% (5062/11036)
No.6,7,8です。 OS(Windows)自体は、文字コードを読取ると、それをテキストエディタに貼り付けるときにそれを利用します。 ※ただ、テキストエディタでフォントの指定をそのキャラクターを持っていないフォントセットにしていると文字を表示することが出来ません。 ⓵(晴)✄➀〠¼ これらの文字を、テキストエディタのフォントを拡張していないMSP明朝では表示できない・・ いまどき、内部処理にUTF-8を使っていないアプリケーションは少ないと思います。
- ORUKA1951
- ベストアンサー率45% (5062/11036)
>というか、だったら、これらの設定は いったい何なのでしょうか。 なんなんでしょうね、--製作者に聞いてみないとわからない。 どのブラウザでも同じ結果になると言うことは、すくなくともシステム上はちゃんとUNICODEで受け渡しされている。 それをアプリケーションが受け取る時に、旨くいってない。
- ORUKA1951
- ベストアンサー率45% (5062/11036)
他のテキストエディタはわかりませんが・・ ひょっとして新規作成時の初期設定の文字コードがShift_JISになっているのでは?? EmEditorの場合、システムに指定しておけば、unicodeがデフォルトになる。 XP以降のWindowsはUNICODEですから・・
補足
かいとうをありがとうございます。 以下の設定に変更後、エディターを再起動して試しましたが、不具合は変化しませんでした。 VxEditor 共通の設定 > 文字コード > 初期文字コード: UTF-8 TeraPad オプション > 文字コード 初期文字コード: UTF-8 保存文字コード: UTF-8 というか、だったら、これらの設定は いったい何なのでしょうか。
- ORUKA1951
- ベストアンサー率45% (5062/11036)
テキストエディタの問題だと思いますが??? 普通にテキストエディタ(EmEditor -- http://jp.emeditor.com/ )に、何の特段の処理しなくても添付図のようにコピーペーストできます。タスクバーのアイコンを左クリックすと貼り付けて起動する。ついで他のテキストもコピーペースト。いずれでも ためしに、その文字を選択して、表示メニューから「文字コード表示」でU+01FD も表示されます。 保存時の文字コードをShift_JISなどに指定すると、「この文字コードでは保存できない文字がある」と指摘されますが・・
補足
かいとうをありがとうございます。 やはり不具合はテキスト エディターに依存するのですね。知りたいのは、おもに以下のことです。 ・なぜテキスト エディターにより不具合が発生する場合があるのか? 必要最小限の機能しかない「メモ帳」でさえ、せいじょうに貼り付けられるのに、なぜ一部のテキスト エディターは不具合を発生させるのか? メモ帳以下の性能ということか? ・数多く存在するテキスト エディターのうち、どのくらいの割合で、この不具合は発生するのか? 有名なテキスト エディターでさえ、この不具合を発生させているということは、ほとんどで不具合は発生する?
- Kaneyan-R
- ベストアンサー率42% (1340/3126)
>文字コードとは無関係に見えます。 >メモ帳に張り付けたところ、確かに文字化け しませんでした。 >しかし、VxEditor、TeraPad だと文字化け しました。 >設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。 貼り付けた後に変更しても意味がありません。 貼り付けた時点でsjisになっています。 Windows 7の標準入出力表示は、厳密には「Windows code page 932(cp932)」です。 ただ、Shift-JISと同じなので普通はShift-JISと言ってますが。
補足
かいとうをありがとうございます。 貼り付けた後に変更した場合、貼り付ける前に変更する場合、両方とも試しました。そのほか、いろいろと試しましたが全滅です。
- torayoshi
- ベストアンサー率62% (910/1449)
「VxEditor」を例に。 VxEditorのヘルプに、 「VxEditorは内部ではShiftJISで文字列を扱っているため、ShiftJISにない文字は扱えません。」 とあります。 このへんが関係してるのでは? エディターソフトに依存するってことでしょう。
- sandy_7729
- ベストアンサー率26% (175/670)
発音記号の正式名称は 国際音声記号(IPA=International Phonetic Alphabet)です。 今試してみたけれどFirefox→Terapadでも文字化けしやした。 ただwin7の標準メモ帳は読み込めましたね。 unicodeとshiftjisしか読めないのにメモ帳はおkでテキストエディタはNG という事になると 収録されている文字列に存在しない記号は「?」と表記されているのではないでしょうか? あくまで憶測ですけれど。
補足
回答をありがとうございます。 文字コードとは無関係に見えます。私の環境は Windows 7 です。メモ帳に張り付けたところ、確かに文字化け しませんでした。しかし、VxEditor、TeraPad だと文字化け しました。設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。仮に文字コードが関係しているのであれば、ウェブ サイトと同じ UTF-8 に設定したじてんで正しく表示されるはずです。そうでないということは、文字コード以外の何らかの理由に依存していると想定されます。
- AsarKingChang
- ベストアンサー率46% (3467/7474)
回答からは、外れますが、 今、Windows7のメモ帳にコピペしたところ 正しく表示できたので、 おそらくUTF-8ではないかと、推測しています。 お持ちの、テキスト エディター をUTF-8モードにしてから、貼り付けてみても ダメですか?
補足
回答をありがとうございます。 文字コードとは無関係に見えます。私の環境は Windows 7 です。メモ帳に張り付けたところ、確かに文字化け しませんでした。しかし、VxEditor、TeraPad だと文字化け しました。設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。仮に文字コードが関係しているのであれば、ウェブ サイトと同じ UTF-8 に設定したじてんで正しく表示されるはずです。そうでないということは、文字コード以外の何らかの理由に依存していると想定されます。
- Safe_Mode
- ベストアンサー率48% (1329/2725)
少なくともWindows8上のメモ帳では普通にコピー出来ますけど。 UTF-8が扱えるテキストエディターならOKだと思いますが。
補足
回答をありがとうございます。 文字コードとは無関係に見えます。私の環境は Windows 7 です。メモ帳に張り付けたところ、確かに文字化け しませんでした。しかし、VxEditor、TeraPad だと文字化け しました。設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。仮に文字コードが関係しているのであれば、ウェブ サイトと同じ UTF-8 に設定したじてんで正しく表示されるはずです。そうでないということは、文字コード以外の何らかの理由に依存していると想定されます。
お礼
有力な情報が得られないので、これで終了します。回答してくださった皆さん、ありがとうございます。
補足
かいとうをありがとうございます。 >TeraPadの場合、オプション設定で「文字コード/改行コードを自動認識する」という設定があるようです。このあたりを確認してみてはどうですか? はい、その設定も実行しました。その設定が有効の場合、無効の場合、両方とも試しました。また、考えられる限りの類似設定の全部は実行しました。それでも不可能でした。 >ただテキストエディター側ではブラウザが表示させた結果の文字がどの文字コードで書かれたものかを自動的に判断出来なければ結果として文字化けするということでしょう。 それは、確かに、ヘッダー情報がない限り、そのとおりだと おもいます。言い換えれば、こうなります。 「全部のテキスト エディターは、ヘッダー情報のない全部のコピペは、文字化けする。」 これは現実矛盾です。実際に、メモ帳はコピペだけで文字コードを判別できてしまいます。一方、「本当にコピペした文字情報だけで判断できる」のであれば、ヘッダー情報が完全な冗長情報に なってしまいます。ゆえに、ヘッダーの文字コード情報は世界中から消滅していなければ不自然です。 ということは、これらの矛盾全部を合理的に説明できる手段は1つだけです。「コピペしているときに、ユーザーが気づかないだけで、文字コード情報も Windows OS が こっそりコピペしている」ということでしょう。そう考えなければ不自然です。そして、TeraPad や VxEditor は、それを読み取る能力がない、にもかかわらず、設定には読み取れるかのような状態を維持している。つまり不具合である、と想定されます。この解釈いがいだと、絶対に現実矛盾が発生します。私の認識に間違いがあれば、指摘してください。