• 締切済み

UTF-8が分からなくて困っています。

SJIS → UTF-8形式に変換してデータを伝送したいです。 データの内容は、数字、タブ、改行コード(LF)です。 コードを調べてみたら、文字コードが同じみたいなので、SJISのまま伝送すると正常にファイルを読込むことができないでしょうか? データに付加しなくてはいけないコードなどあるのでしょうか? よくわからず困っています。教えてください、よろしくお願いします。

みんなの回答

noname#140082
noname#140082
回答No.2

数字(全角?)の場合は、0~9は16進数で(EFBC90)~(EFBC99)となります。(3バイト) また、タブは(09),LFは(0A)となります。 ちなみに半角数字であれば、0~9は(30)~(39)となります。 いずれも16進数ですのでお間違いのないように。 また、SJISからEUCなどへの変換は変換ルールで変換できますが、UTF-8に関してすべての文字コードに対応して変換するには、1対1の変換テーブルが必要です。 もし、16進数がわからなければ、UTF-8が表示できるバイナリエディタを使ってご自身で確かめられてはいかがでしょう。 下記、URLのxeditです。

参考URL:
http://www002.upp.so-net.ne.jp/janus/
toratugumi
質問者

お礼

回答ありがとうございます。 お礼が遅くなりすみません。 ファイル作成して確認しました。 詳しく回答していただきありがとうございました。 助かりました。

  • violet430
  • ベストアンサー率36% (27472/75001)
回答No.1

変換したいだけならテキストエディタで読み込んでコードを変更して保存すればできますよ。 EmEditorで可能です。名前を付けて保存する時にコードを選択できます、 http://www.forest.impress.co.jp/lib/offc/document/txteditor/emeditor.html

toratugumi
質問者

補足

ご回答ありがとうございます。 ファイル作ってみました。 また疑問が、、、 コードを変更してファイルを保存するとき、拡張子はそのままでいいのでしょうか?たとえば、csv、dat、txt は別の拡張子に変える必要がありますか? すみません、分かるようでしたら教えてください。