締切済み

VC++で日本語(マルチバイト)ファイルの読み込み

2004/03/05 01:29

VC++で日本語(マルチバイト)の文字が含まれているファイルを読み込もうと思っています。例えばunicodeのファイルとして下記の内容があるとして、 11111 abcdef いろはにほへとこのファイルから1文字ずつ読み込みたいのですが、ヘルプで調べたところfgetwc関数でマルチバイトの読み込みができるということを調べました。ファイルのオープンは_wfopenを使用しているのですが、テキストモード・バイナリモードでどちらで開いても、fgetwc関数の戻りはファイルを1byte読んだ結果を返します。半角文字の場合は"1"とか"a"を単純に呼んで、マルチバイト文字であれは"い"とか"ろ"というデータを読み込みたいのですが、どうすればいいでしょうか？

osakana-manbou
お礼率10% (2/19)

C・C++・C#
回答数3
ありがとう数2

みんなの回答 （3）
専門家の回答

みんなの回答

mcWalker
ベストアンサー率69% (27/39)

2004/04/06 23:33 回答No.3

SJIS文字コード表はありませんか。 SJIS文字の第1バイトは、0x81 - 0x9F または、0xE0 - 0xFC, 第2バイトは、0x40 - 0x7E または、0x80 - 0xFC です。因みに、半角カタカナは、0xA1 - 0xDF です。残りは、ASCII で、ANSI の判定関数があります。方眼紙に第1バイトと第2バイトを縦横に書いて、塗りつぶし見てください。尚、読みこんだ1バイトが int に格納される場合、一旦 0xFF でマスクして、上記の定数と比較すると安心です。また、SJIS <-> unicode 変換の API がありますので、 MSDN などで確認されるとよろしいかと思います。

επιστημη（@episteme）
ベストアンサー率46% (546/1184)

2004/03/05 10:41 回答No.2

> では、SJISとかだとマルチバイトなので、半角文字は1byte、全角文字は2byteだと思うので、そのような場合はどうすればいいのでしょうか？まず1byte読めば、それが'半角'か'全角の前半分'かが判別できるはず。後者なら残る1byteを読めばいい。

επιστημη（@episteme）
ベストアンサー率46% (546/1184)

2004/03/05 08:43 回答No.1

UNICODEで書かれたテキスト・ファイルであれば、半角/全角にかかわらずどれも1-word(2byte)なのでなにも考えずに2byteずつ読めばいいはず。

質問者

補足 2004/03/05 09:47

たしかにunicodeなら半角文字もすべて2byteで表現するため、そのまま2byte単位で読み込めばいいですね。では、SJISとかだとマルチバイトなので、半角文字は1byte、全角文字は2byteだと思うので、そのような場合はどうすればいいのでしょうか？

VC++で日本語(マルチバイト)ファイルの読み込み

みんなの回答

補足 2004/03/05 09:47

関連するQ&A

VC++ マルチバイト文字とUniCode文字？？

ファイル読み込みについて

ファイルの入出力でのテキストモードでの変換について

日本語（マルチバイト）でのwordwrap処理

マルチバイトと英語版Windows7

VC++ ファイル読み込み

VB(VBA)で、バイナリデータを使ってテキストファイルを作成したいの

マルチバイト関数の呼び出し方

PHPマルチバイト文字列関数

ファイルの読み込みについて

unicode文字列(日本語)のファイル出力方法

バイナリ

UNICODE対応にするメリットは？

正の実数のみで書かれたバイナリーファイルの読み込み

日本語（2byte文字）の判別方法について【PHP4】

UNICODE文字が書き込めるWriteprivateProfileStringのようなファイルに書き込む関数はないですか？

絶対パスを相対パスに

【ＰＨＰ】常にマルチバイト文字列関数でいいですか？

メモ帳で保存した日本語テキストや日本語XMLをJavaで読込、保存。メモ帳での保存文字コードはなにが推奨されるでしょうか？

VC#で汎用的な関数はどのファイルに書くのですか？

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

VC++で日本語(マルチバイト)ファイルの読み込み

みんなの回答

補足 2004/03/05 09:47

関連するQ&A

VC++ マルチバイト文字とUniCode文字？？

ファイル読み込みについて

ファイルの入出力でのテキスト モードでの変換について

日本語（マルチバイト）でのwordwrap処理

マルチバイトと英語版Windows7

VC++ ファイル読み込み

VB(VBA)で、バイナリデータを使ってテキストファイルを作成したいの

マルチバイト関数の呼び出し方

PHPマルチバイト文字列関数

ファイルの読み込みについて

unicode文字列(日本語)のファイル出力方法

バイナリ

UNICODE対応にするメリットは？

正の実数のみで書かれたバイナリーファイルの読み込み

日本語（2byte文字）の判別方法について【PHP4】

UNICODE文字が書き込めるWriteprivateProfileStringのようなファイルに書き込む関数はないですか？

絶対パスを相対パスに

【ＰＨＰ】常にマルチバイト文字列関数でいいですか？

メモ帳で保存した日本語テキストや日本語XMLをJavaで読込、保存。メモ帳での保存文字コードはなにが推奨されるでしょうか？

VC#で汎用的な関数はどのファイルに書くのですか？

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

ファイルの入出力でのテキストモードでの変換について