ベストアンサー

ファイルの文字コードを調べたい

2007/03/12 16:28

お世話になります。現在PHPでテキストファイルの文字コードを調べる関数を作っています。流れは 1 テキストファイルのパスをわたす 2 ファイルがあれば開いて最初の１行を読む 3 mb_detect_encoding関数でその文字列を調べて返すという順なのですが mb_detect_encodingで何をおくってもASCIIとしかならず不思議に思い質問させていただきましたもしかしてmb_detect_encodingには日本語を渡さないと autoの場合すべてASCIIで返ってくるのでしょうか？ auto時の調べる順番がASCIIが一番上になっているためですか？また、ファイルの文字コードを調べるのにもっと良いほうほうがあれば教えていただけないでしょうか？よろしくお願いいたします。

can5974
お礼率81% (18/22)

PHP
回答数2
ありがとう数1

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

chie65536
ベストアンサー率41% (2512/6032)

2007/03/12 16:45 回答No.2

「最初の１行目は空行だったり、２バイト文字が入っていない行」というケースが多いですが、そういう事はありませんか？「空行や２バイト文字が入っていない行は無視して、そうじゃない行の判定結果を最終的な結果として返す」必要があるのではないでしょうか？むろん「空行や２バイト文字が入っていない行しか無かった。２バイト文字が１つも無い」と言う時もあるでしょう。 1 テキストファイルのパスをわたす 2 ファイルがあれば開く 3 １行読む 4 ファイルが尽きていて読めなかったらASCIIを結果として返す 5 mb_detect_encoding関数でその文字列を調べる 6 結果がASCII以外なら、それを最終結果として返す 7 3から繰り返す

質問者

補足 2007/03/13 09:05

返信ありがとうございます 2バイト文字のみで判定しなければいけないということですね記述していただいた順で作成したいと思いますありがとうございました

その他の回答 (1)

maura
ベストアンサー率46% (48/104)

2007/03/12 16:42 回答No.1

半角英数字を　mb_detect_encoding　に渡すとどんな文字コードであってもASCIIとなるからではないでしょうか？文字コードを調べるコマンド $ kcc -c tmp1.txt $ nkf --guess /test.txt

質問者

お礼 2007/03/13 09:05

返信ありがとうございます。やはり半角英数の場合はASCIIが返ってくるのですね・・・ファイル内のすべての文字が半角英数の場合は判定不可能となるわけですかありがとうございました

ファイルの文字コードを調べたい

質問者が選んだベストアンサー

補足 2007/03/13 09:05

その他の回答 (1)

お礼 2007/03/13 09:05

関連するQ&A

文字コードを検出し、ほかのコードに変更するスクリプトについて

ASCII文字列をEUCなどに変換したいができない

文字コードの検出が正しいかを検証する方法

文字コードについて

phpでの文字コード変換について

IMAP関数で取得した文字列の、文字コード変更について

文字コード変換

2バイト文字をASCIIコードに変換

mb_detect_encoding()関数について

ASCII文字列のgrep

CSVファイルの文字コード変換について

visual c++の文字コード判別

PHP関数mb_send_mailで送信すると件名が文字化けしてしまいます。

ファイルの文字コードを調べるには？(php)

文字コード(UTF-8)文字化けについて

PHPで変数の文字コードをまとめて変えたい

PHPの文字コードについてお願いします。

i18n_convert と　mb_convert_encoding　の違い

文字エンコードについて

mb_ereg_replace　での文字変換

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

ファイルの文字コードを調べたい

質問者が選んだベストアンサー

補足 2007/03/13 09:05

その他の回答 (1)

お礼 2007/03/13 09:05

関連するQ&A

文字コードを検出し、ほかのコードに変更するスクリプトについて

ASCII文字列をEUCなどに変換したいができない

文字コードの検出が正しいかを検証する方法

文字コードについて

phpでの文字コード変換について

IMAP関数で取得した文字列の、文字コード変更について

文字コード変換

2バイト文字をASCIIコードに変換

mb_detect_encoding()関数について

ASCII文字列のgrep

CSVファイルの文字コード変換について

visual c++の文字コード判別

PHP関数mb_send_mailで送信すると件名が文字化けしてしまいます。

ファイルの文字コードを調べるには？(php)

文字コード(UTF-8)文字化けについて

PHPで変数の文字コードをまとめて変えたい

PHPの文字コードについてお願いします。

i18n_convert と mb_convert_encoding の違い

文字エンコードについて

mb_ereg_replace での文字変換

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

i18n_convert と　mb_convert_encoding　の違い

mb_ereg_replace　での文字変換