ベストアンサー

※ ChatGPTを利用し、要約された質問です（原文：Perlの文字コードを意識したファイルの読み込み方）

Perlの文字コードを意識したファイルの読み込み方

2007/05/16 16:40

このQ&Aのポイント

perl5.8でファイルを読み込む場合、文字コードを意識した方法は2つあります。
一つ目はファイルを'<:euc-jp'という形式で読み込む方法です。この方法で読み込んだデータはperlの内部コード(UTF8)に変換されます。
二つ目は通常の'<>'演算子を使用してファイルを読み込んだ後、Encodeモジュールを使用して文字コードの変換を行う方法です。

bazax
お礼率5% (12/228)

Perl
回答数1
ありがとう数0

みんなの回答 （1）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

sakusaker7
ベストアンサー率62% (800/1280)

2007/05/17 00:49 回答No.1

open の第二引数でエンコーディング指定をしたときとか、Encode::decodeを使って変換した場合は、変換結果の文字列はUTF-8はUTF-8なのですが「UTF-8フラグ」というものがついたものになっています。その意味においては、質問にあるどちらのやり方でも結果は同じです。速度も多分優位な差は出ないような気がしますが測定しないと断言はできません。処理対象のテキストファイルのエンコーディングがあらかじめわかっているとか、決めうちしてよいのなら open でいいでしょうし、そうではなくていくつかのエンコーディングが混在するのなら、別途対象のエンコーディングを判定した上で読みながら変換という二番目の手段をとればよいと思います。 > while(<IN>){ > $dat .= $_; > } こういう読み方はよくありません。メモリも時間も無駄遣いしていまいます。 File::Slurp というモジュールをインストールして $dat = read_file($filename); とするか、モジュールを入れるのがいやなら、 open(IN, "<:euc-jp", "$fname) or die "open error!"; flock(IN, 2); {local $/ = undef; $dat = <IN>} close(IN) のようにすれば一気読みができます。ところで > open(IN, "<:euc-jp", "$fname) or die "open error!"; この第二引数でエンコーディングしているのに :euc-jp って書き方許されてましたっけ? :utf8 という指定はありますが、エンコーディングを指定するときは :encoding(euc-jp) のように指定する必要があったと記憶しています。 Perl 5.8.x Unicode関連 http://www.rwds.net/kuroita/program/Perl_unicode.html Perl 5.8.x における日本語コード変換のメモ http://www.hikoboshi.org/perl/doc/encode.html

Perlの文字コードを意識したファイルの読み込み方

Perlの文字コードを意識したファイルの読み込み方

質問者が選んだベストアンサー

関連するQ&A

Perlの文字コード

Perl 文字コードについて

OSの文字コードを取得

Perlの文字コード変換についての質問です。

Perlのプログラムのエラーです。ローカルでは問題なく動きました。サー

WWW::Mechanizeの文字コードについて質問

JcodeモジュールとEncodeモジュール

ファイル出力時、ファイル名が文字化けする

Perlの文字コード変換について

文字コードの変換（Shift-JISからUTF8)

Encode と encoding の同時使用で ISO-2022-JP に encode できない

Cannot decode string with wide characters

utf8使用時のフォーム入力文字コード

perlで新規ファイルを作成できない（文字化け）

perl5.8.3のunicode環境で日本語の置換え

XML::RSS文字コード統一の仕方がわかりません

文字コード変換

PHPの文字コード

半角→全角変換

文字コード？推奨UTF-8？

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

Perlの文字コードを意識したファイルの読み込み方

Perlの文字コードを意識したファイルの読み込み方

質問者が選んだベストアンサー

関連するQ&A

Perlの文字コード

Perl 文字コードについて

OSの文字コードを取得

Perlの文字コード変換についての質問です。

Perlのプログラムのエラーです。ローカルでは問題なく動きました。サー

WWW::Mechanizeの文字コードについて質問

JcodeモジュールとEncodeモジュール

ファイル出力時、ファイル名が文字化けする

Perlの文字コード変換について

文字コードの変換（Shift-JISからUTF8)

Encode と encoding の同時使用で ISO-2022-JP に encode できない

Cannot decode string with wide characters

utf8使用時のフォーム入力文字コード

perlで新規ファイルを作成できない（文字化け）

perl5.8.3のunicode環境で日本語の置換え

XML::RSS文字コード統一の仕方がわかりません

文字コード変換

PHPの文字コード

半角→全角変換

文字コード？ 推奨UTF-8？

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

文字コード？推奨UTF-8？