- ベストアンサー
perl cgi 文字コード変換について
- perl cgi 文字コード変換について
- 掲示板でログファイルへの書き出しの際に文字コードをshift-jisに変更したいのですが、unshift(@file, "$name1 $name2 ");と記述すると何も書かれずに空白になってしまいます。なぜでしょうか?困っています。教えて下さい。
- ちなみにunshift(@file, "$in{'handle'} $in{'message'} "); と文字コードの変更を意識しなかった場合にはちゃんとファイルに書かれています。jcode.plなどは使わずにencodeで行いたいです。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
「混ぜるな危険。」という言葉が適切かと思います。 おそらく、似たような既存のCGIスクリプトから(意味がわからないまま)寄せ集めたのではありませんか? CGIスクリプト冒頭で、 > #投稿された値を受け取る > if ($ENV{'REQUEST_METHOD'} eq 'POST') { > read(STDIN, $alldata, $ENV{'CONTENT_LENGTH'}); > } else { > $alldata = $ENV{'QUERY_STRING'}; > } > foreach $data (split(/&/, $alldata)) { > ($key, $value) = split(/=/, $data); > > $value =~ s/\+/ /g; > $value =~ s/%([a-fA-F0-9][a-fA-F0-9])/pack('C', hex($1))/eg; > $value =~ s/\t//g; > $in{"$key"} = $value; > } と自作ルーチンでGET/POSTデータを全て%inに取得しているにもかかわらず、$name1と$name2ではCGIモジュールでもう一度取得し直そうとしています。 > use CGI; > $cgi=new CGI; > $name1=$cgi->param('handle'); > $name2=$cgi->param('number'); しかし、CGIモジュールが取得しようとした時点ではすでにPOSTデータを含んでいる標準入力(STDIN)のファイルポインタがread()によって末端に来ているため、データの取得に失敗しているのではないでしょうか。手元で検証していないので可能性の話ですけど。 どちらかのみを使えばとりあえずデータの取得はできるようになるでしょうが、冒頭部分のルーチンは1990年代、Perl4の時代によく使われていた類の太古のルーチンです。 私なら、CGIモジュールを使う方法で一本化します。 # 冒頭のルーチンを以下に差し替え。スクリプト中盤にある重複部分は削除。↓ use CGI; my $cgi = new CGI; my $name1 = $cgi->param('handle'); # なんで「$name1」なんだろう・・・ my $name2 = $cgi->param('number'); # なんで「$name2」なんだろう・・・ my $message = $cgi->param('message'); # if ($in{'handle'} ne '' && $in{'message'} ne '') { # の部分を差し替え↓ if($name1 ne '' && $message ne '') { ところで、HTMLフォームに<INPUT name="number">がないんですけど、$cgi->param('number')はどこからどんなデータを引っ張ってきているんでしょうね? あと、質問とは内容が離れるかもしれませんが、質問者さんのスクリプトはいろいろと問題を抱えているように見受けられます。 ●HTMLフォームがUTF-8であれば、送られてくるデータもUTF-8であることが(今時のPCブラウザなら)保証されるのにもかかわらず、なぜ文字コードの自動判定(Encode::Guess)でわざわざUTF-8以外の文字コードとみなすようにしているのでしょうか。また、あえて「Shift_JIS」を使うということは、UTF-8よりも利用できる文字種がはるかに少ないということに留意してください。これらはどちらも文字化けやセキュリティホールの原因にもなります。携帯電話への対応や外部システムとの連携が必要でない限り、データ保存を含めて全てUTF-8で行うのが現代の主流です。 ●BBSデータファイルの読み書きで、(文法ではなく)ロジックに問題があります。適切な排他制御を行っていないために、読み書きが同時に発生した場合にはそれまで書き込まれたデータが失われる等の不具合が発生することでしょう。適切な排他処理の方法については、以前別の質問で回答したことがありますので参考にしてみてください。 http://okwave.jp/qa/q6697390.html http://okwave.jp/qa/q6105773.html ●この入力フォームにHTMLタグを入力したらどうなるかを考えてみてください。悪意を持って書き込んだら、入力フォーム自体を見えなくしたり、別のページに自動ジャンプすることさえ可能です。 ●ケアレスミスを防ぐために、Perl4ではなくPerl5の文法で書きましょう。スクリプト冒頭にはuse strict; use warnings;をつけて。myによる変数の初期化が必要になりますが、未定義の値が紛れ込んだりした場合に警告してくれますので、$cgi->param('number')のようなミスは避けられるはずです。 わからない点があればその旨ご返答頂ければ補足できるかもしれません。頑張ってください。
その他の回答 (1)
- Tacosan
- ベストアンサー率23% (3656/15482)
えぇっと, Encode::encode や Encode::decode を使うときには use CGI; $cgi=new CGI; $name1=$cgi->param('handle'); $name2=$cgi->param('number'); encode("shiftjis",decode('Guess',$name1)); encode("shiftjis",decode('Guess',$name2)); unshift(@file, "$name1\t$name2\n"); としているのに, 使わないときには unshift(@file, "$in{'handle'}\t$in{'message'}\n"); とするのは変ではありませんか? まあ Encode::encode/Encode::decode の使い方も違うけど.