ベストアンサー

※ ChatGPTを利用し、要約された質問です（原文：Perl 禁止語句）

Perl禁止語句一覧の部分一致エラー処理方法と指摘コード

2017/04/12 13:43

このQ&Aのポイント

Perl禁止語句一覧の中にある文字列とテキストの一致を部分一致で処理する方法を教えてください。
また、現在のコードに指摘があれば教えてください。
ngword.txtというファイルから禁止語句を読み込み、テキストの中に禁止語句に一致する部分がある場合にエラーを出力しています。

Cells231
お礼率62% (10/16)

Perl
回答数1
ありがとう数1

みんなの回答 （1）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

Gotthold
ベストアンサー率47% (396/832)

2017/04/14 00:45 回答No.1

> 現在のコードですと、 > 完全一致で、これを部分一致にする > 方法を教えてください。現在のコードは部分一致（もっと正確には正規表現の部分一致）に見えます。 > またコードの指摘があればよろしくお願いいたします！いくつか問題があります。 > my $Name = "え"; > $Name = encode('cp932', decode('UTF-8', $Name)); ソースコードをUTF-8で書くのは良い作法ですが、それなら use utf8; を記載した方が良いです。 use utf8; を記載すると、ソースコード中の文字列リテラルが全てdecodeされた扱いになります。 #こう書かなくても my $Name = decode_utf8("え"); #これでOK use utf8; my $Name = "え"; また、せっかくデコードした$NameをなぜかCP932にエンコードしていますが、エンコードしてしまうとperlはその内容を文字列と解釈できずバイナリ列と解釈します。その結果、例えば・Name = "コ" （文字コード0x8352）・禁止文字 = "R" （文字コード0x52）などの組み合わせで、コに禁止文字Rが含まれていると解釈されてしまいます。このようなことを避けるために、文字列比較などはデコードした文字列同士で行いましょう。 > return map { $body =~ /$_/m } @$word; 文字列検索に正規表現を使っています。このため禁止ワードに正規表現で特殊な意味を持つ . や * などが含まれていると正規表現として扱われてしまいます。これは意図通りですか？また、正規表現のmオプションを使っていますが、意味を理解して使っていますか？（mオプションは正規表現の ^ や $ の挙動を変えるオプションです。）部分一致、完全一致のやり方はコード見た方が早いと思うのでサンプルを見てください。 #======サンプル======= #/usr/bin/perl use utf8; use strict; use Encode; my $Name = "あいう"; open my $fh, '<:encoding(cp932)', 'ngword.txt'; # perlIOレイヤで自動的にdecode 'cp932' chomp(my @ngword = <$fh>); close $fh; #print前のencodeは省略 print "ban1\n" if(&ban1($Name, \@ngword)); print "ban2\n" if(&ban2($Name, \@ngword)); print "ban3\n" if(&ban3($Name, \@ngword)); print "ban4\n" if(&ban4($Name, \@ngword)); sub ban1 { my $body = shift; my $word = shift; foreach my $w (@$word){ return 1 if (index($body, $w) >= 0); #部分一致 } return 0; } sub ban2 { my $body = shift; my $word = shift; foreach my $w (@$word){ return 1 if ( $body eq $w ); #完全一致 } return 0; } sub ban3 { my $body = shift; my $word = shift; my $word_re = join '|', map { quotemeta } @$word; return ($body =~ m/$word_re/); #部分一致 } sub ban4 { my $body = shift; my $word = shift; my $word_re = join '|', map { quotemeta } @$word; return ($body =~ m/\A(?:$word_re)\z/); #完全一致 }

質問者

お礼 2017/04/19 12:09

お返事が遅くなり申し訳ございません。いろいろなパターンを作ってくださりありがとうございます！実行確認できました！

Perl禁止語句一覧の部分一致エラー処理方法と指摘コード

Perl 禁止語句

質問者が選んだベストアンサー

お礼 2017/04/19 12:09

関連するQ&A

Perl　メール文字化け

perl cgi 文字コード変換について

Perl　正規表現について

文字コードの変換（Shift-JISからUTF8)

ファイル出力時、ファイル名が文字化けする

Encodeについて

Perlの文字コードを意識したファイルの読み込み方

cgi出力での文字コードについて

CGIで外部ファイルに書き込みができません

[Perl]Shift-JISのXMLを解析する場

perlでファイルへの書き込みができません！

Perlのプログラムのエラーです。ローカルでは問題なく動きました。サー

perlのcgiが文字化けします。

perl cgi文字化け解消方法と[1～][11～][21～][最新10件]のようなリンクを付ける方法。

特定の行を編集したい-perl

今更ながらdbmopenでutf8環境にハマってます。

Perl の use strict に付いて

禁止ワードの設定

Perl 文字コードについて

Perl 強制終了の回避について

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

Perl禁止語句一覧の部分一致エラー処理方法と指摘コード

Perl 禁止語句

質問者が選んだベストアンサー

お礼 2017/04/19 12:09

関連するQ&A

Perl メール文字化け

perl cgi 文字コード変換について

Perl 正規表現について

文字コードの変換（Shift-JISからUTF8)

ファイル出力時、ファイル名が文字化けする

Encodeについて

Perlの文字コードを意識したファイルの読み込み方

cgi出力での文字コードについて

CGIで外部ファイルに書き込みができません

[Perl]Shift-JISのXMLを解析する場

perlでファイルへの書き込みができません！

Perlのプログラムのエラーです。ローカルでは問題なく動きました。サー

perlのcgiが文字化けします。

perl cgi文字化け解消方法と[1～][11～][21～][最新10件]のようなリンクを付ける方法。

特定の行を編集したい-perl

今更ながらdbmopenでutf8環境にハマってます。

Perl の use strict に付いて

禁止ワードの設定

Perl 文字コードについて

Perl 強制終了の回避について

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

Perl　メール文字化け

Perl　正規表現について