- 締切済み
キーワード抽出がうまくいかない
自然文からキーワード抽出する機能をもつWebページを作ろうと思い、 Lingua::JA::Summarizeを用いて、下記のようなプログラムを書きました。 コマンドライン上から実行したときはキーワードを抽出してくれたのですが、 サーバを立ち上げ、WEBブラウザ上からアクセスしても キーワード抽出(@keywordsが空)してくれません。 他のCGIスクリプトは動いているので、apacheあたりの設定ではないような気がします。 一体、何が原因で、どう対処したらいいのでしょうか? #!/usr/bin/perl use strict; use Lingua::JA::Summarize; print "Content-type: text/html; charset=utf-8\n\n"; #キーワード抽出 my $text = '兄貴たちの晩餐'; my $s = Lingua::JA::Summarize->new({ charset => 'utf8',mecab_charset => 'utf8',default_cost => 1.8, singlechar_factor => 0.2,}); $s->analyze($text); my @keywords = $s->keywords({threshold=>4, maxwords=>10, minwords=>3}); #キーワードの表示 print join(' ', @keywords), "\n";
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- z_liang_00
- ベストアンサー率42% (45/107)
ご提示のソースをコピーして cgi で動かしてみましたが、 私の環境ではこのままで問題なく動作しています (多少改行を入れました)。 Summarizeとmecabの接続部分や、 mecab 自体がちゃんと動作しているかを 確認してみてはどうでしょうか。
お礼
すごく参考になりました。 適切なアドバイスありがとうございました。 mecab単体はcgiで動作確認できました。 Summarizeとmacabの接続部分は、Summarizeのソースを 見直す必要があるので、少し時間が掛かっていますが、 まずは原因を特定することに注力を注いでいきたいと思います。