• 締切済み

キーワード抽出がうまくいかない

自然文からキーワード抽出する機能をもつWebページを作ろうと思い、 Lingua::JA::Summarizeを用いて、下記のようなプログラムを書きました。 コマンドライン上から実行したときはキーワードを抽出してくれたのですが、 サーバを立ち上げ、WEBブラウザ上からアクセスしても キーワード抽出(@keywordsが空)してくれません。 他のCGIスクリプトは動いているので、apacheあたりの設定ではないような気がします。 一体、何が原因で、どう対処したらいいのでしょうか? #!/usr/bin/perl use strict; use Lingua::JA::Summarize; print "Content-type: text/html; charset=utf-8\n\n"; #キーワード抽出 my $text = '兄貴たちの晩餐'; my $s = Lingua::JA::Summarize->new({ charset => 'utf8',mecab_charset => 'utf8',default_cost => 1.8, singlechar_factor => 0.2,}); $s->analyze($text); my @keywords = $s->keywords({threshold=>4, maxwords=>10, minwords=>3}); #キーワードの表示 print join(' ', @keywords), "\n";

みんなの回答

回答No.1

ご提示のソースをコピーして cgi で動かしてみましたが、 私の環境ではこのままで問題なく動作しています (多少改行を入れました)。 Summarizeとmecabの接続部分や、 mecab 自体がちゃんと動作しているかを 確認してみてはどうでしょうか。

s075389
質問者

お礼

すごく参考になりました。 適切なアドバイスありがとうございました。 mecab単体はcgiで動作確認できました。 Summarizeとmacabの接続部分は、Summarizeのソースを 見直す必要があるので、少し時間が掛かっていますが、 まずは原因を特定することに注力を注いでいきたいと思います。

関連するQ&A