• 締切済み

PHPで語句の価値を解析する方法

こんばんは。 PHPで掲示板の語句の価値を解析をする方法は有りませんでしょうか? 価値とは人によってそれぞれだと思いますが、ここでは検索で多く使われたり、 流行であったり、人を喜ばせたり、嫌な気分にさせない物を価値が高いとします。 死ねやカスなどの中傷用語は大きなマイナス、一般名詞はややプラス、 最近流行の用語はプラスなどニーズにあわせて語句の評価をする方法です。 データベースやAPIやモジュールを用いても構いません。何かとっかかりが欲しい のです。 よろしくお願いいたします。

みんなの回答

  • 20091110
  • ベストアンサー率66% (2/3)
回答No.2

面白そうな試みですね。 自分はタグクラウドで考えてみました。 1、キーワードを登録しているCSVを用意 2、CSVファイルからキーワードを読み込んで単語が詰まった配列を作ります。 3、フォームから送信されたTextArea内部に単語があるかを見ます。 4、発見しだい連想配列を作ります("単語"=>array(ポイント,回数)) 5、その配列をXML、もしくはCSV形式に加工して書き出します。 6、掲示板アクセス時に5で作ったファイルを読み込んでタグクラウドを作ります。 ふと頭に浮かんだ流れです。DBを使わない方向で考えてみました。 まあ、このつくりだとかなり重そうですねえ…。 DBかつNAMAZUを使えばもっと良いやりかたがあるかも…でも手間が…。 悩みますねぇ…。

noname#190095
質問者

お礼

ありがとうございました。

  • yambejp
  • ベストアンサー率51% (3827/7415)
回答No.1

ぱっとおもいつくのは全文検索にキーワードを総当たりでマッチさせること。 言葉の分かち書きについてはkakasiなどの利用はありかもしれません。 ただ、仕組みはできても言葉の価値を半自動で評価することは かなり難しいこと、とくにはやりすたりがある中で「流行語」を プラスと判断するというコンセプトは的外れな気がします。 研究対象としては面白いかもしれませんが、精度があがらないようなら 個人的にはやる価値を見出せません。

noname#190095
質問者

お礼

ありがとうございました

関連するQ&A