• ベストアンサー

関連性の高い語句を検出したい

新聞社のサイトなどで「首相」と入力すると 「支持率」「内閣」などを含む関連性の高い記事を 列挙してくれます。 あれはどういう仕組みなんでしょうか? 社内のナレッジデータベースで同様のことをしようと 企画しているのですが手がかりがありません。 おわかりのかた、よろしくお願い申し上げます。

質問者が選んだベストアンサー

  • ベストアンサー
  • ts3m-ickw
  • ベストアンサー率43% (1248/2897)
回答No.1

PHPでそういうの組みました。いくつか方法がありますが、簡単な例を説明します。 1.全記事からキーワードAを抽出する。 2.キーワードAで全文検索し、その中に一定以上の比率で含まれるキーワードBを抽出する。 3.キーワードAとキーワードBは関連度が高いとし、関連語辞書に登録しておく。 1~3は空き時間にやっておくといいですね(自動で実行させるスキルが無ければ手で作成します)。 4.キーワードAで検索されたときに、関連語辞書からキーワードBの検索結果も合わせて表示する。

関連するQ&A