- ベストアンサー
関連性の高い語句を検出したい
新聞社のサイトなどで「首相」と入力すると 「支持率」「内閣」などを含む関連性の高い記事を 列挙してくれます。 あれはどういう仕組みなんでしょうか? 社内のナレッジデータベースで同様のことをしようと 企画しているのですが手がかりがありません。 おわかりのかた、よろしくお願い申し上げます。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
PHPでそういうの組みました。いくつか方法がありますが、簡単な例を説明します。 1.全記事からキーワードAを抽出する。 2.キーワードAで全文検索し、その中に一定以上の比率で含まれるキーワードBを抽出する。 3.キーワードAとキーワードBは関連度が高いとし、関連語辞書に登録しておく。 1~3は空き時間にやっておくといいですね(自動で実行させるスキルが無ければ手で作成します)。 4.キーワードAで検索されたときに、関連語辞書からキーワードBの検索結果も合わせて表示する。