• 締切済み

統計 テキストマイニング?、キーワードと数字を比較するには?

こんにちは。今テキストマイニングをしてアンケートのようなものを分析しようと思ってます。 例えばA~Fの6店のラーメン店への利用者の感想がたくさんあるとします。 それとは別にA~F店の売上高の情報があるとします。 売上が高いラーメン店ほど、多く顕れるキーワードを探したいのですが、どうしたらよいでしょうか? できればそのキーワードが売上高にどれだけ貢献してるか点数がでるようにできれば有り難いのですが… 統計もテキストマイニングも素人です。どうか詳しい方お力をお貸し下さい。よろしくお願いします

みんなの回答

  • tac351115
  • ベストアンサー率66% (109/164)
回答No.1

手順を示します。 1. 売り上げが多い店について、アンケートに現れるキーワードを選び、各キーワードの頻度を集計します。 2.選んだキーワードについて、他の店についても頻度を集計します。 3.選んだキーワード毎に、つぎのグラフを作ります。      横軸 各店の売上高      縦軸 各店のキーワード頻度   注意:アンケートの数が各店でばらつきがある場合は、つぎの式に代えます。      縦軸 各店のキーワード頻度÷各店のアンケート数 4.完成したグラフが右上がりのグラフであるほど、貢献しているキーワードになります。 5.数値化するには、相関係数というものを算出します。   上記グラフをExcelの散布図グラフでプロット   グラフ上で右クリックして、「近似曲線の追加」を選択   「種類」タブで「線形近似」を選択   「オプション」タブで「自動」と「グラフにR2乗値を表示する」を選択して閉じる   グラフ上に表示される「R2乗値」が相関係数です。これが1に近いほど貢献しているといえます。     グラフ作成例の参考     http://atiboh.sub.jp/t08senkeikinzi.html

すると、全ての回答が全文表示されます。

関連するQ&A