- 締切済み
データマイニングのように区間クロス集計を自動的に!
以下のようなクロス集計を自動的に行ってくれるフリーツールはないでしょうか? ・ある変数が高い数値(例えば店舗の利益が高い)は、どのような変数の条件(気温や広告や経済状態など)の場合かを抽出したい。 データの例 ・日付: ・目的変数:(例えば、店舗の利益) ・属性A:(その日の気温) ・属性B:(その日の湿度) ・属性C:(その日の株価) ・属性D:(前日とその日の株価の変動幅) ・属性E:(曜日) ・属性F:(店舗のスタッフの人数) ・属性G:(駅前でのビラ配布枚数) ・属性H:(店前でのビラ配布枚数) など属性30種類ぐらい・・・・ これらのデータが1000件程度あります。 分析結果として、 ・属性xが(x~xx)且つ、属性yが(y~yy)、且つ属性zが(z~zz)、の場合は利益が高い。(属性の組み合わせ数は任意) という結論が欲しいのです。 (さらに欲を言えば、日付データを考慮して、最近の傾向として、効果の高い属性はxxである、という結果も導き出したい) Excelで全組み合わせのクロス集計をすれば見えてくるのですが手間がかかります。 単純な相関や線形回帰や、数値の上下で2分していく決定木では出来なさそうと考えています。 WEKAやCallegeAnalysisなどを触ってみたのですが 思ったような結果が出ません。 もし上記ツールで出来るなら、 パラメータなどの設定の仕方を教えて頂けないでしょうか。 または他のツールを教えて頂けないでしょうか。 何卒よろしくお願いします。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- eclipse2maven
- ベストアンサー率32% (33/101)
回答No.1