• 締切済み

購買に関する統計分析

統計初心者です。 商品の購買者の特徴を分析したいと思っています。 手元に、サンプルの属性(性別、年収、職業等)と、それぞれのサンプルが購入した品目(複数、かつ品名ではなく、既に類型化済み)のデータがあるとします。このデータから、次の目的で分析を行いたいと思います。 ・購入品目別に購買層を類型化し、どういった層にどういった商品が気に入られているのか、を把握する。 クラスター分析で良いのでしょうか。 宜しくお願い致します。

みんなの回答

noname#227064
noname#227064
回答No.2

ANo.1では年代別、性別、職業別と別々に集計しましたが、集計せずにすると添付画像のようになります。 # 使用したコード plot(corresp(x[, -c(1:3)], 2))

noname#227064
noname#227064
回答No.1

> 手元に、サンプルの属性(性別、年収、職業等)と、それぞれのサンプルが購入した品目(複数、かつ品名ではなく、既に類型化済み)のデータがあるとします。 例えば下記のようなデータでしょうか? A~Eが品目で0-1で購入したかどうかを表す。 age sex profession A B C D E 1 30 F b 1 1 1 1 0 2 20 M a 1 0 1 1 1 3 20 M b 1 0 1 0 1 4 60 M c 1 1 0 0 1 5 30 M b 1 0 0 1 0 6 10 M c 1 1 0 0 1 7 50 F b 1 1 0 0 1 8 40 M a 1 0 1 0 0 9 40 F b 1 0 0 1 0 10 30 F b 0 1 1 0 0 11 30 M b 0 0 1 1 0 12 30 F c 1 1 0 0 1 13 60 F b 0 0 1 1 0 14 50 F c 0 0 0 1 1 15 20 F a 1 0 1 1 1 16 20 F a 0 0 0 0 1 17 50 F c 1 1 0 1 0 18 40 F c 0 1 1 1 1 19 30 F b 1 1 1 0 1 20 50 M b 1 1 1 1 0 あまり詳しい説明はできないのですが、コレスポンデンス分析はいかがでしょうか? 統計解析ソフトRで上のテストデータを年代別、性別、職業別に解析・プロットしてみると添付図のようになりました。 図を見て属性と品目が近いほど、その属性の人はその品目を購入している人が多いということが分かります。 # 使用したコード # 汚いですがそこは目をつぶってください # テストデータ作成 n <- 20 age <- round(runif(n) * 50, -1) + 10 sex <- as.factor(ifelse(runif(n) > 0.5, "M", "F")) profession <- as.factor(letters[ceiling(runif(n) * 3)]) items <- matrix(ifelse(runif(n * 5) > 0.5, 1, 0), nrow = n) colnames(items) <- LETTERS[1:5] items <- items[, colSums(items) > 0] x <- data.frame(age = age, sex = sex, profession = profession) x <- cbind(x, items) # テストデータ表示 x # 年代別に集計 x.age <- xtabs(cbind(A, B, C, D, E) ~ age, data = x) x.age <- x.age[rowSums(x.age) > 0, ] # 性別で集計 x.sex <- xtabs(cbind(A, B, C, D, E) ~ sex, data = x) x.sex <- x.sex[rowSums(x.sex) > 0, ] # 職業別に集計 x.profession <- xtabs(cbind(A, B, C, D, E) ~ profession, data = x) x.profession <- x.profession [rowSums(x.profession ) > 0, ] # コレスポンデンス分析とプロット par(mfrow = c(2, 2)) # 4分割してプロット plot(corresp(x.age, 2)) plot(corresp(x.sex, 2)) plot(corresp(x.profession, 2)) par(mfrow = c(1, 1)) # 4分割してプロットの設定を戻す

関連するQ&A