- ベストアンサー
多次元空間でのクラスの一致性調査について
- 多次元空間でクラスAとクラスBの一致性を調べるための統計的手法を検討しています。
- 変数ごとにクラスAとクラスBのデータの平均を求めましたが、完全な一致はありませんでした。
- 一致性を調べるための対応のない2群の検定を行うことが考えられますが、3次元データの場合の取り扱いについて悩んでいます。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
>3つの変数からなる集団の分析法があるか? 逆言うと,2変数や1変数なら分かる, ということですね。 たしかに,3変数のままでは,扱いにくいのです。 そんなときのために,主成分分析があります。 4変数だろうが,5変数だろうが,変数を減らせる可能性があります。 例えば,zがx,yの関数で表せれば,x,yの2変数問題となるのです。 これで,変数を減らして比較すればよいのです。 例えば,下記サイト http://www.g-link.co.jp/CSN/principa.htm それから,相関と書いてありましたが,相関や回帰から,集団の一致は,例え2次元データでも単純には調べられません。 添付図を見てください。 相関係数が等しく,回帰の傾きも切片も等しい(同一直線で表される)二つの集団があります。 相関や回帰が同じでも,これらは違う集団と見なすべきでしょう。 実は,生物の体を測定したとき,このようなことが起こりえます。 つまり,大型化(あるいは,小型化)という進化したときなどです。 こういう場合は,それぞれの変数で多重検定すれば判明します。 ですから,「3変数くらいまで」だったら,まず,グラフで傾向を知ることも大切です。
その他の回答 (1)
- 井口 豊(@Iguchi_Y)
- ベストアンサー率68% (157/228)
まず,質問者さんの言ってることは,少々矛盾してるのですが・・ >クラスAとクラスBが「一致」するのか「不一致」なのか を調べるんですね。 つまり,分析前は,両者が一致してるかどうか不明という意味ですね。 それなのに, >AかBのどちらかのクラスに属するという状況 という前提は変ですね。 前提として,別々のクラスを設定するなら,それは既に,「両者は不一致」,ということです。 既に,別々のクラスが設定され,その上で,あるデータ点が,どちらのクラスに属するか, という問題なら,多変量解析の判別分析です。 また, クラスが1つなのか(2集団が同1集団から来たもの)か, 2つのA,Bに分かれる(2つの異なる集団からきたもの)か 不明なら, >クラスAのデータの平均とクラスBの平均を求めること をやって, >当然ですが完全に一致することはありませんでした。当たり前ですよね・・・ の「当然」とも言えませんよ。 もし,何らかの検定をやって(何をやったか書かれてないんですが・・・), その「平均」で有意差が出たら, そういう意味で(例えば,xの平均に有意差がある,という意味で),違う集団です。 もし,分散を調べて,有意差が出たら,その意味で違う集団です。 各変数について調べるのは間違っていません。 でも,何の違いを調べる(位置?散らばり?,両方?その他?)かで,やり方も違ってきます。 いずれにしても,この変数x,y,zごとの検定は,一種の多重検定になるので, 有意水準の設定に注意する必要があります。 例えば,Bonferroniの考え方で,5%水準にするなら,それぞれ,5%の1/3ずつの水準にする必要があります。 いずれにしても,検定に入る前に,何を前提にして,何を調べるか,を明確にする必要がありそうです。
補足
どうもありがとうございます。まず質問を補足させていただきます。 状況としては、2つのクラスに相関があるかどうかは不明であり、これを確かめたいと思っています。回答者様の仰る「クラスが1つなのか(2集団が同1集団から来たもの)か,2つのA,Bに分かれる(2つの異なる集団からきたもの)か不明」の方が私の質問の意図になります。 また、分析としてはまだ平均を求めただけでありまして、何の検定も行っておりません(どの検定を用いればよいかわからなかったため)。 3つの変数からなる3次元空間上の点の分布について調べることのできる分析手法や検定方法はございますか?それとも、そんな方法はなく、まずは各変数ごとの検定を多重検定になることを考慮して行えばよいのでしょうか?
お礼
なるほど、仰る意味がようやくわかりました。どうもありがとうございます。引き続き、自分の得たい結果に適した解析手法を探っていきます。