- 締切済み
多変量解析と検定の違いは?
現在、アンケート調査の回答分析について学んでいます。 しかし、多変量解析と統計的検定の違いがわからなくて困っています。 どんなときに解析を使い、またどんなときに検定を使えば良いのでしょうか? ちなみに多変量解析は共分散構造解析、検定はカイ二乗検定を学んでいます。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- backs
- ベストアンサー率50% (410/818)
まず両者は全く目的が異なるものであることを了解してください。 多変量解析はある統計モデルを作成することで、その作成したモデルが統計学的に有用なものであるかどうかを確かめるのが検定であるということができます(それだけに限りませんけど)。 例えば、売上金額(Y)の変動は接客評価(X1)と品揃え評価(X2)によって説明されるというモデルを作るとします。 Y = X1 + X2 この重回帰モデルを解析することがいわゆる多変量解析です。仮にその結果として、 Y = 150*X1 + 100*X2 という偏回帰係数が得られたとしましょう。このとき、それぞれの偏回帰係数について「推定された偏回帰係数は0である」ということを"検定する"わけです。 端的にいってしまえば、 多変量解析はモデルを作成してパラメータを推定すること であり、検定は モデルが統計学的に正しいものであるかどうかを確かめる方法 ということができます。 しかし、これはあくまでも「多変量解析において検定とはどのような役割か」という視点での解説です。検定は多変量解析以外の場面でも使われていることはいうまでもありませんね。
- kgu-2
- ベストアンサー率49% (787/1592)
検定は、群間の差が、偶然ではない、すなわち、統計学的に有意である、ことを見出す作業です。すなわち、「有意差あり」を根拠にしたい、というときの作業です。 相関のように、両者が関連がある、ことを主張したい場合にも、両者の関係は、統計学的に偶然は言えない、すなわち有意なので、関連があると説明したい、などにも応用できます。 検定は、t検定を例にとると、1年生と2年生を比べるのように、2つの集団間の有意差を見つける、が基本です。 これが1年、2年、3年の3学年についてのように3集団に増えるとと、t検定はつかえず、H検定などを利用せねばなりません。このように、集団の数か2つより多い場合が多変量解析です。重回帰分析のように、変数が2つより多い場合も、変数=変量が2つより多いので、多変量解析です。 >どんなときに解析を使い、またどんなときに検定を使えば良いのでしょうか? 素直に書くと、1冊の教科書になります。ただ、私は初級者なので、中途半端なものしか書けませんが。 一番勘違いされているのは、どの検定法を使えば良いか、という質問です。というのは、どの検定法を使うかは、その人の勝手です。たとえば、2群の有意差をt検定でしようが、F検定でしようが、あるいはU検定も利用できるかもしれません。符号検定も。全く自由です。ですから、「有意差は無い」と主張しても、「別の検定法で、私は有意差をだしてみせる」と反論されると抵抗できません。ですから、「有意差は無い」ではなく「見つけられなかった」と謙虚に表現するしかないのです(もっと本質的なものもありますが)。 話が少しズレマシタが、どの検定方を選ぶかは自由ですが、正規分布していないのにt検定をするのは誤り、なんぞの選択していけない方法はあります。それは、経験を積んで下さい。 ちなみに、共分散構造解析は、私には難しすぎるので、手を出しません。相関分析で、因果関係をキチンと判定できるようになってからでないと(審査がある学術論文でさえ、いくつかの誤りの図を指摘できます)、表面だけは撫でられても、本当の解析は無理かも(間違った結論に陥る可能性が大きい)。 アンケートだと、社会(人間全体)が対象ですから、裏側に多いの要因があります。表面には出ていない関係がいくらでもあります。たとえば、日本は少子化が社会問題ですが、地球規模だと人口増加が21世紀の課題です。人口は、日本は減少、世界は増加と正反対の現象ですが、原因は同じです。この原因が分らないようなら、夏山登山の格好で、エベレストへ挑戦しているように感じますが。
お礼
丁寧にありがとうございます! 検定法の選択については自由があることは了解しています。 多変量解析と検定の違いがわからなかっただけです。 共分散構造解析は難しいですね。ほぼ全ての解析法を学んだ上ででも理解に苦しんでいます。
お礼
わかりやすい回答ありがとうございます! 今まで検定ばかりを勉強していたため、多変量解析が出てきたときに混乱してしまっていました。