• 締切済み

アンケート分析 ANOVAについて

アンケート分析についての質問です。詳しい方どうかよろしくお願いいたします。 今回、被験者に5つの因子を想定して26項目のアンケート(1-5段階評価)を行いました。各因子4~6項目あります。 5つの因子に対して、因子間に差があるかを一元分散分析を用いて分析したいのですが、その手順が分かりません。過去の文献を見ると、平均値の分散分析を行っているようなのですが。。。単に5つの水準のものをANOVAかけるのはやった事があるのですが、このようなケースが初めてでして どなたか詳しいかた、よろしくお願いいたします。

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.5

まずは因子ごとの尺度得点(例えば因子1に3つの質問項目があるとすれば、それら3項目の合計点)を計算することですね。そうすると回答者は45人いるわけだから、F1からF5まで各45人分のデータがまとめられることになりますでしょ? F1 = {x1, x2, x3, ..., x45} F2 = {y1, y2, y3, ..., y45} F3 = {z1, z2, z3, ..., z45} F4 = {h1, h2, h3, ..., h45} F5 = {k1, k2, k3, ..., k45} このデータを「5群の平均値の差の検定」として分散分析をすればよいのです。厳密には独立5標本ではないのですが、便宜的に(といっていいのかどうか分からないですが)独立5標本として分析するので問題ないでしょう。 実際、質問紙調査の場合は実験室的な実験ほど厳密にデータを集めるのはかなり難しいので、ときには"妥当である"という割り切りも必要かもしれません。

yowy
質問者

お礼

本当に色々とありがとうございます。 これでやってみたら F (4,20)= 2.506 sig.=.075 と出てきました! ずっと悩んでいたことなので、その過程でも色々と勉強させていただいて感謝しております また機会があれば、どうかよろしくお願いいたします

  • backs
  • ベストアンサー率50% (410/818)
回答No.4

正確なことは実験の計画書を見てみないと判断できませんが、その結果はおそらく擬似反復によるものでしょう。 心理系の、しかも質問紙調査を行っている論文の多くみられる例ですが、主効果の自由度に対して明らかに誤差の自由度が過大である場合、そのほとんどは"まず間違いなく"擬似反復に気づかず解析を行ってしまっています。 自由度について正しい見方を身につけると、擬似反復は簡単に見抜けてしまいます。誤差の自由度は全データ数から推定したパラメータの数を引いたものになります。例えば、1要因5水準の分散分析モデルだと全てで5つのパラメータを推定することになるので、仮に30人分のデータが得られている場合は 30 - 5 = 25 というのが誤差の自由度になります。ちなみに、主効果の自由度は4になります(主効果の項では4つのパラメータを推定するので)。 ただ、適切な解析を行っていても同じように誤差の自由度が過大になることはあります。それは、単にたくさんのデータをとって少しのパラメータしか推定していない場合です。例えば、1グループ200人で構成されている5つのグループを用意して、グループごとに差があるかを検定した場合です(G1=200, G2=200, G3=200, G4=200, G5=200で合計1000人の被験者を用意したことになる)。この場合は 1000 - 5 = 995 というのが誤差の自由度になります。主効果の自由度は同じく4になります。 まとめると、質問者さんのような自由度が得られる場合は以下の2点のことが考えられます。 1) 擬似反復であることに気づかずに解析してしまっている(間違った解析)。 2) 多くのデータから少ないパラメータを推定しているに過ぎない(解析としては間違いではない)。 どうやってこの2つを見分けるかというと、(繰り返しになりますが)正確には実験の計画書を見なければ分かりません。ただし、経験的にどちらの過ちを犯しているかはある程度、察しがついてしまいます。だから、たぶん質問者さんの場合だと擬似反復に気づかずに解析してしまっているのだと思えるのです(この場合は適切な処理を行えば問題を解決することはできる)。 ちなみに、2)の場合は解析方法としては間違っていなくても、実験計画の段階でサンプル設計について過ちを犯しています。不要に大きすぎるサンプルサイズは「有意でないのに有意であるという結論を導いてしまう(すなわち第一種の過誤を犯す確率が高くなる)」のです。

yowy
質問者

お礼

本当に色々とありがとうございます。 私も自信なくやっているもので、おそらく第1の原因なのでしょうね・・・ 実験計画がどこまでの詳細を申し上げればよろしいのか分かりませんが、出来る範囲でまとめてみました。既に沢山教えていただいておりますので、もしもこれ以上付き合いきれないという場合は仕方ありません。 今回の研究は、「高校生の動機減退説」についてのもので、 被験者45名に対し、1-5スケールの質問紙を配布したものです。 目的は、因子間に差はあるか、どの因子が学習者をより動機減退させるか、させないか、ですので、質問紙は 5つの因子からなり、各因子に4-6項目の質問をつけています。 解析方法は、各因子の合計点の平均の比較をしたかったので、一元配置の分散分析を行い、先日のようなF(4,1136)=9.201 sig.000 という結果が出ました。 以上が概要ですが、どう改善すればよいのでしょうか?できればよろしくお願いいたします

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

細かいことですが、この場合は「カテゴリに含まれる項目」という言い方ではなく、「因子に含まれる質問項目」というべきです。繰り返しになりますが、因子(要因ともいう)の下位に水準(カテゴリ、属性ともいう)が存在しているのです。だから「1カテゴリ4項目」ではなくて「因子1における4つの質問項目」とか「因子1に属する4つの質問項目」と表現するのが誤解なく伝わるので適切でしょう。 通常は被験者ごとに各因子に含まれる質問項目の合計点を出して処理をすることが多いでしょう。 ただ結局は「何を比較したいのか」ということですから、 > 1カテゴリー 4項目 > 2カテゴリー 4項目 > 3カテゴリー 5項目 > 4カテゴリー 3項目 > 5カテゴリー 5項目 の各因子ごとの平均値に差があるかどうかを検定するのなら、各カテゴリに含まれる数項目の合計点を計算すればよいでしょう。そうではなくて、項目ごとに差が認められるかを検定したいなら項目ごとに行えばよろしい(こういうことはしませんがね)。

yowy
質問者

お礼

いろいろと丁寧にありがとうございました。 回答を頂いてから色々やってみたのですが、 とりあえず5因子の差を見たいので、1要因5水準のANOVAをかけてみたのですが、結果が F(4,1136)=9.201 sig.000 となり、見慣れない大きな数になったのですが、これは致命的に間違った方法をとっている可能性はあるのでしょうか。。。。?

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

> 5つのカテゴリーで、どこかに差があるのか すでに述べたように1要因5水準の分散分析ですね。ちなみに、水準、カテゴリ、属性、レベルとかいろんな言い方がありますが、基本的にはどれも同じです(ややこしいですが)。 場合によっては多重比較を行う必要があるかもしれません。分散分析で全体に差が認められることを確認してから多重比較をおこなうのか、それとも最初から多重比較をおこなうのか、どちらがよいかは(投稿する論文であれば)投稿先の先行研究に従うべきでしょう。 > 3ヵ月後に再度同じアンケートを実施し、推移を見たい 質問紙などによるアンケートを行う場合、同一の被験者であることを確認するのは困難なので、こういうのはあまりおススメできませんね。もしこういうことをする場合は、回答者を特定できるようにインターネットなんかで必要なユーザIDみたいなものをあらかじめ割り当てておくことも考えたらよいかも(それでもやっぱり難しい)。 1回目の調査と2回目の調査をあたかも独立二標本として扱う場合が多いかなぁ。。。 理論的には経時測定データを扱う方法としては、1回目と2回目の観測値の差をとって分析することができます。

yowy
質問者

お礼

なるほどです。理解できました。どうもありがとうございます。 最後にもう一つだけお聞きしたいのですが、 1要因分散分析の方法ですが、 それは、各カテゴリー内で行えばよろしいのですか? つまり、 1カテゴリー 4項目 2カテゴリー 4項目 3カテゴリー 5項目 4カテゴリー 3項目 5カテゴリー 5項目 のようになっている場合、まず1カテゴリーの中で分散分析を行い、 次に2,3,4,・・・という形をとるものでしょうか? それとも、いっきにやる方法があるのでしょうか? 本当に初心者ですみません。 よろしくお願い致します

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> 5つの因子に対して、因子間に差があるかを一元分散分析を用いて分析したい 因子が5つあるのであれば、それは5要因の分散分析でしょう(因子と要因は同じ意味)。そして5要因の分散分析をしようとするのはちょっと無茶がある。 > 単に5つの水準のものをANOVAかけるのはやった事があるのですが、このようなケースが初めてでして 5つの水準のものを・・・ というのは、1要因の分散分析であって、その要因の水準が5水準であるものということなのでしょうね。また、このようなケースというのは具体的にどのようなケースなのですか? 因子には必ず水準が存在します。因子がいくつなのか、それぞれの因子の水準はいくつなのか、この点をはっきりとさせると良いと思いますよ。 もっとも文脈から察するに、質問者さんのやりたいことは結局5つの平均値を比較したいということなのでしょうから、典型的にいえば「5群の平均値の差の検定」になるわけですから、1要因(5水準)の分散分析を行うことになるでしょう。

yowy
質問者

補足

ご回答どうもありがとうございます。 私の説明不足でしたので、再度もう少し詳しく説明させてください そして、「要因」「水準」の言葉使いが曖昧でした。すみません 被験者55名に対し、「動機」についての26項目の1ー5スケールの評価のアンケートを実施しました。 アンケートは、5つ(各4~6項目の質問)のカテゴリーから構成されています。 ですので、分析時に、 5つのカテゴリーに分けて分析しようと考えているのですが、まず初めに、5つのカテゴリーで、どこかに差があるのか(どのカテゴリーが最も弱いか等)を調べたいのです。 この場合にとる方法としてはどういうものがあるのでしょうか? (ついでですが、3ヵ月後に再度同じアンケートを実施し、推移を見たいのですが、その時はどういう手法があるかもアドバイスいただければ幸いです) どうぞよろしくお願いいたします

関連するQ&A