- ベストアンサー
分散分析で水準の効果を母数と変量、どちらととらえるか?
- 分散分析において、水準の効果は母数や変量として取り扱われます。母数とは、人口統計学的なパラメーターであり、全集団の平均や分散を表します。
- 一方、変量とは、サンプルデータにおける変数の値を表します。分散分析では、水準の効果を母数として扱うこともありますが、一般的には変量として扱われます。
- モデル選択の際には、データの分布や目的に応じて適切な選択をする必要があります。また、分散分析においては、水準の効果が変量として扱われる場合でも、その解釈には注意が必要です。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
> 要因は「審査員の評価の甘さ、厳しさ」と「スケーターの実力」の2つ という要因がどういったものかよく分からないのですが(^_^;) もしある1人の審査員が複数人の演技を評価するのであれば(というか実際にそのようにするのですが)"審査員"というのは1つの変量効果でしょう。同時観測は物理学的に在り得ないので、1人目の評価、2人目の評価、、、と時間経過に伴っているでしょう? だかれこれも経時測定データですよ。 質問者さんが参照したであろう、とある本には「厳しい審査員と甘い審査員がいる」とありますけど、これは要因ではありませんね(著者の先生もそういう意図でいっているのではないでしょう)。厳しいか甘いかは平均値を見てそういっているだけです。というか評価の観点が違うので一概に平均値だけを見てその採点者が甘いかどうかなどナンセンス(苦笑) 例えばですが 藤越ほか「経時データ分析」オーム社 を読んでみたらどうでしょうか。例の本はたとえ話も説明もあまり上手でないような気がします(^_^;) > どのように固定効果/ランダム効果かを決めればよいでしょうか? 先ほど述べたように「対応あり」かどうかを見極めることです。スケートの例でも: S1はJ1, J2, J3, ...というそれぞれの"条件"の下で観測値が得られたと考えれば、これは経時測定データでしょう? 逆にJ1もS1, S2, ...というそれぞれの"条件"の下で観測値が得られたと考えるのです。そうすると、結局、SもJもどちらも変量効果だというわけです。 しかし、そもそもこのデータセットに対して分散分析を行うこと自体が実質的に何の意味もないことですから、やはり例として良くない。。。
その他の回答 (1)
- backs
- ベストアンサー率50% (410/818)
例えば次のようなデータセット: Subjects = {投与前, 投与後1時間, 投与後3時間} Sub1 = {123, 110, 100} Sub2 = {98, 90, 100} Sub3 = {110, 120, 100} ・・・ があったとき、時間経過(水準: 投与前, 1時間後, 3時間後)と被験者という2つの要因がありますね? ここで時間経過は固定効果(母数効果)、被験者は変量効果(ランダム効果)です。要するに、いわゆる「対応ありのデータ」であるときに変量効果が現れるわけです。 数式による理解が難しい場合、とにかく経時測定データを扱う場合には"被験者"が必ず変量効果になるのだと覚えておけば(実質的に)ほとんど問題ないでしょう。 > どのモデルにするか判断をする際に 固定効果(母数効果)のみのモデル(分散分析モデル)であるか、それとも変量効果が組み込まれたモデル(線形混合効果モデル)であるかは"判断する"のではなく、"決まる"ものです。ただ、実際には前述したように時間経過に伴って繰り返し同一個体から観測値を得た場合に"個体(=被験者)"が変量効果になるので、線形混合効果モデルだと"判断"すればよいでしょう。
お礼
ご回答ありがとうございます! 実践的でとてもわかりやすくて助かりました♪ 回答内容に関して質問があります。 時間経過があまり関係しないようなデータ、例えば、あるオリンピックのスケートの採点という以下のような場合、 特性値は、採点数、 要因は「審査員の評価の甘さ、厳しさ」と「スケーターの実力」の2つ どのように固定効果/ランダム効果かを決めればよいでしょうか? お時間ありましたら、ご回答よろしくお願いいたします。
お礼
遅くなりまして申し訳ございません。 参照したであろう本、まさにその本だと思います。笑 時間のお話についてもっと知りたいので、明日近所の本屋さんで立ち読みしてきたいと思います! 丁寧なご説明ありがとうございました!