- 締切済み
有意な差を調べたいのですが
ある広いホールの中の5箇所で,室温を時系列に測っています. 各箇所で測られた室温に有意な差があるかどうかを調べるやり方を知りたいのですが,教えていただけますでしょうか?
- みんなの回答 (4)
- 専門家の回答
みんなの回答
- kgu-2
- ベストアンサー率49% (787/1592)
>質問者の能力の低さを示すリスク 能力の低さ、なんぞは気にしません。私は、過去の回答の中で、学生時代に、推計学の試験は教科書持ち込みだったが、1時間中、その教科書をめくってばかりだった、すなわち、どこを見ればよいのかさえ分からなかったと、自白しています。また、流行の多重比較なんぞはできない(=能力が低い)、と書き込んでいます。 私が、初心者ながら、書きこんでいるのは、必要に迫られて、なんとかこなせるようになり、初心者がどこで行き詰るのかが理解できると考えているからです。頭の良い人は、行き詰ることがないので、悩む必要はないようですが。というわけで、数式は平均値の算出、標準偏差の計算くらいしか説明できません。 話がズレテしまいましたが、たぶん分散分析、この場合、場所と時間の2つの因子なので、2元配置分析、で検定できるハズです。 手持ちの本には、濃度と時間を変えた場合の生産高が例題として書かれていましたので。もちろん(?)、やったことはありません。 練習とおっしゃるのでであれば、方法を訊いているようでは、練習になりません。昔は、計算が大変でしたが、今ではパソコンがやってくれるので、方法さえ決定すれば、ソフトに従って入力でき、誰でも同じ結論を得られるからです。簡単に。
- kgu-2
- ベストアンサー率49% (787/1592)
No2です。 >課題の丸投げではなくて 練習問題なら解答があるハズなので、丸投げです。本を買って、コツコツやっている、というのなら、似たようなものがあるハズ。 No2が不十分だったので、少しだけ続きを。 私は、やったことがないので、思い出しませんでした。難しく考えすぎました。○○配○、でやれるハズ。私には理解できず、眺めただけです。
- kgu-2
- ベストアンサー率49% (787/1592)
検定の基本である「検定法を考えてから、データを得る」という統計学の基本に反していることを、まず指摘しておきます。 5か所を検定するのは、多重比較になります。これは、初心者の私には、無理。とりあえず、差のありそうな2か所で比較しましょう。 検定の場合、時系列的なデータを比較することは、あまりありません。同時にデータを得る、というのが基本です。同時に測定した場合のデータの比較なら、場所だけの差の検定です。 が、これに時間の変化という要素が入っているので、場所と時間の2つの要素について同時に検定する方法は知りません。 そこで、時間によって、場所のデータが影響されるか否かの検定をしましょう。 横軸に測定日時、縦軸に測定値をとり、回帰分析をします。日時と測定値に有意な相関があれば、測定値は日時に影響されていることが示せます。有意であれば、場所ごとの回帰係数を計算して、その回帰係数に有意差があれば、場所によつて、有意である、と結論できます。 空調をしていれば、有意差が見られないと想います。そこで、時間の影響は受けないだろう (受けない、とは統計学上、絶対に言えません) と仮定し、2ヶ所ならt検定、5か所同時ならH検定などの多重比較をする、というのが思いつきますが。 以上は、あくまでも、統計学の練習問題と考えた場合でず。現実への適用については、必ずしも一致しません。簡単に書きましたし、どの程度の知識をお持ちかしらないので(t検定程度は、こなしておられる、と感じているのですが)、釈迦に説法の点は、ご容赦を。 ところで、ご質問の場合、どのような立場で、なぜしたいのか、くらいは知りたいところです。学生や院生が、同様な質問をするので、「指導者無無視」「謝辞というマナー知らず」と書き散らしています。
お礼
ありがとうございます. 院生の友人が聞いてきたので,代わりに投稿しています. 統計の練習問題だそうです. 課題の丸投げではなくて,教えてくれる人がいないようで困っているとのことでした.
- KitCut-100
- ベストアンサー率48% (94/193)
二種類の測定値があるとします。 例えば 北海道の中学三年生の学力テストの 結果と沖縄のそれ。 このデータを使って有意な差があるかの検定をするとします。 基本的な考え方は、まずそれぞれの平均値とσをを求めます。 平均値 X-bar(北) 平均値 X-bar(沖) 標準偏差=σ(北) 標準偏差=σ(沖) このとき 平均値の差=X-bar(北)-X-bar(沖) は, σ= √( σ(北)^2/n1 + σ(沖)^2/n2) n1,n2はそれぞれサンプルの個数 となります。 このσより、正規分布表を利用して、自分が仮定する棄却率例えば 5%とか10%に従って、それに対応する値を求めます。 この求めた値と平均値の差の大小を比較して有意差を判定します。 御質問の場合は、時系列データをどのように処理するかがポイントとなります。 方法はいく種類も考えられます。どの方法正しいか真実に近いかは、その現象を 物理的にどのように捉えてその変動がどのような物理事象により発生しているかの仮定が正しいか否かにかかっています。 例えば、 ホールの中の温度が空調の稼動の変動によると考えると空調の稼動状況との関係でデータを処理します。 ホールの温度が外気温との関連で変動しているとすればそれとの関係で処理します。 ホールの温度がホール内の人の動きに関連していると考えればその関連で処理します。 しかしこのような仮定を置けないのであれば、単純に各測定ポイントで処理します。 ただし時系列データの場合、データの個数が沢山ありますが、概して測定誤差を 多く含んだデータとなっていますので、ある時間、例えば5分なり10分の平均値を 一つの値として扱って、処理する対象を定めます。 やはりここでも物理的に その測定値がどのような性質かの判断が入っています。 この後は先ほどの方法に従って、平均値、σをもとめ判定をします。 ここからが私のお勧めですが、統計的には上記の方法をとりますが、本当は このようなことをするより、愚直にデータでグラフを書いてそれをじっくり眺めれば 本当の答えがでます。 例えば グラフを書いてみて それぞれのポイントは連動して温度変化をしておりその変化は 15℃あった。 しかし各ポイントの差は1^2℃で あった。このようなデータであれば、各ポイントの有意差を論じる事自体あまり 意味がないことがわかります。 まずはグラフを書いて、データの傾向をつかまれるのが第一でありまたそれが結果となります。
補足
ありがとうございます. ちょっとやっている作業を知りたいのですが,考え方としては,平均値2県の平均値をそれぞれとって,平均にどの程度ズレがあるのか,有意な差があればあるほど,平均値の差は大きくなるというスタンスでやっているのですよね? そこまではわかるのですが,そのあとに σ= √( σ(北)^2/n1 + σ(沖)^2/n2) ------(1) という式が出ています.これは何を意味しているのでしょうか. 適当に数字の集団を2組用意して,それぞれ平均と標準偏差をとったあとに,(1)式を計算したのですが,2組の平均値の差にはならないのですが・・・
補足
ありがとうございます. 似たような問題にひっかかっていれば,そもそも,質問者の能力の低さを示すリスクも発生しかねない質問を,ネットで世界中に流しません. ○○配○で,とけるとのヒントありがとうございます. すみませんが,手元の統計の参考書の索引を見たのですが,どうもそれらしいキーワードにひっかかりません.あと1字程度,いただければありがたいです.