- 締切済み
実験データの統計と検定でかなり困っています。
植物の生長量を調べる実験を計画しています。 AとBの二つの処理区での生体重の変化を見る項目があります。播種して二週間後に、任意で20本を切り取り、生体重を測り、平均値を計算し、処理開始前の生体重とします。 (質問1.この20本のばらつきは標準偏差で表すべきですか、標準誤差で表すべきですか。) その後に、50本づつ条件が違うA区とB区に分けて栽培実験を行います。実験終了後に、この二つの区での生体重を測って、平均値を計算し、処理前の生体重と処理A区とB区での生体重がどのように異なるかを比べる実験です。 (質問2.両区それぞれのばらつきを見るには標準偏差を用いるべきですか、標準誤差を用いるべきですか。) (質問3.エクセルのツールバーを用いて、両区での結果が有意差があるかどうかを見るには、まず二標本を使った分散の検定を行い、分散が等しいかどうか見た上で、二標本によるt検定を行うということで何か問題ありでしょうか。)
- みんなの回答 (7)
- 専門家の回答
みんなの回答
- Oxalis
- ベストアンサー率52% (179/338)
qryoec様 ありがとうございます。 ranranlさんへ 平均を比較すればよいとの考えかと思いますが、自由度(t)について学習してください。 2群の平均を比較したら、自由度はいくつになりますか? まともな話として、qryoecさんが言うように研究機関で試験報告をする人もハチャメチャな 統計処理をしている人が多いです。(特に畜産などサンプル数が取れない!) 生物統計だと5%水準ですら出せない例が多々・・・・ ひどい学生の卒業論文など5サンプルの比較ですまして堂々と発表! (指導教官も統計を理解していません。) これ以上はこのOKWaveではたぶん堂々巡りです。 書籍の「生物統計学入門」等を勉強されるか http://item.rakuten.co.jp/book/5831341/ 生物統計メーリングリスト http://cse.niaes.affrc.go.jp/minaka/ml/biometry-top.html あたりに質問を投げてください。 (環境技術研の人たちに怒られそうですが!) >キーワードは「有意差」、「ばらつき」、「自由度(t)」、「対」、「反復」あたり 少し冷たい言い方をしますが、見てくださいといった内容をまったく理解していないで 自分の質問だけ書かれると悲しくなりますが・・・・ スネデカーの「統計的方法」は学生時代のバイブルで理解するまでに どのくらい時間がかかったか・・・
- qryoec
- ベストアンサー率27% (33/120)
元の質問に対しての答えとしては、手続き的には処理前と処理後A区とB区のデータを分散分析および多重検定すれば終わりです(検定条件が整えば)。しかし、処理前のデータと処理後のデータを同格に扱って比較するのは妥当かどうかは検討の余地有りです。 生物データの統計処理は非常に難解で、その分野の研究者にはまともに統計処理できる人は少なく、論文発表のためにしかたなく行なう、という場合がほとんどです。 たとえば、処理前のサンプリングで20本をランダムに選び出すときに、どうしますか。本当にランダムに選びますか。大抵は、なんとなく平均的な値になるように(大きいもの、中くらいのもの、小さいものをうまくまぜて)選ぶでしょう。ランダムに選んで明らかに平均よりも大きいものが大半を占めて、そのままデータ処理ができますか。 だからこそ、ヒヨコに対する餌の効果を調べる時に体重増加を調べなくていいのか、という疑問を感じているのですね。当然です。 以上はほんの一例で、生物統計に関しては統計学の専門家から見るとありえないようなデータ処理や検定を行なっているものが本当に多いです。一方、データ処理をする側としては、使い物にならない統計処理技術はないのと同じ、という不満もあります。 今後も同じような壁にぶつかると思いますが、がんばってください。
- Oxalis
- ベストアンサー率52% (179/338)
>1、この雛の課題では、体重に有意さがあったということから、両飼料の効果は有意に違ったという結論に至るわけですが、これと同じく、体重増加に有意さがあったという検定を行っても同じ結論にたどり着きますでしょうか。 体重増加にこだわっているようですが、本質的に行っていることは同じだと思いますが? 逆に質問します。体重増加をどのように数値化しますか? ヒナ個別に実験前と実験後の体重を測定して出すのでしょうか? それとも11匹のヒナ合計の実験前と実験後の体重を測定してですか? >2.またにも、サンプリングにも戻りますが、実験開始の時点での体重は均一化されたものとみなすに不安があったとき、一元配置分散分析を行い、分散が等しいという結果がでたとしたら、これが、最初のサンプリングは有意さなく、均一なものだと安心できるのですが、いかがでしょうか。 俗に言う「母集団の検定」ですね?「一元配置分散分析」がここで 出てくるのが不思議ですが 「生物統計学」の演習ノートの http://www.d1.dion.ne.jp/~tmhk/yosida/toukei.htm 「6)分散均一性の検定」を行えば確からしさが判ると思いますが・・ 追記、やり取りは楽しいのですが、文章でのやり取りにもどかしさが
お礼
>追記、やり取りは楽しいのですが、文章でのやり取りにもどかしさが 本当に申し訳ありません。 >「一元配置分散分析」がここで出てくるのが不思議ですが 統計学は最初から、しっ~かり~と勉強していたのでしたら違ったと思いますが、私の場合は、最初から統計や確率なんかにすっごく鈍感だったので、内容が進むほど、何がなんだか、全く理解しないままただテストでぎりぎりの点数を取って終わらしてしまいました(猛反省)。 こんな私に付き合っていただき、本当に感謝いたします。 申し訳ありませんが、もう一回本題に戻らせていただきます。 1. >体重増加をどのように数値化しますか? >ヒナ個別に実験前と実験後の体重を測定して出すのでしょうか? >それとも11匹のヒナ合計の実験前と実験後の体重を測定してですか? どちらでもないのです。 飼料を投与したヒナ11匹の実験前の体重の平均値と、実験後個別の体重の差を求め、同じ方法で求めたB飼料投与時のものとの平均値の差の検定を行うということは統計的に間違ったやり方となりますか。 というのは、私の植物の実験では、個体重の増加が異なる処理区で有意差があるかどうかを見るには、同一個体の実験前後の重量というのが正確に求めにくく、大元の質問のように、「任意で20本を切り取り、生体重を測り、平均値を計算し、処理開始前の生体重とします。」と言ったのです。 2. もし、1.のやり方は問題だとしたら、やはり、実験開始前の重量は「均一化されたものとみなし」、特に統計分析は何もせずに、処理後の植物を切り取り、両試験区の重量を求め、間に有意差があったかどうかを見れば良いということでしょうか。 3. 同じ実験を栽培開始時間が違うだけで、他は全く同じ条件で、合計3回繰り返したとしたら、どうなるのでしょうか。 「ここまでくる質問者!!」とOxalisさんが怒ってしまわないように、ただただ願っております。 どうぞよろしくお願いいたします。
- Oxalis
- ベストアンサー率52% (179/338)
>その飼料を与え始めたときの11羽のヒナの体重がどうして触れずにしても問題ないのでしょうか。きになってしょうがないです。 >私の考えでは、これで飼料の効果に差があったかどうかを言うのは間違いで、体重の増加量からではなければならないと思ってしまうのですが、どちらが正しいでしょうか。 ヒナは選んだ時点で個々それぞれ体重も生育も違うために、そう思われるのかもしれませんが、 統計では大きな集団(母集団)から11匹づつを選ぶ(サンプリング)した段階で、そのヒナの集団の代表選手 として均一化されたものとみなします。 (説明のために抽象的に記載しています。) その同一と思われるヒナを飼料AとBで育てたので体重の増加ではなくて、育った2群の平均と偏差で比較をするのです。 サンプリング http://www.asaori.co.jp/special/marketing/vol6/guide_2.html サンプル数が少ないと誤差が多いので学生にはなるべく多くのサンプルを 調査しろとよく言っていました。
お礼
再びご回答いただきありがとうございます >統計では.....均一化されたものとみなします。 そうなんですか。少ししつこいかもしれませんが、もし良かったらもう一回お願いできますでしょうか。 1、この雛の課題では、体重に有意さがあったということから、両飼料の効果は有意に違ったという結論に至るわけですが、これと同じく、体重増加に有意さがあったという検定を行っても同じ結論にたどり着きますでしょうか。 2.またにも、サンプリングにも戻りますが、実験開始の時点での体重は均一化されたものとみなすに不安があったとき、一元配置分散分析を行い、分散が等しいという結果がでたとしたら、これが、最初のサンプリングは有意さなく、均一なものだと安心できるのですが、いかがでしょうか。 長い間気になりながらも、なかなか教えてもらえる人がいませんでした。 しつこくて本当に申し訳ありません。 よろしくお願い申し上げます。
- Oxalis
- ベストアンサー率52% (179/338)
学生さんかなと思いますが、基本的に「標準偏差」と「標準誤差」とかを良く理解して いないようですね・・・ 生物統計は変な言い方をすればソフトで(数字の)解析できますが、意味がわかっていないと ここで即答しても(意味の)解析ができません。 「生物統計学」の演習ノート http://www.d1.dion.ne.jp/~tmhk/yosida/toukei.htm この辺を参照してみてください。 キーワードは「有意差」、「ばらつき」、「自由度(t)」、「対」、「反復」あたり (1現役生物系の大学生でも理解していない人がほとんどですから、あせらずに! 研究職で飯を食っていても危ない人が。。)
お礼
こんなサイトもあったんですね。分かりやすくて、ただ驚きです。 救われた気持ちでいます。どうもありがとうございます。 良かったら、もう少し教えた頂けますでしょうか。 このURLの中の課題2.のヒナの実験ですが、 「ランダム(無作為)に選んだ11羽ずつのヒナに,一方は飼料 A,もう一方は飼料 B を与え,この2組を同じ囲いに一緒に入れ後日体重を測った.飼料間に差があるか.」 ここで、後日の体重の絶対値に差が出たかどうかを検定しただけで、与えた試料の間に差があったかどうかが分かるとなっていますが、その飼料を与え始めたときの11羽のヒナの体重がどうして触れずにしても問題ないのでしょうか。きになってしょうがないです。 私の考えでは、これで飼料の効果に差があったかどうかを言うのは間違いで、体重の増加量からではなければならないと思ってしまうのですが、どちらが正しいでしょうか。 頭悪くて申し訳ありません。 よろしくお願い申し上げます。
- elpkc
- ベストアンサー率53% (626/1160)
平均値の差の検定を行います。 分散が同じ場合は、Studentのt検定、不等分散の場合は、 Aspin-Welchの検定を行います。 http://www.gen-info.osaka-u.ac.jp/testdocs/tomocom/ave.html をご覧ください。
お礼
ありがとうございます。検定の部分URLを貼っていただきとても参考になりました。 良かったら、質問1と2もそれで大丈夫かどうか教えていただければ安心します。 よろしく御願いいたします。
- nemoax006
- ベストアンサー率14% (343/2433)
あなたが欲しいデータはどのような形なら生データになりますか あなたが目的とするデータになるようにデータを採取してください
お礼
Oxalis 様 悲しまないでください。申し訳ありません。 最初から勉強直します。こうするしかないです。 分からないところまた一杯出てくると思いますが、そのときまたよろしくお願い申し上げます。 本当にありがとうございました。