- ベストアンサー
科学実験結果の適切な集計・統計について
科学実験での集計の方法について疑問があります。 ・細胞についているある構造の大きさが、薬を投与したかどうかで差があるかどうか知りたい ・1実験につき、1細胞しかしらべることができない ・1細胞にくっついている構造の数は2-7個と、実験の度に数が異なる このとき、[1] 全部の構造をまとめて平均してt検定すべきなのか [2] 実験ごとの平均について平均して比較すべきなのか、わかりません。 また[2]の場合は適切な検定法が分かりません。 ケースバイケースだよ、という場合は、詳しく教えていただけると助かります。 ちなみに、分散分析してみた結果、実験間の偏差は比較的大きいことが分かっています。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
ケースバイケースでしょう。適切な評価方法を見つけるのも研究のうちです。その比較が何を比較しているかを考えればおのずと答えがわかると思います。 質問の条件では漠然としているので、より具体的な桃の例で言えば、それぞれが比較しているものが違います。 桃全体を平均すれば、地域の比較になるでしょうし、 木の平均の平均なら、木の比較になるでしょう。 平均の平均の他に、中央値、最大値を評価する方法もあります。 でもたぶん最初は、n自体を比較し、次にnが同じ個数のもの同士を比較するでしょう。
その他の回答 (4)
- microham2
- ベストアンサー率30% (64/207)
>nが同じ個数のもの同士を比較すると、n=2では大きさに有意差がでたのにn=3では有意差がでなかったというときに解釈が不可能になりますよね? この場合は、解釈が不可能と考えるのは誤りです。 真にn=2の時だけ差があるのかもしれません。それを見落とすようでは研究者失格です。なぜ違うかをつきつめていきます。 n=3ではサンプル数が少ないために差が出ないと考えられればサンプル数を増やします。 nが同じもの同士を比較して問題になるのは、むしろ群分けによりサンプル数が減るためにすべての群で差が出ない時でしょう。 >しかし疑問が残るのですが、僕が桃の例で挙げた[1]-[3]の案は、いずれも、研究の目的によっては妥当といえるものなのでしょうか? 無条件では認められませんが、目的によっては妥当なこともあるでしょう。 それが妥当かどうかの判断は、検定方法が前提とする分布に、母集団が乗っているかどうかなどで行います。t検定なら正規分布ですよね。 >一番ひっかかっているのは、木の平均の平均を地域間で比較する手法の統計学的妥当性なのですが、これに普通のt検定を使ってもよいものなのでしょうか? 母集団が分散がXの正規分布を仮定できる場合、そこからn個を取って平均すると、分散は X/n になりますので、nの数によらずに分散が同じことが仮定出来る標本に対し、桃の実の比較をするなら、普通はしません。 でも、視点がを変えて、桃の木を比較するなら、ありえますね。その場合、平均、対数平均、中央値、対数平均、指数平均、合計など、なにを木の代表値にするかは検討が必要でしょう。 [1]の長所は、分散が母集団と同じこと、欠点は標本数が減ること。 [2]は、まぁまず順当でしょう。差が出てから、そういう心配をするといいでしょうね。というか、全体で差が出るなら楽なものです。 要は、統計的に矛盾がないように、きちんと説明がつけば良いのです。
お礼
> 解釈が不可能と考えるのは誤りです おっしゃる通りです…ご指摘ありがとうございます。 microham2さんの説明を伺ってきて、僕は、解析の前提となる母集団をきちんと把握できていなかったために、どの解析手法が妥当なのかが判断できなかったのだ、ということが分かってきました。 [1]では桃の実の大きさの母集団と分散が同じ、というのも全く気づいておらず([1]と[3]の分散が同じ気がしていた)、また気づいていなかった自分の無関心さに驚きました…考えが足りませんでした。 正しい統計の推論ができるようになれるよう、今後は注意深く考えて研究を続けていきたいと思います。 未熟ゆえのくだらない疑問に丁寧に説明くださって本当にありがとうございました。
- kgu-2
- ベストアンサー率49% (787/1592)
電車で、ブツブツ独り言をいつまでも言っている人に似てきますので、最後の独り言を。 >薬品投与前と投与後での標本内比較はできません。 これができると、t検定の対応のある場合が利用できそうですが。なんとかなりませんか。 >観測できた個数と構造の大きさの間に有意味な関係はありませんし、 2個の木と7個の木を比べることの難点は、「薬品の影響ではなく、桃の数が違っているからでは」という質問(突っ込み)に答えられないからです。関係ないと断言できるなら、この相違は無視できると判断しますが。 ただ、統計学では、「有意差有り」は言えても、「差がない」は主張できません。「差は見つからなかった」しか。念のため。 また、相関分析は、データ数を100くらいとると、散布図上ではバラバラで無いように見えても、検定すると有意差有り、も珍しくありません。
お礼
桃の数と桃の大きさの間に絶対に相関がないということが明らかな場合は、代表値を使うなりすべての桃を解析対象とするなりして2個と7個の木を一緒にして比較してもいいかもしれないということですね? 研究者のマナーに関する意見が全く違っていた僕にここまで付き合っていただいて本当にありがとうございました。
- kgu-2
- ベストアンサー率49% (787/1592)
>2. 独創的かつ魅力的なアイディアを そんなアイデアを教えるようでは、この世界で生きていけません。また、それを使うのは、師弟関係などを除いて盗作同然。私は、その助言・手助けなどによって、実験が進んだ場合(無いと進まなかった場合)は、書くことにしています。4年生の手伝いは、特定の人でなく、誰であっても大して変わりませんが、最後のスライドの研究室全員の写真などは、謝意が滲んできます。 >1. 実験は一人でやっているわけではなく指導者がおります その指導者に訊くべきです。私の学生なら、『私を馬鹿にしている』と追放ですね。なにより、研究内容に関することを他に洩らすのは、アイデアを盗まれる元なので、研究者としての姿勢に問題があります。友達くらいなら盗むほどの力はないので、私には許容範囲ですが。 実験に関する回答を書き込むのは、その指導者の許可を得ないと、失礼に当たります。隣の部屋の教授のところで、実験の相談をしている学生を、どのように感じますか。というわけで、独り言を少々。 >実験間のばらつきを無視し、 検定をする場合の前提は、集団の性質を同一にそろえること。対照群はネコ、投与群はイヌ、なんぞはしません。例えが離れすぎていますので、桃の大きさを比べるときに、1本の木に5個くらいなりそうな小さい木と、50個なりそうな大きな木とは、比較しないでしょう。 検定の最初は、帰無仮説。AとBの集団に差はない、と仮定して検定が始まります。小さな木と大きな木では、実験前から差がないとは言えません。 1個の細胞に、2-7の構造物(ミトコンドリアだと面白そう)があり、薬品を投与する前と後で測定できるなら、t検定かF検定。カイ2乗検定、符号検定でもできそう。まず検定法を考え、それに即した実験をする、というのが手順です。そうすれば、労働量は知りませんが、検定は難しいとは感じません。というより。難しくない検定でできるよう、実験法を考えよ、と勧めています。 2個のものと7個のものでは、その大きくなるものに差があるか、というのは独創的なアイデアになりませんか。図表の一枚くらいには、なるハズですが。私なら、意味があれば、さらに相関分析と回帰分析をします。 差があれば、あとマニュアルどおりで、2つや3つの論文は簡単。
補足
kgu-2さんのたとえを使わせていただくと、2地域の桃の大きさを比べるとき、桃が1本の木に2-7個くらいしかならない場合、みなさんはどうやって比較しているのでしょうか、という疑問でした。 [1] 1つの木から桃を1個だけとって代表値としてその平均を比較 木からとれた7個の桃から1個の桃を選ぶのは無知ゆえか抵抗がありますが、これをたとえば乱数で無作為抽出するようなやり方って適切なのでしょうか。 [2] それぞれの木からとれた桃をすべて地域内平均して比較 地域内の1本1本の木で桃の大きさにばらつきがある場合、なっている桃の個数によって重み付けが異なってしまうことにならないか疑問。 [3] 1つの木でなってる桃の大きさの平均を代表値としてその平均を比較 それぞれの木でだした平均は重み付け(個数)が違うので妥当な検定手法がないと思われる。 自分なりに考えていると、[1]は特に問題がなく、[2][3]はだめなのかなという気がしてきましたが、どうでしょうか。 薬品投与前と投与後での標本内比較はできません。 また、観測できた個数と構造の大きさの間に有意味な関係はありませんし、相関がないことはすでに確かめております。
- kgu-2
- ベストアンサー率49% (787/1592)
ご自身でわかる統計法を利用できるように、実験計画を立てるべきかと。 基本的には、実験する前に、統計処理の方法を考えておくべきです。私の学生なら「とっても賢いね」とは、褒めません。 1 実験は、おひとりでやっていますか(指導者などは、いませんか) 2 実験に関して、アドバイスを受けた場合、「謝辞」を述べるのは、科学者としての基本的なマナーですが、これはどのようにお考えですか。 >・1細胞にくっついている構造の数は2-7個と、実験の度に数が異なる たとえば毛(表現は適正ではありませんが)の大きさの変化について調べているときに、細胞によって、毛の数が違う、ということなら、初心者の私には検定は、無理。ひと工夫する必要があります。 >構造の大きさが、薬を投与したかどうかで差があるかどうか知りたい この変化は、数値で表せますか、それとも個数でしょうか。それによって、検定法は違ってきます。
補足
やはり実験ごとに毛の数が違うような場合には通常の検定は無理なのでしょうか…。 実験間のばらつきを無視し、観察できた全部の毛の平均をcontrolと投薬条件とで求めてunpaired t-testするのはやはり問題があるのでしょうか。 こういうジレンマは医学系の実験ではよくある状況だと思うのですが、みなさんどのようにしているのでしょう。 構造の大きさの変化は共焦点顕微鏡の画像で作成した3Dで体積として数値化可能です。 1. 実験は一人でやっているわけではなく指導者がおります 2. 独創的かつ魅力的なアイディアを特に実験計画に関していただいた場合は論文中で当然謝辞を掲載しますが、基本的な事柄についていただいた助言やアドバイスにつきましては謝辞として掲載する必要があるとは考えておりません。
お礼
nが同じ個数のもの同士を比較すると、n=2では大きさに有意差がでたのにn=3では有意差がでなかったというときに解釈が不可能になりますよね? 実際の僕のデータではn=2などではNが少なく検定できず残念ながら使えなさそうですが、確かに、microham2さんのおっしゃるようにnが同じもの同士をそれぞれ比較して全てのnで有意差が出ればこれが一番問題のない解析かもしれませんね。 また、1つの木の中の桃で中央値・最大値を求めてその平均を比較するというのも、なぜか論文であまり見ない解析法ですが、1つの手かもしれないと気づかされました。 ありがとうございます。 また、「木の平均の平均なら、木の比較になるでしょう」で気づいたのですが、全ての桃を抽出したときの分散は桃のばらつきを意味し、1つの木の中の桃の平均についての分散は木ごとのばらつきを意味するので、後者を地域ごとに比較して優位差が出た場合、「一方の地域の方が木になる桃が大きい」という命題ではなく「一方の地域の方が大きい桃のなる木が多い」という命題になってしまうのですね。 恥ずかしながら分かっておりませんでした。 しかし疑問が残るのですが、僕が桃の例で挙げた[1]-[3]の案は、いずれも、研究の目的によっては妥当といえるものなのでしょうか? 一番ひっかかっているのは、木の平均の平均を地域間で比較する手法の統計学的妥当性なのですが、これに普通のt検定を使ってもよいものなのでしょうか?