• ベストアンサー

どんな検定手法をつかえばよいのですか?

次のような観察をしました; あるトリ(キンカチョウ)がいて、鳥かごの中が10区画に区切られています。1分おきに、トリがどの区画にいるかを30分間記録しました。このデータを4羽の鳥について記録しました。どうも個体によって鳥かご内での好きな位置が決まっている印象を受けました。そこで、“トリには「好きな位置(区画)がある”という命題を実証したいのです。手元には、次のようなデータが4羽分あります。   位置: a b c d e f g h i j いた回数: 0 0 0 0 0 4 5 4 8 0 イメージとしては、 帰無仮説:トリのいる区画はランダムにばらついている 対立仮説:トリはある特定の区画にいる の様になると思うのですが、統計をきちんと学んでいないのでどのような統計手法を用いればよいのかがわかりません。教えてください。よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#12673
noname#12673
回答No.4

学生意見ですが、参考になればうれしいです。 設問の中に、2つの命題があり、それをまとめて実証しようとしているので、ご苦労されているのではないかと思います。 一つは、「鳥かごの中でトリの居る場所は特定の場所に偏る」ということ、コレを命題1とします。 もう一つは命題1が実証された上で、「鳥かごの中でトリの居る場所(偏りの中心)はトリ毎に異なる」ということだと思います。これを命題2とします。 一つめの命題を実証するには、適合度のカイ2乗検定を使うのが良いでしょう。 帰無仮説:鳥かごの中でトリの居る場所は特定の場所に偏らない 対立仮説:鳥かごの中でトリの居る場所は特定の場所に偏らないとはいえない とします。 帰無仮説の元では、トリの居る場所は30回の観測で、各々の場所に3回ずつ居ることになります。これが区間の期待値となります。今回はみんな同じですけど。 それと観測値の差の2乗をとり、期待値で割ったものを区間分たします。 上に書いてある手元のデータ(1羽分)には30回分の観測値がないのでちょっと 水増しさせていただきます 位置__:a b c d e f g h i j 合計 いた回数:0 0 0 0 1 6 7 6 9 1   30 期待回数:3 3 3 3 3 3 3 3 3 3 30 差の2乗:9 9 9 9 4 9 16 9 36 4 105 /期待値: 3 3 3 3 1.3 3 5.3 3 12 5.3 35.9 でこの(差の2乗/期待値)の合計35.9と自由度9(区関数-1)、有意水準0.05あたりのカイ2乗分布表を引いて、比べてみて、35.9の方が大きければ帰無仮説を棄却すればOKです。 ただ、他の方がご指摘したとおり、n分目の観測値が、n-1分目の状態に依存する可能性が大きい観測の仕方だと、検定の大前提である試行の独立性があやしくなります。 「鳥かごの入り口から中に放って、1分後のトリの位置を30回観測する。」 というような観測方法にしないと正確ではないと思います。 そして、命題2なんですが、これはちょっと難しいと思います。 理由の一つは、データが4つしかない。ということです。 トリごとに好きな位置が違うというようなことを実証したいのであれば、トリの方の数を増やさなければいけません。 以下はトリの数を十分用意できると仮定して話をします。 命題2は、個体ごとに偏る位置が違うというこを実証することで証明できますが、 帰無仮説の立て方が難しいと思います。 帰無仮説が正しいときに、各区間で期待される観測数をいくつにしますか? 帰無仮説が、「トリの好みはみんな一緒」とするならば、 どの位置がトリ全体が好む場所で、そこにどのくらいの確率でトリが居ること観測できるかを設定できるでしょうか? 逆に帰無仮説を「トリの好みはてんでんバラバラ」として、これを採択することを目的に検定するならば、この帰無仮説におけるトリの好む位置は、全ての区間で等確率になります。100羽用意できれば、一つの区間に10羽づつ居ることになります。(表現上はこう書きましたが、一辺に100羽カゴに放てということではありません) そして、トリの好む場所を定義した上で(30回の観測で一番多かった区間、というような感じで)100羽分観測してください。 ちなみにこの観測だと、あなたは3000分以上拘束されることになります。50時間以上です。大変ですね。 命題1でもそうですが、鳥カゴの区関数10に対して、30や4という観測数(サンプルの大きさ)は適当でしょうか? 一区間あたり3とか0.4になってしまいます。 ちゃんとやるのであれば、せめて、一区間あたり10や20は欲しいところです。 つまり100回、200回ってことですね。

anti-slave
質問者

お礼

なるほど。確かに自分の命題には二つが混在したものでしたね。ご指摘感謝いたします。 今回の観察ではnが足りない、というのもご指摘のとおりだと思います(観察は4羽だけです)。統計にあかるくないものですから、この結果を統計的に考えるにはどのような方法があるのか知りたいと思ったのです。ご丁寧な教授どうもありがとうございました。

その他の回答 (3)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.3

帰無仮説は、これを仮定することによって統計的な予測が可能でなくては意味がありません。ご質問の場合、 「トリのいる区画はランダムにばらついている」 から定量的予測を立てなくちゃいけません。具体的にはひとつの区画(どの区画でも同じ事です)にN回の観測中n回トリが居ることが見いだされる確率P(N,n)を予測します。区画の数をMとするとき、P(N,n)は「1~Mをランダムに選ぶという試行をN回繰り返したとき、1が丁度n回選ばれる確率」であると定量的予想ができる。つまり 帰無仮説(1):どの区画も、N回の観測中n回トリが居ることが見いだされる確率はP(N,n)である。 が立てられる。これを検定すればよい。つまりこの仮説の元で、観測して得たデータが偶然現れることが極めて珍しい(つまり帰無仮説が棄却される)のかどうかを判定する。これが検定です。 「どのような統計手法を」と仰っているのは、典型的な問題における検定に名前をつけて整理したものの事でしょうけれど、パターンにとらわれる必要はありません。 一方、回答No.2で指摘されている「ある区画にトリがいる確率は、観測ごとに独立であるかどうか」は、帰無仮説(1)が棄却されたかどうかとはまた別の問題でしょう。 帰無仮説(2):引き続く2回の観測の結果は無相関である(相関係数が0である) を考えてみることができます。たとえば、これが棄却されてしかも帰無仮説(1)が棄却されない場合には ・(区画の大きさ÷トリの移動速度)に比べて観測の時間間隔が短いのか、 ・トリはある場所に長時間留まっては急に大きく移動するという行動をしているのか、 などが疑われます。(んでも、ご質問の問題意識に於いてはこんなことには注目していないようです。) なお、「対立仮説」なるものはしばしば間違いの元になります。ご質問に挙げられた対立仮説も不適切です。対立仮説は帰無仮説の否定に過ぎず、それ以上のことは全く言えません。例えば帰無仮説(1)の対立仮説は「(どの区画も、N回の観測中n回トリが居ることが見いだされる確率はP(N,n)である)は嘘だ」すなわち、「少なくとも一つの区画において、N回の観測中n回トリが居ることが見いだされる確率はP(N,n)ではない」です。 そして、対立仮説は検定において全く、何の役割も持っていません。使い途が無く、なおかつ単に帰無仮説の否定に過ぎないのですから、stomachmanは対立仮説という概念はそもそも不必要だと考えています。

anti-slave
質問者

お礼

丁寧に教えていただきどうもありがとうございます。 「対立仮説は帰無仮説の否定に過ぎず、それ以上のことは何も言えない」ことは、そういえば以前読んだ統計の本に書いてありました。今後の教訓にさせていただきます。

  • redbean
  • ベストアンサー率38% (130/334)
回答No.2

検定するとすれば、カイ自乗検定が使えるでしょう。 理論的な度数と測定された度数との間に有意差が あるかどうかみるものです。 実例は google などで「カイ自乗検定」をキーワードに 探せば見つかると思います。 ただし、今回の場合で言えば、1分おきの位置は前回の 位置の影響を受けるはずなので、「トリのいる区画は ランダムにばらついている」という帰無仮説は強引過ぎる と思いますが。 強いてやるとすれば、物理学のランダムウォークとか 拡散の過程とかの理論を借りて理論的な度数を作り、 それとのずれを検証するなどの方法が考えられます。

  • etosetora
  • ベストアンサー率22% (39/175)
回答No.1

検定の必要は無いと思います この程度は散布図かいて  こういう傾向があります の一言で終わりです。 統計的手法の基本は正規分布です。 正規分布とは、ある目標に対して結果がどうだったという考え方です 母平均 とか 母分散 とか 対応のある数値の差の検定とか です だいいち30分のサンプリングでは鳥が就寝中だったら1ヶ所から動くはずないじゃないですか? 検定というのは、開き直って考えれば だれがどう考えても○○と思う ことにたいして 裏を取る だけじゃないですか みんなが見て なるほど と思えば 検定の必要はありません。 と思いますよ。

anti-slave
質問者

お礼

ご回答、ありがとうございます。 「検定というのは誰もが思うことに対して 裏をとる だけ」、たしかにおっしゃるとおりの面があると思います。ですが、敢えてこのような場合に統計的有意性をもちだすには、どのような手法があるのかを知りたかったのです。決して「有意」を錦の御旗と思っているわけではありませんが、今後の参考のためにも。考えられるとすればどのような手法があるか、教えていただけないでしょうか?

関連するQ&A