- ベストアンサー
エクセルでのカイ二乗検定の仕方について
いつもご利用させて頂いております。 大変、親切に教えて頂けますので、ありがたいです。 さて、エクセルで、統計のカイ二乗検定のやり方を教えてください。 行いたいことは、 はじめる前と、終わりでの変化です。 カイ二乗検定で、「有意さがある」とうことは、どういうことでしょうか?? よろしくお願い致します。6才の子どもでも分かるようにお願い致します。 よろしくお願いします。
- みんなの回答 (7)
- 専門家の回答
質問者が選んだベストアンサー
ひとつ、言い忘れていたことがありました。 t検定は、母集団が正規分布していることを仮定しています。 標本の数が多いときは、(一応50~100個以上の数量データが無難かな)正規分布しているとみなしていいのですが、、、 母集団が正規分布しているとみなせない場合や、標本数が著しく少ない(20個以下とか)なら、正規分布を仮定しないでも行える【ノンパラメトリック検定】を使う方がいいと思います。 前後の比較なら、ノンパラメトリック検定の【ウイルコクスン符号付順位検定】がいいでしょう。 その場合も有意確率が算出されて、解釈の仕方は同じです。
その他の回答 (6)
- kgu-2
- ベストアンサー率49% (787/1592)
No2です。 問題点は、2つ。 第一は、検定の原理。これは、帰無仮説を否定する、ということのご理解。これは、慣れるまでに時間がかかります。練習問題を繰り返してやるのが一番です。 とりあえず、t-検定、F-検定、カイ-2乗検定の練習問題をやってください。そうすると、どの場合に、どの検定法を使うのが、どの場合につかってはいけないのか、が理解できます。 そうすると、 はじめ 終わり よく考えた 10 16 考えた 15 12 まあまあ考えた 4 2 考えなかった 0 0 の場合は、t-、F、カイ-のいずれも使用できないことが分かるハズです。 このようなアンケートは、統計処理が難しいので、私はやりません。まず、どのように統計処理をするかを決め手から、研究を始めます。 「研究をして、あとから統計処理をなんとかして」と持ってこられても、救いようが無い」と大学の講義で聞き、『何のことやら』と感じましたが、長年の経験で、今では理解できます。 ただ、上の例では、はじめと終わりの人数が29と30人で異なっているので、それだけでも学術論文なら、まず落とされます。 第二は、検定の計算。これは、t-、F、カイ-検定程度は、エクセルで簡単に計算できます。 JMPが何かは知りませんが、もっと複雑な検定だと、高価なソフトが必要でしょう。 はじめと終わり、と書かれていたので、『t-検定』と想ってしまったのですが、この類のアンケートは、無理です。 最近、このような事例の処理法を目にして、『カイ2乗検定の拡張?』と感じた記憶があります。ですから、処理する方法は、あります。 指導教官か、統計が専門の教員にお聞きになるのが一番です。その場合でも、t-、F、カイ-検定の相違くらいは、理解していないと、・・・。
お礼
早速,回答くださいましてありがとうございました。お礼申し上げます。
- ssmarugoo
- ベストアンサー率47% (84/176)
>質問1 「差がないという仮説でいくのですか?」 いいえ。違います。基本的に実験者(あなた)は差があると思うからその研究をしていることだと思うので、「はじめと終わりで差がある」と考えます。これが仮説です。 この仮説を証明するには、逆の仮説を立ててそれを否定する形でいくのです。統計の検定はこのような考え方で計算され、結果が出ます。逆の仮説を帰無仮説(きむかせつ)といいます。帰無仮説「はじめと終わりに差がない」の確率です。これがとても低いなら、(有意確率とか、棄却閾といいます)帰無仮説を捨てて、反対の仮説「はじめと終わりに差がある」を正しいとみなします。(この反対の仮説を対立仮説といい、これこそホントのあたなの仮説なのです。) 面倒な考え方ですが、割り切ってください。 しかも、上記は計算の途中の式みたいなものなので、論文の中には帰無仮説とか言う必要ないです。普通に「はじめと終わりに差がある」という仮説を立てて、有意差があった。とか書けばいいです。 >質問2 0.05以下では、「差がない」と考えるのですか? 0.05以上ならば、「差がある」と考えるのですか? 有意水準(棄却閾)をどう定めるか?の問題なので、実験者(あなた)が決めていいのですが、普通は0.05か、0.01以下を有意水準にします。 で、0.05とするなら、0.05以下では、答えは「差がある」です。 0.05以上なら、答えは「差があるとはいえない」です。 どうやら、あなたは逆に覚えているみたいです。【差がない確率】が0.05以下になると、つまり差がないことがめったに起らないと考えて、答えは「差がある」となるのです。そして、0.05以上の場合は、「差がない」とはいいません。「差があるとはいえない」という表現にします。これは重要です。 そういうもんだと割り切ってください。 >質問3 「データは、1項目4件法」で、「はじめと終わり」で、比べることはどのようにすればよいでしょうか? 【よく考えた】について、はじめの群と終わりの群を、対応のある2群のt検定を行います。 結果、t値というものが出て、そのときの有意確率が0.05より小だと、「差がある」(有意差あり)です。0.05より大だと「差があるとはいえない」です。 同様に、【考えた】についても、【まあまあ考えた】についても以上の要領でいいと私は思います。 【考えなかった】は0なら当然比較できません。
お礼
早速、回答してくださいまして、ありがとうございました。お礼申しあげます。 本当にわかりやすい説明でした。ありがとうございました。お礼申し上げます。 わたくしは、「本を何冊読んだことか、また、インターネットでどれだけ調べたことか」、しかし、これほど、わかりやすい説明はありません。ありがとうございました。お礼申し上げます。 わからないことにつまずいていると、ちっとも前に進みません。 ほんの少しのアドバイスで、進みます。 早速、今日と明日の休みで、t検定ができるようにしてみます。 統計処理JMPでできるでしょうか? とにかく試してみます。 ありがとうございました。お礼申し上げます。
- ssmarugoo
- ベストアンサー率47% (84/176)
>JMPのソフトならば、t検定ができるでしょうか どのように行うのでしょうか? 私はJMPを使用していませんので具体的なやり方はわかりませんが、JMPでt検定(対応のあるt検定)を行うことは可能のようです。 「はじめる前の母集団」「終わりの母集団」が正規分布していると仮定すると、 実験?での標本集団から「はじめる前の母集団」と「終わりの母集団」の差が0である確率密度関数がt分布です。山みたいな形のグラフです。これは、標本の数によって形がやや違います。これは自由度つまり標本の数ー1によって形が変わります。 t分布の例えば有意水準0.05なら、t値という統計量を計算して、その値がでると思います。そしてそのときの有意確率も出ると思います。有意確率が0.05以下なら有意差ありです。 山型のt分布は、前後の差が0の確率。それがめったに起らないと考えてよい0.05(5%)で起ったとすると、これは偶然とは考えにくい意味のある差。つまり有意差として表現します。 実験者(あなた)は、差があるということをいいたいのです。 しかし、帰無仮説と呼ばれる差がない確率を考えます。 そして、統計量を計算して差がない確率がとても低い(棄却閾)に入っていることを示し、帰無仮説を棄却します。(否定することです。) ゆえに、差があるというようにもっていきます。 ※棄却できない場合は、差があるとはいえない。っていうふうにもっていきます。 カイ二乗検定にしろ、この考え方です。
補足
早速、回答してくださいまして、ありがとうございました。お礼申しあげます。 教えてください。よろしくお願いいたします。 質問1 「差がないという仮説でいくのですか?」 質問2 0.05以下では、「差がない」と考えるのですか? 0.05以上ならば、「差がある」と考えるのですか? 質問3 「データは、1項目4件法」で、「はじめと終わり」で、比べることはどのようにすればよいでしょうか? <例です> はじめ 終わり よく考えた 10 16 考えた 15 12 まあまあ考えた 4 2 考えなかった 0 0 どうすればよいでしょうか? 教えてください。よろしくお願いいたします。
- ssmarugoo
- ベストアンサー率47% (84/176)
はじめる前と終わりでの変化ということは、その2群は同じ標本ですよね? そうなら、独立ではない2群のt検定をやるのが一般的では?(これは、母平均の差をみることができるから) カイ2乗検定だと、関係がある・なししか言えませんよね。 エクセルは計算の有効桁数が低いので、使わない方がいいかもしれませんが、遊びの検定とかなら。。。 「有意差」とは、意味のある差。偶然起る可能性(確率)を否定する結論のこと。
補足
早速、回答してくださいまして、ありがとうございました。お礼申しあげます。 >>独立ではない2群のt検定をやるのが一般的では JMPのソフトならば、t検定ができるでしょうか どのように行うのでしょうか? 教えてください。よろしくお願いいたします。
- kgu-2
- ベストアンサー率49% (787/1592)
エクセルで、検定するのは、 メニューバー>挿入>関数>CHIDIST で計算出来るハズ。 >カイ二乗検定で、「有意さがある」 有意差は、検定法一般で使います。統計学では、これが出発点ですが、理解が一番難しい。 習うより、慣れろ、です。 >はじめる前と、終わりでの変化です。 データが数値なら、t検定かF検定の方が良いと想います。カイ2乗は、比率の検定に使いますが。 データの例を示した方が良いと思います。
補足
早速、回答してくださいまして、ありがとうございました。お礼申しあげます。 >>>習うより、慣れろ >>データが数値なら、t検定かF検定の方が良いと JMPならば、t検定ができると思います。 やり方を教えてください。よろしくお願い致します。
- backs
- ベストアンサー率50% (410/818)
Excelでカイ二乗検定はできないですよ。もっとも,自分でマクロを書けば可能ですが。。。 見つければ http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/ とか http://homepage2.nifty.com/nandemoarchive/sas_r_excel/excel_vba04_chisq_test.htm など見つかりますが?
お礼
早速、回答してくださいまして、ありがとうございました。お礼申しあげます。 無理だということです。 ありがとうございました。お礼申し上げます。
補足
ありがとうございました。お礼申し上げます。 JMPのソフトでは、無理でしょうか 教えてください。よろしくお願いいたします。
お礼
早速,回答くださいましてありがとうございました。お礼申し上げます。