- ベストアンサー
データの比較方法
手持ちのデータと公表されているようなデータとの比較検定は簡単にできますか? たとえば専門的な統計ソフトを使わず、エクセルフとかリーソフトで行うとか… ex. A)手持ちのデータ(生データあり)は、n=300 22.5±4.00 B)手持ちにないデータ(生データなし )、n=1400 23.0±5.90 というような場合、A,Bで差があるかどうか検討したいと考えています。 ある論文では、t検定をしていましたが生データなしでt検定は可能でしょうか?
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
>手持ちのデータと公表されているようなデータとの比較検定は簡単にできますか? 簡単かどうかは、その人次第。 >生データなしでt検定は可能でしょうか? 生データとは、何でしょうか。一般的には、加工していない、例えば四捨五入をしていない生データで統計をします。が、それは枝葉末節。利用しようとするものは、事実なら全てデータですが。生か死んだかではなく、事実か否かが問われます。 t検定が適切かどうかは、これだけでは不明です。t検定は、一番の問題は、ランダムサンプリングがされているか、そのデータが正規分布しているか、の検証が不可欠です。私ならこの場合、別の方法を選択します。 気になるは、単位。なぜなら、平均値がわずか0.5の差ですから、統計学的には有意差有りでも、「現実にはどうでもよい、気にするほどでない」ということになるかも。
その他の回答 (1)
- kgu-2
- ベストアンサー率49% (787/1592)
指導者がいる、例えば学生、院生だと、教員が指導するべきで、そんな場合は、「教員に能なしのレッテルを貼る」ことになるので、以下は読まないこと。質問者の中には、質問することで「能なしのレッテル」を貼っている人もいて、『教授も、こんな失礼な学生、院生を抱えて苦労するな』とこの種の質問を読むたびに感じています。 一人でやっていることを前提に。あるいは、検定の練習なら、 検定法としては、U検定を勧めます。この場合は、順番だけですから、分布は考慮する必要がありません。 ただ、1400人のデータというのが、平均値と標準偏差だけなら(生データではない、の返答がありませんが、このと意味ですか?)、t検定しか使えません。両群の平均と標準偏差から、t値を計算し(電卓で)、自由度から有意差の判定をしたことがあります。 ただし、正規分布かどうか、それにランダムサンプリングをしているか、その上、AグループのデータをBグループのデータが含んでいないか、をクリアする必要があります。
お礼
ご回答ありがとうござました あるイベントで身長、体重などを測定する機会があり、せっかくなので全国平均などと比較できたらと思い質問させて頂きました。 手計算でできる範囲ならば、頑張ってやってみたいと思いますが・・・
お礼
回答ありがとうございました。 本データは、体格の指数であるBMIについて、私が測定したデータが全国平均と統計学的に有意差があるか検証できるか苦慮していたところでした。先行研究ではt検定にて比較検定をしたものがあるものの(全データを入手しての検定かは不明)、文科省の公表データは集計結果のみで全データではないため何か方法があればと考えていました。