- 締切済み
統計分析法を教えて下さい
生徒30名の労働体験実習レポートを分析します。レポートの一文を「反省」「意欲」「学び」「感想」といった4つのカテゴリーに分けます。レポートの分量によってそのカテゴリーの文章数に個人差が差が出ます(たとえばA子は反省10、意欲5、学び1、感想7、B男は反省7、意欲7、学び2、感想8)。30人分を合計し、その第一回目と最終回のレポートで、そのカテゴリー文章数に差があるかどうかみたいです。たとえば、感想が減り、学びのコメントが増えた、など。以下のようなクロス表を作りカイ二乗検定を行えばよいでしょうか? 反省 意欲 学び 感想 合計 第一回目 200、 150、 80、 140、 570 最終回 130、 200、250、 80、 660 予想ですが、「はじめは感想ばかり書いていたが、次第に学びについての記述が増え、労働体験をするうちに多くの事を学んだ。」と言えるのではと、思っています。 統計をこれから始める初心者です。ご回答を頂ける方、どうぞ教えて下さい。よろしくお願い致します。
- みんなの回答 (4)
- 専門家の回答
みんなの回答
- backs
- ベストアンサー率50% (410/818)
> 「学び」と「感想」を比較する場合は対応のないt検定で良いのでしょうか? 「学び」と「感想」についても同様です。 > 「はじめは感想ばかり書いていたが、次第に学びについての記述が増え、労働体験をするうちに多くの事を学んだ。」を示すにはどのような検定を行えばよいでしょうか? 質問文から察すると「対応のあるt検定」が適切でしょうと述べたわけですが、実際にそれが適切かどうかはデータセットをみないとわかりません(質問文から私が実際の状況を読み違えている可能性もあるのです)。少なくとも提示した「対応のあるt検定」で主張できるのは「1回目の平均値と最終回の平均値の差は有意に異なるか」ということだけです。差が認められたことをどのように考察・解釈するかは質問者さん自身です。 参考までに「独立なデータ」と「対応ありのデータ」について整理しておくとよいかもしれません。 http://homepage2.nifty.com/nandemoarchive/koten_kentei/dokuritsu_taiou.htm なお「対応ありのt検定」とはこういうもの↓ http://homepage2.nifty.com/nandemoarchive/koten_kentei/jizen_jigo.htm
- kgu-2
- ベストアンサー率49% (787/1592)
レポートを数値化=データ化に疑義がありそうですが、その議論は本旨ではないと判断しますので、統計に関してだけ意見を述べます。 その前に、私の経歴を述べますと、大学で教えています。が、統計は専門ではなく、論文を書くときに必要に迫られて勉強しました。最初は、標準偏差の意味さえわかりませんでしたが、今は多変量解析でなければ、なんとかなります。多変量解析は、初心者がいきなり手を出しているのも見ますが、私は、多変量解析ではなく、初心者でもできる方法論をとっています。統計学は、わざわざ難しいして、「俺は賢い」と言いたい人が多いように感じます。近くのコンビニに行くのに、ベンツに乗って偉そうに見せている印象を受けます。私は、歩いて行けるコンビニを選びます。 30人限定、一人もデータに欠落がない、という前提で。 統計学には、記述統計学と推測統計学があり、その区別を明確にしておかないと、迷路をウロツクことになります。 例えば、Aとaを比べれば、大小があります。所持金なら、1円単位ですから同額もありますが、身長なら、mm単位まで、あるいはμm単位まで測定すれば、大小関係は誰が測ってもあります。少しでも高い方が、高い、で誰も異論の余地はありません。 A、B、C、とa、b、cと人数が増えても同じです。人数が2人以上なら、平均値や中央値などの代表値を比較すれば、誰がやっても結果は同じですから、結論は明確です。これは、事実を述べるだけなので、記述統計学、といいます。 ここで、注意することは、例え0.1でも、0.001でも違えば、「差がある」のです。『そんな小さな差は、大したことが無い』と思うのは、現実的・体験的な判断であって、統計学の論理とは別物です。 さて、A、B、Cのグループは、この三人ではなく、D、E、・・・がいるが、離れた所に住んでいる、病気で欠席した、などで、データがない。この場合は、そのデータを推測して、補う必要が生じます。その場合、結論は推測を含んだものなので、推測統計学の検定という処理をして、「有意差あり」という結論を導く必要があります。 記述統計学の結論は「差がある」、推測統計学(検定」では「有意差がある」すなわち、100回で5回あるいは1回は、ウソが混じっているかもしれない、という曖昧さを含んだと結論です。以上から理解して頂きたいのは、検定は、全てのデータを集められないので、代替手段である、ことです。パソコンなどで意味不明の計算をするので、難しい=価値が高い、というのは、世間の勘違いに過ぎません。 反省が200から130になったのは、明らかに(検定をするまでもなく)減っています。30人全員のデータなら、紛れはありません。その減ったのが、学びとなって増えた、というのは、それは、質問者の意見です。それを主張するのは、自由(=本人の勝手)ですが、賛同を得られるかは疑問、まあ白紙でしょう。意欲は増え、感想は減っていますが、カテゴリーの関係からは、どこに因果関係があるのかは、統計学で判断することはできません。繰り返しになりますが、研究者の意見です。文字数に制限が無ければ、全てが増えることも可能です。 関係を見る方法として、回帰分析があります。世間はあまり区別していないように感じますが、相関分析との相違が分かってから、手を出して下さい。私は、手を出してから、散々悩みました。結果について、3年以上悩んだこともあります。 こう書いても、レポートのデータ化に客観性=科学性の点で疑問が残ります。 釈迦に説法の点は、ご容赦を。
お礼
kgu-2様 丁寧なご解説をありがとうございました。 理系の頭ではないので、統計を理解するのには非常に時間がかかりそうです。 カテゴリーの分類と考察ですが、数字だけでみるのではなくアンケート結果やインタビューも行います。研究分野によっては客観性=科学性に疑問が残るというご意見も確かにありますが、修士論文もこのような分析で、統計ではなく%で比較を行いました。同じ手法で教育系の学術誌に論文が採択されたこともあります。学会発表も行っております。学問というのは、分野によって見方が全く異なりますね。 頂いたご意見は共同研究者に伝え、もう一度よく考えてみます。今まで質的に分析したものを無理やり量的に見る必要があるかということも検討します。ただ、必要最小限の統計知識を持ちたいということ、今後の自分の専門性を深めるためにも頑張ってみます。ありがとうございました。
- kgu-2
- ベストアンサー率49% (787/1592)
書きこまれたデータは、カイ2乗検定、それも2群ではないので多変量解析、になります。多変量解析で主張できるのは、差があっても「全体で、有意差がある」という一点のみ。どこが増えた減ったは、質問者の感想、せいぜい意見であって、客観的=科学的には、誰も賛同しません。 次に、統計学的な問題を挙げておきます。 1 30人は、無作為抽出していないでしょうから、正規分布は想定出来ません。ですから、利用できる検定法は、限られてきます。 2 レポートを、レポートの分量によって、というのは文字数だと想いますが、生徒(高校生?)の支離滅裂な内容を、カテゴリーに分けるのは、困難を通り越しているのでは。それに分けるのは、質問者だとすると、客観性=科学性に欠けます。すなわち、データの信頼性にが無い。 3 レポートの分量が、文字数なら、知識が無いともちろん少ないのですが、多いからと言って、内容があるわけではありません。ダラダラした内容の無いレポートで、ウンザリします。 私も統計学の初心者ですが、内容から、検定は困難だと考えます。学生か院生だと想うので、指導者にご相談されるのが、科学者の倫理です。いないのなら、その旨、書きこんで下さい。 その場合、 1 30人は、どのように選ぶのか。 2 私の回答で、反省、意欲、・・・のカテゴリーに、どのように分けるのか、を返答してください。
補足
kgu-2様 ご回答をありがとうございました。 私は現役の教員をしております。今までは質的な分析ばかりしておりまして、今回初めて量的な分析(統計)に取り組もうとしております。 1.30名ですが、これはクラス全員の人数ですから確かに正規分布をしているとは思えません。 2.カテゴリーにつきましては、今まで質的な分析で何度か分類はしております。今までは、%で表示しておりましたが、それでは説得力がありませんので、検定を行うことにしました。カテゴリーの分類は共同研究者1名と毎回議論しながら行っています。一文を一単位と致しますが、文が長い、あるいは一文に二つの意味がある場合は統語の切れ目で2単位に分けるということを取り決めております。おっしゃるように、確かに分量が多いからといって内容があるわけではありません。ただ、救いがあるのが、生徒の文章力はそれほど低いものではなく、学力的にも比較的指導しやすいレベルです。 共同研究者も文系で、SPSSなどは使用した経験がありません。もし全く検定ができない内容であれば、この研究を断念せざるを得ませんが、なんとか形にしたいとは思っています。 ご意見をありがとうございました。
- backs
- ベストアンサー率50% (410/818)
まず > 30人分を合計し という処理の仕方が間違っています(適切ではありません)。 例えば「反省」については --- 被験者, 1回目, 最終回 A, 10, 4 B, 7, 3 --- という形でまとめます。考え方としては「1回目の平均値と最終回の平均値に差があるか」ということですから、いわゆる「対応のあるt検定」を行えばよいのです。換言すると1回目と最終回の値の差をとって、それを「独立1標本の平均値の検定」を行うのです。 意欲、学び、感想についても同様です。 例えば1回目のデータが (10, 7, 9, 11, 14) と得られており、最終回のデータが (4, 3, 4, 4, 7) とあったら、それぞれの値の差をとったものが (10-4, 7-3, 9-4, 11-4, 14-7) となり、結局は (6, 4, 5, 7, 7) というデータに対して平均値の検定を行えばよいのです。 以下、Rによる実行例の参考: > pre <- c(10, 7, 9, 11, 14) #1回目のデータ > post <- c(4, 3, 4, 4, 7) #最終回のデータ > dat <- pre - post #1回目から最終回を引いたデータ > dat [1] 6 4 5 7 7 > #差をとってそれを独立1標本の平均値の検定として実行 > t.test(dat) #t.test()はt検定を行うための関数 One Sample t-test data: dat t = 9.9469, df = 4, p-value = 0.0005737 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 4.181068 7.418932 sample estimates: mean of x 5.8 > #対応ありのt検定として実行(先ほどの方法と一致している) > t.test(pre, post, paired=TRUE) Paired t-test data: pre and post t = 9.9469, df = 4, p-value = 0.0005737 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 4.181068 7.418932 sample estimates: mean of the differences 5.8
お礼
bucks様 早々のご回答をありがとうございました。なるほどt検定を行うことができるのですね。よくわかりました。 もうひとつ教えて頂きたいのですが、「学び」と「感想」を比較する場合は対応のないt検定で良いのでしょうか?たとえば第1回目の「学び」の文章数平均が6、「感想」の平均が11、最終回は「学び」平均が12、「感想」平均が9になっていたとします。この場合、「学び」平均が6増加し、「感想」平均が2減少しています。「はじめは感想ばかり書いていたが、次第に学びについての記述が増え、労働体験をするうちに多くの事を学んだ。」を示すにはどのような検定を行えばよいでしょうか? 教えて頂けますと非常にありがたいです。よろしくお願い致します。 現在SPSSを発注中です。
お礼
backs様 ご回答をありがとうございました。 教えて頂きましたサイトでt検定の勉強を致します。 何度もご回答を頂きお礼申し上げます。