- ベストアンサー
有意差を見る方法について教えてください。
統計のことがわかっていない者ですが、恥をしのんで質問いたします。 現在書いているレポートで、あるデータの変化に有意差があるかどうかを見ることになりました。 データというのは、英語を勉強している学生が英語母語話者と一週間に二回、約14週間の会話を続けた音声データです。 その音声データの中で、英語学習者が「because」という言葉を使用した回数の変化が有意かどうか見たいのです。 英語学習者は10人で、一回目、七回目、十四回目をピックアップし、その変化を見るつもりです。 更に、母語話者が「because」と言った数もカウントし、その平均値と英語学習者の平均値との差が有意であるかも見たいと思っています。 年末のため、指導教官が休みに入ってしまい、質問することができません。 いくつか心理学の統計の本など読んで見たものの、あまりに何も知らないので、実際どうしたらいいのかがわかりませんでした。 どなたか、方法を教えていただけませんでしょうか? 大学にSPSS 16.00、JUMP6、エクセル統計はあります。 こんな丸投げで申し訳ありません。 説明について、足りないところがあればまた追記いたします。 何を書いたらよいかもわからないもので・・・。 どうかよろしくお願いいたします。
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
>TTESTで出た数値と、「一対の標本による平均の検定」とは違う数値ですが、これは何か計算を間違えているわけではないのですよね C1番地の数値は、危険率の値です。しかも「一対の標本による平均の検定」で計算しています。同じになるはずですが。 >ここではもう回帰分析をしなくてよいということでしょうか? t検定は、2つのグループ、この場合は1回目のグループと14回目のグループの平均値に有意差がある、ということを示しているだけです。何によってそのような差がでたのか、原因については、なんら根拠がありません。それを検討するのが、回帰分析です。 お示しのデータでは、母語話者が原因と推定されるのは当然でしょうが、根拠は薄弱です。もしも、その人が「because」を一度も使っていなければ、原因とできません。「何回使えば影響がでてくるのか」という疑問が湧いてきますが、t検定では答えるのが困難です。他の先生の影響かもしれませんし。極端な話、自宅でテレビの英会話の時間かも。 >y範囲とx範囲に14回目の割合と、母語話者の全回の割合の平均を入れればよいのでしょうか? それは研究者が、どのように説明したいのか、によりますので、他の者が判断することではありません。グラフを見ないと断言はできないのですが、私なら、という方法とは違うと想います。 >単回帰分析ということでしょうか? 私は、初心者ですので、単回帰分析でいつも考察しています。エクセルでの方法は、手前味噌ですが私の過去の回答を読んで下さい(どこかにあるハズ)。エクセルの説明書も、大学の図書館ならあると想います。 ただ、回帰分析は、相関係数の算出と検定は簡単ですが、その結果の解釈の誤りを専門家(有名大学の論文)でも、見かけることが少なくありません。やり方は、簡単ですが、解釈が難しい。それは、ご自身で修得するしかなく、口出しは控えます。
その他の回答 (5)
- kgu-2
- ベストアンサー率49% (787/1592)
No2です。ご自身の趣味、私は独り言、ということで、 これは、基本的には、対のある場合のt検定が妥当でしょう。対のある場合については、薬の効果の判定で、同一人について、使用前と使用後について、その平均値を比較する、などに使います。この場合は、薬ではなく、学習の効果、ということになります。 ついでに、F検定もやってみましょう。 >しかし、t検定やf検定、回帰分析というのは、どのソフトを使えばできるのでしょうか? また、データをどのような形に加工(表側とか・・・?)すれば、その検定ができるのでしょうか? ご参考として、貼り付けたものを少し書き換えます。 エクセルの 1) A列の1番地から10番地までに、1回目の数を記入 2) B列の1番地から10番地までに、対応する人の7回目の数を記入 3) t検定をするには、 C1番地に、=TTEST(A1:A10,B1:B10,1,2) と記入 C1番地の数値が0.05より小さければ、危険率5%以下で有意差有。 4) F検定をするには、C2番地に、=FTEST(A1:A10,B1:B10)と記入 C2番地の数値が0.05より小さければ、危険率5%以下で有意差有 A1~A10、B1~B10までの空白は無いようにしてください。 3)の結果と、4)の結果が異なるときは、少々厄介ですが。 14回目については、2)のデータを書き換えてください。 なお、1、7、14回目のデータを示すと、論文なら「多変量解析をせよ」とお利巧なの審査員からクレームが必ずつきます。 私なら、1回目は、学習前を明確にするために、0回目と表現しますが。 また、有意差は、おそらく出ないので、0、1、・・・、14回目と数字があるのなら、回帰分析をお勧めします。これもエクセルで簡単にでき、過去に回答したことがあります。 母語話者の影響については、横軸を変えた回帰分析以外、思いつきません。 これ以上は、指導教官無視になるので、止めます。指導教官のOKがあるなら、気が向いたら回帰分析について書き込みますが、そうすると私の卒論研究になりそうですが。
補足
再び丁寧なお返事をありがとうございます。 t検定とf検定、教えて頂いた通りにやったらできました! どちらも、1-7回目では有意差なしでしたが、1-14回目だと有意差ありという結果になりました。 また他の方のアドバイスも参考に、エクセルの分析ツールの「一対の標本による平均の検定」もやってみたところ、同じ結果でした。 (きっと当たり前ですよね^^;) > 有意差は、おそらく出ないので、0、1、・・・、14回目と数字があるのなら、回帰分析をお勧めします。 と書いてくださっていましたが、有意差が出たということは、ここではもう回帰分析をしなくてよいということでしょうか? また、TTESTで出た数値と、「一対の標本による平均の検定」とは違う数値ですが、これは何か計算を間違えているわけではないのですよね? また、1回目ではなく0回目というご指摘、その通りだと思いました。 ありがとうございます。 > 指導教官のOKがあるなら、 正確には来年指導教官になってくださることが決まっている先生で、現時点では60人くらい受講しているこのレポートの授業の先生というだけなので、OKだと思います。 ですので、もし気が向いたらおしえていただけると幸いです・・・。 一応、私も回帰分析について調べてみたのですが、このデータの場合は単回帰分析ということでしょうか? > 横軸を変えた回帰分析 この回帰分析というのは、エクセルの分析ツールの「回帰分析」で、 y範囲とx範囲に14回目の割合と、母語話者の全回の割合の平均を入れればよいのでしょうか? もしそれでよいのであれば、「重決定R2」(決定係数?)が0.3011でした。 これは、あまりよくないということでしょうか? しつこく質問を続けてすみません。 現時点でも、十分に助かりました。 ありがとうございます。
- Ishiwara
- ベストアンサー率24% (462/1914)
#3です。 複雑さやデータ数などから見て、統計ソフトを使うほどのことはありません。エクセルで十分でしょう。電卓でもできます。 方法や数表は、キーワード「t検定」で、たくさん出てきます。そういう専門家の説明を、ここで私が記述するのもムダのようですし。 一つの非常手段は、統計のことを知っている方に計算だけ丸投げすることです。これは恥ずかしいことではありません。数学の苦手なアインシュタインは、友人に頼んで計算をやってもらいました。あなたの論文の最後に1行だけ謝辞を述べるだけで済みます。
補足
ありがとうございます! エクセルで、「一対の標本による平均の検定」をやってみたらできました! 非常手段のこともありがとうございます。 今回のレポートは研究の練習でもありますし、ここでたくさんのアドバイスを頂いているので、教えていただいたとおりに動かすくらいはやってみようと思います。 (ほとんど丸投げではありますが・・・)
- Ishiwara
- ベストアンサー率24% (462/1914)
欠測値がなければ、10という数は、かなり意味があると思うので、まず「平均値の差の検定」を思い浮かべます。計算は難しくありません。 1回目と7回目、1回目と14回目、7回目と14回目というふうにです。 理論的にもの足りないのであれば、各回を平等な場合と見なして、3つの水準がある「分散分析」をします。 (バラツキ全体)=(回によるバラツキ)+(人によるバラツキ)+(偶然によるバラツキ) に分けることにより、 (回によるバラツキ)/(偶然によるバラツキ) を「F検定 」によって評価すれば「回の進行によるデータのシフト」の有意性が求められます。
補足
お返事ありがとうございます! ただすみません、丁寧に書いてくださっているのに、どうやったらいいかが全然わからなくて・・・。 (1)どのソフトを使えばいいのでしょうか? (2)そのソフトには、どのような形にデータを入力すればよいのでしょうか? (3)そして、その「平均値の差の検定」とは、どのようにすればできるのでしょうか・・・? こんな状態での質問で申し訳ありません。 よろしければ教えてください!
- kgu-2
- ベストアンサー率49% (787/1592)
指導教官がいるのに、回答することは、研究者としてのマナーに反します。 研究内容を外部に漏らすなんぞは、とんでもないはない話です(質問者が、研究テーマを考えた、というのなら話は別)。私が、このテーマを面白い、と関心持てば、3ヶ月で論文にできるからです。私の研究室なら、このような質問したことが分かれば追放です。 以下、独り言で。 http://oshiete1.goo.ne.jp/qa3516234.html 通常の検定とは、違う。単に回数で処理するのは、誤りかも。話す時間が長くなると、回数が増えるのは、当然。さらに、私はbecausetが好きで、というより他の語句を知らず連発していましたが、日常ではとほんど耳にした記憶が・・・。 1回目というのは、レッスン前ですか。通常は、レッスン前とレッスン後をt検定かF検定をする。 1回目から14回目までのデータがあるのなら、回帰分析を使うと、もっと価値のある説明ができるかも。 この類の質問の致命傷は、統計処理を準備せずに、数字集めをしたこと。私は、目的を明確にして、それに即したものをデータ、それ以外は数字と呼んでいます。
補足
手法だけでなく、研究姿勢についても教えてくださってありがとうございます。 私も投稿するまでにはとても悩んだのですが、あまりにも統計の基礎がなく自力で解決する事ができず、恥をしのんで・・・と投稿いたしました。 ただし、研究テーマにつきましては、私が考えたものであり、データも私が集めたものです。 しかしこれはちゃんとした研究ではなく、卒論に向けて実際の研究をする前の練習として行うものです。 ですから要因の統制などは一切しておらず、例えばbecauseの数の増減が有意であっても、それが母語話者と会話をしたからといえるようなものではなく、研究結果としては意味をもたないものです。 それで当初は、単に時間もしくは発語数の中のbecauseの割合をグラフにして終わりにしようと思っていました。 ただ、手間や時間は相当かけたものですので、それなりの結果は出さなければ、ということになり、やはり統計的な処理も行うということにしました。 というのが経緯です。長々と申し訳ありません。 だからといってこのような形で解決をはかることに問題がまったくないとは思っておりません。 来年の卒論に向けては、きちんと統計の勉強もするつもりです。 ご指摘有難うございます。 また、教えていただいたURLを見てみましたが、この方の方法をどう応用すればいいのかわかりませんでした・・・。 > 話す時間が長くなると、回数が増えるのは、当然 発語数、もしくは時間で平均を出そうと思っております。 その点を書いていませんでした。 > 1回目というのは、レッスン前ですか。通常は、レッスン前とレッスン後をt検定かF検定をする。 > 1回目から14回目までのデータがあるのなら、回帰分析を使うと、もっと価値のある説明ができるかも。 1回目はレッスン前です。また、1~14回目のデータもあります。 しかし、t検定やf検定、回帰分析というのは、どのソフトを使えばできるのでしょうか? また、データをどのような形に加工(表側とか・・・?)すれば、その検定ができるのでしょうか? 申し訳ありませんが、何かヒントでも(十分頂いていますが)教えていただけませんでしょうか?
- A-Tanaka
- ベストアンサー率44% (88/196)
こんばんは。 学習に関する有意差について知りたいのですか? それならば、母語発話者(ネイティブスピーカー)との間で、まず初期の発音・アクセントにおける差を基準にして、サンプルデータとの間で点を付けるところからはじめなくてはなりません。 例として、ネイティブの点を100点として、完全にローマ字発音だったら0点とか・・。 その上で、各学習者の点をつけることができたら、次に進むことが出来ます。 各サンプルにおける各評点をつけて、データを所望のソフトに入力すれば、有意差検定というツールで検証が出来ます。 とりあえず、点をつけられたら、また質問してみてください。
補足
早速のお返事ありがとうざいます! 発音やアクセントは関係なく、単純に回数だけ見ようと思っています。 ですので例えば、一回目は10回/1h、七回目は20回/1h、十四回目は30回/1hだった場合、その変化が有意かどうかを見たいのです。 また二つ目に関しては、母語話者が50回/1h言っているとしたら、学習者十四回目の30回/1hと有意差があるかどうかを見たいと思っています。 この場合、どのようなデータをどんなソフトで、どのような処理をしたらいいのでしょうか?
補足
> TTESTで出た数値と、「一対の標本による平均の検定」とは違う数値 これについては解決しました! 分析ツールでは、「一対の標本による平均の検定」で両側のところの危険率を見ていたのですが、 関数では、「等分散を仮定した2標本による検定」を「片側」で行っていたため、違う数値になっていたようです。 確認不足で質問してしまってすみませんでした。 これは、対応がある両側の分析で大丈夫ですよね? ただ、f検定のほうで少数点を見間違えていて、実際は危険率が5%以上でした・・・。 ということは、標本が非等分散のt検定をしなければならないということでしょうか??? 回帰分析のこと、ご説明を読んでとんちんかんな解釈をしていたことに気付きました。 学習者の0回目から14回目の変化と母語話者の使用率の平均との関連をどのように見たらよいのか、 相変わらずわからないのですが、自分でもう少し調べてみます。 kgu-2さんの過去の回答を探してみましたが、たくさん回答なさっているのでまだ発見できません・・・。 ずるずると質問を重ねてしまい、申し訳ありません。 勉強の必要性を痛感しています。