• ベストアンサー

【統計】2つデータが似ているか調べたいのですが

私の手元に1グループ10人の構成員がいる2つのクラスA、Bに、各々同じ試験を行った得点データがあります。私の現場の感覚としてはAクラスとBクラスの実力は同じくらいだろうと感じていますが、それを統計の手法で数学的に示してみたいと思っています。Excelは持っているので使えます。 ちなみに、私の統計の基礎知識としては昔F分布、t分布など習ったが計算ばかりでどういうときに使ってどんな結果から何が言えるかなどは理解できていないレベルです。 お力添えいただきたく存じます。

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.2

補足ですが、ウィルコクソンの符号付順位和検定とウィルコクソンの順位和検定は違うので注意しましょう(名前は似ていますが)。前者は対応ありのデータに、後者は対応なしのデータに対して適しています。 ちなみに、Excelしかないからという理由で適切でない検定手法を用いるのは好ましくないでしょう。Excelのアドインソフトなどのような市販されているものを買わなくても無料でできるものもありますよ。 > 誰にでもわかるように示す方法 平均も分散も分からないような人にも、ということですか?それならば「2つの平均値の差が偶然に起こった結果であるかどうかを計算したものが検定等計量です。この値が大きいほど『2つの平均値の差は0である』という仮説を棄却することができます。」とでもいって納得してもらうしかないかもしれません。 Rなどで例を提示してみると次のようになります。 #平均値が同じ場合のデータで試してみる x1 <- rnorm(10, mean=10, sd=2) #平均10、標準偏差2 y1 <- rnorm(10, mean=10, sd=2) #平均10、標準偏差2 t.test(x1, y1) #t検定を行う #得られる結果はt = 1.6567 #平均値が異なるデータで試してみる y2 <- rnorm(10, mean=20, sd=2) #平均20、標準偏差2 t.test(x1, y2) #t検定を行う #得られる結果はt = -10.6335 結局、有意差が認められるときはt値が大きくなるし、認められないときは小さくなる。t値が大きくて、有意差が認められるということは「この結果は偶然的に起こった結果とは考えにくい」ということです。つまり、たまたまこの実験で平均値に差があるように見えたということではないということ。

e271828
質問者

お礼

>ちなみに、Excelしかないからという理由で適切でない検定手法を用いるのは好ましくないでしょう。 耳が痛いです・・・><確かにその通りです。どの程度差が出るのかも気になりますね。 例からt値(の絶対値)が大きいほど有意な差がありそうだと言えそうだということが実感できました。大変分かりやすい解説、本当に助かりました。 どうもありがとうございました!

その他の回答 (3)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.4

No4です。統計学の検定では無理、とだけ書き、後始末をしていませんまので。  変わらない、ということを示すのに、相関分析をつかいます。地球温暖化の元凶とされている二酸化炭素をA法で測定していた。新たにB法を開発したが、A法と同じような結果が得られることを示すときに用います。  この方法を用いるには、それなりの試験計画が必要で、提示された内容では利用できません。  今回は、統計学的な検定ではなく、平均点の差を示して、「同程度」と主張されるのが一番では。  なんでも検定をやりたがりますが、検定の結果、主張できるのは、「有意差を見出した」ということのみ。有意差というのは、その差は偶然ではないという意味で、差が大きいということではありません。すなわち、差の大小の判定はできないのです。  現在、統計でなんでもできるような勘違いが流行していますが、大したことはできないのです。50と50.1に数学的には差があるのですから、集団間には、もともと差があるのです。統計学は、その程度です。  大小について、検定の結果によって論及することはできないので、経験に基づいて判断するしかないのでは。

e271828
質問者

お礼

差があると言えるか否かの判断に主観が入り込んでしまうことで、科学的ではない、不確実な結果が出てしまう。ということでしょうか。私も初心者なので理解に誤りがあったらすみません>< 平均点の差から、経験的に判断して「同程度」とするという方法もあるのですね。統計は魔法のツールではないことが分かりました、時と場合によっていろいろと吟味しなければならないのですね。 いやぁ為になりました、どうもありがとうございました!

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

>それを統計の手法で数学的に示してみたい 出来ません。一番勘違いしやすいので、これを、「初心者の罠」と私は、呼んでいます。この初心者の罠は、有意差を見つけた検定の経験を何度かしてから、『差が無いことを証明したい』と七転八倒するという経過を辿るので、初心者にしても思いつくのが早過ぎると感じています。  統計の手法というのは、検定だと想います。検定は、有意な差があることを示す方法であって、有意な差がない(同じくらい)ことは、どんな偉大な学者でも証明できません。現代の統計学では、絶対に。もしもできれば、全く新しい統計学(そんな名称かどうかは分かりませんが)を作り創りだすことになります。  では、実際に。 普通は、平均点で比較します。平均点が、Aクラスは50点、Bクラスは50.1点。これは同じかどうか。同じくらいと経験的には、表現できますが、数学的(統計学的)には、0.1点の差が有る。すなわち、たとえ0.1点であれ、差があるわけです。その差が、0.0001点でも差が有る、と考えるのが統計学です。すなわち、2つの集団では、根本的には、差は無いことは想定できません。よほどの偶然で、0.0000になるのなら別ですが。でも、「別の試験問題では」と突っ込まれると、0.1点程度の差は出るでしょうから、足掻いても無駄です。  平均の差が0.1なら差は無いと判定し、1.0を超えたら差が有ると判断する、何ぞは誰も決めていません。ですから、無理。  「0.1点の差なので、実質的には同程度」という説明なら現実はには受け入れられるでしよう。ただ、何点以内なら同程度、というのはあくまでも発言者の経験に基づく判断であって、統計の手法(平均値のみは統計学ですが)からの科学的な判定ではありません。

  • hukuponlog
  • ベストアンサー率52% (791/1499)
回答No.1

んー、とりあえず基本統計量をとるだけでも、かなりの情報が得られると思いますが。 1.平均、標準偏差(分散)、中央値あたりをExcelで算出します。分析ツールを使っても良いですが、関数の方が楽だと思います。 2.次に、2つの平均の差の検定をしたらいかがでしょうか? 1グループ10人程度だと、ノンパラメトリックな検定の方がいいでしょう。「ウィルコクソンの符号順位和検定」という方法を用いることが多いです。 この検定は、要するに、A群とB群の平均値に統計上有意な差があるかどうか、ということを検定するものですから、ご質問の要望に合うはずです。 同じ事はt検定でもできるのですが、こちらはデータが正規分布でないとまずいので、今回は無理だと思います。 ただし、Excelでは直接はできません。市販のアドインソフトなどを購入する必要があります。そうでなければ、「ウィルコクソンの符号順位和検定」で手法を検索し、電卓を片手に計算することです。10件程度のデータなら、それほど時間はかからないと思いますよ。

e271828
質問者

お礼

回答ありがとうございます!なるほど、「ウィルコクソンの符号順位和検定」という方法があるのですね。変なこだわりで申し訳ありませんが今回は市販のアドインソフトなどを使わずExcelでできる方法をとりたいと思っています。 ググってみると2標本検定で分散が同じときt検定、異なるときウェルチの検定というものを使うという情報が見つかりました。なんとか計算だけならできそうなのですが、経過や結果が人にわかるようにうまく説明できそうにありません。このウェルチの検定というものを使って、たとえば論文調、会話調などで誰にでもわかるように示す方法で、実際に適当なデータをウェルチの検定を用いて示してみていただけませんか? 無理難題ばかり言って申し訳ないです、どうかよろしくお願いいたします。

関連するQ&A