- ベストアンサー
正規分布の標準化について
たとえば、Aという母集団で、変数X(あるテストの点数)は、正規分布(μ1、σ1^2)に従うとします。 Bという母集団は、変数Y(おなじテストの点数)は、正規分布(μ2、σ2^2)に従うとします。 ここで、母集団AとBに関わらずテストの点数の偏差値を比べることができるためには標準化を行えばいいわけですよね? Xについては、標準化を行い、(X-μ1/σ1)が標準正規分布(0,1)に従い、 Yについては、標準化を行い(Y-μ2/σ2)が標準正規分布(0.1)に従う。 として、(X-μ1/σ1)と(Y-μ2/σ2)を比較してどちらが偏差値が上か比較することは可能ですよね??? 私の考え(解釈)は合っていますか?どこか間違っていますか? 何か自信がないので訂正などあればアドバイスお願いします。
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
#1です. だんだん複雑な感じになってきましたが... 1)「差は普通、発生しませんか?違うクラスなので。(同じテストですが)」 ということは,甲さんと乙さんを比較したいのであれば,AのデータとBのデータを混ぜてしまって,1組のデータとして扱わないといけませんね.例えば,高校の理系クラスと文系クラスがあって,同じ数学のテストをしたとすると,一般的には理系クラスの方が成績がいいのだと思います.理系クラスをA,Aに所属する人を甲さん,文系クラスをB,Bに所属する人を乙さんとすると,A組(理系)の偏差値で56の甲さんは,B組(文系)の偏差値で66の乙さんよりも数学が苦手とは言えないですよね. 2)正規分布か? テストの成績だから正規分布だとか,大量にデータをとったから正規分布だということはありません. 例えば,1)ではAとBを混ぜてと,ちょっと乱暴なデータの扱いを書きましたが,AとBの平均が離れている場合には,結果として二山分布になることでしょう.また,あまり上手くできていない(正規分布になることを適切に意図できなかった)試験の結果は,必ずしもピークがデータのばらつきの中心に来ないかもしれません. いずれにしても正規分布を仮定して,きちんと議論しようというのであれば,正規性の確認は必ず行うべきだと思います. 今度は,質問の答えになっていますかね?
その他の回答 (5)
- selfer
- ベストアンサー率76% (104/136)
こんにちは。 結論からすれば偏差値を比較するということ自体には特に問題はありません。しかし,得られる結論が質問者さんの望みのものかは別問題です。 偏差値というのは,本質的には,その集団内部における位置についての指標です。その意味ではNo3さんが例として挙げられている「甲さんがA組の中では15位、乙さんがB組の中では25位ということ」を求めるということと本質的には変わりません。 例えば「A組における甲さんの偏差値は65,B組における乙さんの偏差値は50」であるとします。ここから「65>50」だから甲さんの方が【偏差値は高い】という結論を下されること自体は特別問題はありません(検定という考えを無視します)。しかし,ここからが問題なのですが,この結論から「甲さんの方が,乙さんに比べて【優秀である】」という解釈をすることはある前提が満たされない限り調べられません。 その前提とは,「甲組と乙組の二つの母集団は「優秀さ」において本質的に同じである」というものです。これが満たされないと,「偏差値が違う」ということからは,「【各】所属内部の成績順位において,二人の順位が異なる」という解釈しかすることは出来ません。 このように「偏差値が上」であることと,そこから更に導かれる解釈とには違いがあります。ご注意下さい。
補足
回答ありがとうございます。まさにおっしゃるとおりですね。 だからこそ、【優秀さ】を比較するためにどうしたらよいかを考えていたのですが、できるわけがないということがわかりました。 AとBをあわせた平均、標準偏差を算出しないと甲と乙は偏差値での比較(=順位まで調べること可能)はできないですよね? わかりやすい説明ありがとうございました。
- popesyu
- ベストアンサー率36% (1782/4883)
>平均が以上にAが大きければ正規化の式でわかりますが これは何(Aの平均?)を何と比較するのでしょう。そもそもの前提では母集団同士は比較しないのではないでしょうか。比較するのはあくまでも異母集団内の内部の相対的な位置ですよね? あと >偏差値の比較ができる >甲乙どちらが上かわかりようがありません は矛盾しているということは分かりますか? 比較ができるならどちらが上かは分かりますよ(でも実際は比較できないからどちらが上かは分かりませんとなります)。比較はできるけど、どちらが上かはわからないとなる論拠がまだ意味不明です。 まぁ比較といってもAの方が10大きいとかいう意味の比較はできますが、その10という数字には、この(平均的なリンゴの中で上位15%ぐらいの値段になる)リンゴはあの(平均的なミカンの中で上位25%ぐらいの値段になる)ミカンより10円高いという程度の意味しかありません。別に日本語としてはおかしくないし、数学的にも間違ってはいないですが、内容には全く意味がありません。
お礼
回答ありがとうございます。何か勘違いをしていたようです。 自分でもなぜか意味不明のことを説明しています。 標準しなくてA集団とB集団あわせて平均と標準偏差を出せば、甲と乙のそれぞれの偏差値(標準化得点)をだせますよね。そこで甲と乙は比べることができますよね。
- popesyu
- ベストアンサー率36% (1782/4883)
私も何をされたいのかが良く分からないのですが。 甲さんがA組の中では15位、乙さんがB組の中では25位ということが分かったとして、それを比較するというようなことをされたいのでしょうか?? 仰るような条件をより具体的に言い表すならA組が進学クラスで、B組が就職クラスとかだったらこの比較には何の意味もない(例えば甲さんがB組に編入したら1位になるかもしれない)ということは分かりますか?
お礼
おっと、補足に見間違えて変なことをかきました。 >甲さんがA組の中では15位、乙さんがB組の中では25位ということが分かったとして、それを比較するというようなことをされたいのでしょうか?? そうです。Aの正規分布とBの正規分布が違うので同じ土俵つまり標準正規分布で、それぞれ甲乙を正規化(標準化)すれば標準化得点という形で偏差値の比較ができると思っているのですが。 ※甲乙どちらが上かわかりようがありませんが。
補足
回答ありがとうございます。が、まったくわかりません。 A組の中で甲さん15位ですか?正規分布を仮定して、正規化したf(x)を0から0.5まで積分したものを確率0.5から引いた値の確率密度の割合ー1番目ではないでしょうか?具体的に15位ってわかるわけないと思うのですが。。。 >A組が進学クラスで、B組が就職クラスとかだったらこの比較には何の意味もない(例えば甲さんがB組に編入したら1位になるかもしれない)ということは分かりますか? まあ、平均が以上にAが大きければ正規化の式でわかりますが。そうではないかもしれないので意味は大いにあると思いませんか? 私の考えの方が正しいですよね?
- life55
- ベストアンサー率46% (138/294)
#1です. えっと,(標本)平均も(標本)標準偏差も違う2組のデータA,Bがあったときに,Aに属する甲さんとBに属する乙さんの偏差値が56と66だとすると,乙さんは甲さんよりも上であると判断するのは正しいかということでしょうか? それは,良いときもあるし,駄目なときもありますね. AとBとの差がなぜ発生しているのかが問題ですね. まったく別の母集団(母集団の違いが無視できない)場合には,この比較はなりたっていません. それと,先にも書きましたが,正しくは正規母集団なのか(正規性の確認)といった検証がないといけませんね. まだ,かみ合っていませんか...??
補足
再度ありがとうございます。が、すみません。まだかみ合っていません。 >(標本)平均も(標本)標準偏差も違う2組のデータA,Bがあったときに,Aに属する甲さんとBに属する乙さんの偏差値が56と66だとすると,乙さんは甲さんよりも上であると判断するのは正しいかということでしょうか? う~ん。微妙に違います。乙>甲か、乙<甲かは正規化(標準化)すれば標準化得点で比較できるのですよね?という意味です。 >AとBとの差がなぜ発生しているのかが問題ですね 差は普通、発生しませんか?違うクラスなので。(同じテストですが) えっと、すみません説明が下手で。母集団って言葉がまずかったかな。 違うクラスという意味です。 正規性の確認に関しては、成績の得点ということで、正規分布を仮定します。その条件でということで。 私の考えは合っていますよね?
- life55
- ベストアンサー率46% (138/294)
何をしたいのでしょうかね? AとBの母集団に差があるかどうかを知りたいのであれば,「母集団の差の検定」というのをします. もちろん,その前にA,Bのデータが正規分布に従っていることを調べなければなりませんけどね. 偏差値というのは,受験のときの偏差値といっしょで,ssmarugooの偏差値のように使いますので,AとかBの母集団の中での相対的な位置を示しているにすぎませんので,AとBを比べるというのとは違います.
補足
すみません。母平均の差の検定(t検定)のことではありません。 A組と、B組で同じテストを行ったとします。 A組の甲さんの偏差値が56だとします。(S=0.6) B組の乙さんの偏差値が66だとします。(S=1.6) でも、A組みの平均と標準偏差と、B組みの平均、標準偏差が違うとき、 甲さんと乙さんを偏差値で比べるとき、私の書いている文章でいいのでしょうか?という意味です。(質問の内容がわかりにくくてすみません) どうでしょうか? アドバイスお願いします。
お礼
回答ありがとうございます。何度もお手数をかけてしまいました。 私が何かかん違いをしていたために複雑なことになってしまいました。偏差値についての理解ができていませんでした。life55様のおっしゃるとおりです。2)については、確かにそうなのですが一般的にテストの成績は偏差値で出されて正規分布を仮定されていますね。正規性の検定もなしに。いや、ほとんどの論文は勝手に正規分布を仮定していますね。 ありがとうございました。