- ベストアンサー
95%信頼度での統計的違いについて
ある本に、 提案1:サイト訪問者5300, 購入者46, CVR=0.87% 提案2:サイト訪問者5200, 購入者55, CVR=1.06% の場合、95%信頼度では統計的に違いがないが、 提案1:サイト訪問者5300, 購入者46, CVR=0.87% 提案2:サイト訪問者5200, 購入者63, CVR=1.21% の場合であれば、95%信頼度で統計的に違いがあるといえる。 という記載がありました。現在統計の勉強中なのですが、どう検定すれば上記がわかるのか、検討もつきません。どなたかどういう式でそういえるのか、教えて頂けないでしょうか。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
サイト訪問者のうち、商品を買うか買わないかの統計だから、二項分布になります。 提案1の場合、n=5300人訪れたうち、平均してx'=46人が商品を購入するだろうという二項分布です。 二項分布の性質として、全体の事象の発生確率=母比率をpとすれば平均=np、分散=np(1-p)です。 母比率pはわかりませんので、統計データ p'=x'/n=p で近似します。 質問の場合は、nが大きい(np=64>10で実用的には正規分布で近似できるとされる)ので、正規分布とします。 また、ここでは商品の差異ではなく、サイトの出来についての話とすれば、サイトを訪れる、5300人が属する集団と5200人が属する集団は同質とするのが妥当でしょう。 サイトの出来はアクセスしなければわからないからです。 したがって、質問の場合、σが共通で未知の、2群の母平均の差の検定(Z検定)ていいでしょう。 σが未知なので、標本分散からの推定を使うだけです。
お礼
ありがとうございました。 ようやく理解できました。 前者は 1.475 に、後者の方は 2.64 になったので、前者は仮説を棄却できず、また後者は対立仮説となることが理解できました。