• 締切済み

QQプロット

QQプロットに関して質問です。 QQプロットでデータが正規分布にしたがっていると データが直線に並ぶのはなぜですか? わかる方がいらっしゃいましたら 教えていただきたいです。 よろしくお願いします。

みんなの回答

noname#227064
noname#227064
回答No.3

#2に修正漏れがあったので訂正。 変数変換後の積分範囲は0から1です。

noname#227064
noname#227064
回答No.2

以下は標準正規分布を例にしていますが、他の分布でも同様です。 標準正規分布の確率密度関数をφ(x)、分布関数をΦ(x)とおくと、大きさnの無作為標本の小さい方から数えてk番目の確率変数X_kの確率密度関数f(x_k)は、 f(x_k) = {n!/((k-1)!(n-k)!)} {Φ(x_k)}^(k-1) {1-Φ(x_k)}^(n-k) φ(x) となります。 横軸にk/(n+1)、縦軸にΦ(x_k)をプロットした図がP-Pプロットとなります。 ここで、Φ(x_k)の期待値を求めてみると、 E[Φ(x_k)] = ∫_{-∞}^∞ Φ(x_k) f(x_k) dx_k = ∫_{-∞}^∞ {n!/((k-1)!(n-k)!)} u^k (1-u)^(n-k) du (u=Φ(x_k)で変数変換した) = {n!/((k-1)!(n-k)!)} Beta(k+1, n-k+1) (Betaはベータ関数) = {n!/((k-1)!(n-k)!)} {k!(n-k)!/(n+1)!} = k/(n+1) となることから、P-Pプロットは期待値を考えると直線になることがわかります。 実際、 E[{Φ(x_k)}^2] = ∫_{-∞}^∞ {Φ(x_k)}^2 f(x_k) dx_k = ∫_{-∞}^∞ {n!/((k-1)!(n-k)!)} u^(k+1) (1-u)^(n-k) du = {n!/((k-1)!(n-k)!)} Beta(k+2, n-k+1) = {n!/((k-1)!(n-k)!)} {(k+1)!(n-k)!/(n+2)!} = (k+1)k/{(n+2)(n+1)} から V[Φ(x_k)] = (k+1)k/{(n+2)(n+1)}-{k/(n+1)}^2 = k(n-k+1)/(n+2)(n+1)^2 であることから、n→∞のときΦ(x_k)はk/(n+1)に一致します。 ちなみに、ここでは横軸をk/(n+1)としましたが、これ以外の方法もあります。 一方、横軸にφ^(-1)(k/(n+1))、縦軸にx_kをプロットしたのが、ご質問のQ-Qプロットとなります。 nが十分大きければ、k/(n+1)≒Φ(x_k)になるのだから、逆変換してもΦ^(-1)(k/(n+1))≒x_kとなります。 したがって、こちらも直線になることが期待されます。

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

累積正規分布(標準正規分布のヒストグラムを積分したもの)をヨコ軸、正規化したデータの累積分布(データを平均0、標準偏差1になるように変換したもののヒストグラムを積分したもの)を縦軸にしてプロットしてるんです。 もし正規化したデータが標準正規分布に従っていれば、縦軸yと横軸xは同じなんだから、プロットはy=xのグラフになって、つまりナナメ45度の直線になる。