- ベストアンサー
株価データの統計分析と正規性の評価
- 株価データを統計分析し、分散の有無を評価するために、a, b, cの値を求めます。
- 次に、漸近正規性を評価するためにZを計算します。
- Zの値をX²の分布表を使って評価し、株価の分布が正常かどうかを判断します。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
>27.9って事は明らかに5.99や9.21よりも大きくなっているので、正規分布ではないという事が証明出来る! 残念ながら、基本的に間違っています。統計、確率を勉強する際に非常に大事なので是非覚えておいて下さい。 例えばサイコロを10回ふって全部1だったとします。でもこのサイコロがイカサマという証明にはなりません。まともなサイコロでも10回連続1がでる確率は1/6^10 約6千万分の1残っています。でもこんな事言ってたらサンプル採る意味が無くなりますね。だから99.99999%の確率でこのサイコロはイカサマだと結論つけるわけです。つまり統計でこういうことに結論つけるときには必ず有意水準(危険率)を前提にして結論をつけるのです。そのために数値表の正規分布表やカイ2乗、t表などには必ずαとして0.05や0.01という数字があります。これらは正規分布だとそのような数値になる確率がいくつかということがのっています。 今回のJB係数の結果、27.89は正規分布では8.8*10^-7の確率ですが0にはなりません。だから証明ではなく99.999%の確率で正規分布ではないのです。 統計では 1)帰無仮説をたてる・・今回はある株価が正規分布に乗っているという仮説です。 2)有意水準を決める・・・1%:JB係数9.21 3)判定する・・・27.89>9.21で帰無仮説は棄却 4)結論つける・・・有意水準1%でサンプル株価は正規分布に乗っていない (有意水準0.1%でもかまいません。ちなみにエクセルでカイ2乗分布はCHIDIST(27.89,2)で確率計算できます) となります。
その他の回答 (4)
- age_momo
- ベストアンサー率52% (327/622)
#2です。補足というか少し正確性が足りないんで書き足します。 JB係数は『サンプルの母集団が正規分布の時』にカイ2乗分布(自由度2)に従います。例えばカイ2乗分布で(0.05,2)の値は5.99ですがこれは正規分布に基づくサンプルであればJB係数が5.99以上になる確率は5%しかないということです。だからこれから外れると危険率5%で正規分布ではないと結論がつけられます。今回のように大きければ1%でも0.1%でも結論はつけられると思いますが。。。 もともとヒストグラムが正規分布であれば歪度も尖度も0ですからJB係数は正規分布からのはずれ度を平方和で表していると理解すればいいんではないかと思います。(私はそう理解してます) 後、歪度の説明で-になるのを『平均値より小さい方に広がっていたり、ふくらみがあったりしてゆがんでいる』と書きましたがこのふくらみは最大頻度の意味ではなく、裾野がいびつにふくらんでいる(二山になっている)意味です。紛らわしくてすみません。裾野や二つ目のふくらみが左にある以上、平均値が最大頻度より左にずれますから最大頻度(大きな山)は間違いなく右に来ます。
- age_momo
- ベストアンサー率52% (327/622)
Jarque-Bera検定は、歪度と尖度から計算する正規性の検定方法です。この値は自由度2のカイ2乗分布に従います。 どのようにしてこの式が導かれるのかは知りません。(見たことあるんでしょうが忘れました。そこのところは書物で勉強してください。) ただ、先にも書きましたがこの二つの値(歪度と尖度)は正規分布に近ければ 0に値近づきます。また、片方だけが0であることにもあまり意味は有りません。 使い方は有意水準を決め(0.05ぐらい?)、自由度は2でカイ2乗分布表を調べて(エクセルが使えるのなら=CHIINV(0.05,2)で出ます) それより計算結果が大きければ正規分布しているとは言えないという結論になります。
補足
確かに問題にも5.99で95%,9.21で99%みたいな事が書いてあります(^^;) つまり、私のJBの値が27.9って事は明らかに5.99や9.21よりも大きくなっているので、正規分布ではないという事が証明出来る!って事でいいのでしょうか? 何度もすみません(>_<)
- age_momo
- ベストアンサー率52% (327/622)
>イマイチ質問が何を意図してるのかわからなくって。。。 極く簡単にそれぞれが何を表しているか書いてみます。少し正確ではないかも知れませんが。。。 平均値mに対して各サンプルのデータを処理して 1/NΣ(x-m)=0・・・これは当たり前ですね。では、 1/NΣ(x-m)^2=0・・このようなことは全てのデータが同じ値(平均値)の場合のみです。 逆に言えば平均値から離れたデータがあればあるほど大きくなります。 この計算結果を標本分散といいます。平均値からどれだけ広がっているかを示します。 データが正規分布に従うことが分かっていれば平均値と分散があればいいのですが、今回はそれを検定するのですよね。ということはヒストグラムを書いたときに正規分布のようになっているかをデータで示す必要が有ります。 では 1/NΣ(x-m)^3=0・・・これはどんなときに起こるかというと、一つの例として、平均値から-aの所にデータがあって、必ず+aの所にもデータがあればこれは起こります。(-a)^3+a^3=0ですから。 つまりヒストグラムを書いたとき、平均値から左右対称なら0になります。逆に今回はマイナスになっていますから、平均値より小さい方に広がっていたり、ふくらみがあったりしてゆがんでいることが分かります。(平均値から離れた方が3乗すれば大きくなりますから) だから分散(1/NΣ(x-m)^2)^1.5で割って歪度として評価します。 b/a^1.5はヒストグラムを書いたときに左右対象であるか否かだけしか評価できません。例えばサイコロの出目をヒストグラムにとっても(一様分布)b=0でaは一定の値を持ちます。 最後にcですが4乗の間違いですよね。分散aが平均値からどれだけ離れて分布しているかを評価したのをもう一度繰り返しているようなものです。 c/a^2=(1/NΣ(x-m)^4)/(1/NΣ(x-m)^2)^2はヒストグラムが尖っているか(平均値付近によりデータが集中しているか)を評価します。尖がりを持たないヒストグラム(一様分布)の時には1.8、三角分布で2.4、正規分布で3、ロジスティック分布で4.2になります。 だから、c/a^2-3は0であれば正規分布のように平均値付近にデータが集中していることを示します。これを尖度といいます。 サンプルのヒストグラムが正規分布に近ければb/a^1.5とc/a^2-3は0に近い値をとります。
お礼
そういうことだったんですね♪ ヒストグラムを書いてみましたが、やはり正規分布 とは言えない形になっています。 そして、aとbの結果から平均値より左に偏りの ある分散になっているというわけですね~。 Z=(N/6)(b/a^1.5)^2+(N/24)(c/a^2-3)^2 この式、全体は何を表しているのでしょうか? 「Jarque-Bera」という公式らしいのですが・・・ 後この計算から得られるZの値をどうカイ2乗検定の 表にあてはめて使えばいいのでしょうか? 宜しくお願いします。
補足
>最後にcですが4乗の間違いですよね。 あっ、はい。そうです。4乗の間違いです。 >c/a^2-3は0であれば正規分布のように平均値付近にデータが集中していること -0.091352606 と0に近い数字なんですが、グラフは全然、正規分布っぽくないんですが・・・なぜなんでしょう・・・ >1/NΣ(x-m)^3 グラフは明らかに平均値より右側に偏りがあるんですよね。答えがマイナスになるって事は間違っているという ことでしょうか? EXCELで計算したから間違ってはないと思うのですが。
- kyotowim
- ベストアンサー率18% (2/11)
最初の質問「普通に分散しているか?」については、変動係数(CV,Coefficient of Variation)、分散、歪度、尖度、などをキーワードとして検索してみてください。そんなに難しくありません。 後半に関しては、「検定」「推定」「信頼区間」などで検索して検定について勉強して、「正規性の検定」をキーワードに調べてみてください。 大学1,2回生くらいでする統計の教科書になら、これらのことは書いてあると思います。 「Xⅱ^2」はどう読むのかわかりませんが、多分カイ二乗、のことでしょうか?カイ二乗検定、とかも、上のキーワードで調べるとでてくるはずです。 Zの 値と、分布表のパーセント点の値とを比べて仮説が正しいかどうかを検定します。
お礼
回答有り難うございます。 Xⅱ^2はカイ2乗の事だったんですね。。。 ここに投稿する前にネットでも調べたんですが、イマイチ質問が何を意図してるのかわからなくって。。。
お礼
なるほど~。 こういう流れで問題を解く意図があったんですね! 何度も質問に答えて頂いて有難うございました☆