- ベストアンサー
レアな現象の確率・発生時間間隔について
- 梅雨の時期には100年に1回ほどの大規模な降水量が生じます。
- 過去30年のデータから年最大降水量と確率の関係を整理し、特定の降水量や発生確率を求めることができます。
- 確率分布の仮定と確率データの算出方法には恣意性が混入する可能性がありますが、経験的な選択や理論的な根拠に基づいて行われることが多いです。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
>現実と合致しているというのは具体的にはどのような量においてなのでしょうか。 この意味ですが、 1.正規分布と対数正規分布(あるいは、ポアソン分布...)でどれに一致しているか 2.対数正規分布と極値分布、上下限値付き分布でどれに一致しているか (上下限値付き分布(正式名称は何だったかな?忘れた。):たとえば正規分布で確率ゼロとなるのは、σ=±∞のとき ですが、有限でゼロになるように裾の部分を補正した曲線のこと。) により、やり方が異なります。 1.の場合。 度数分布曲線(要するに、データ全体)から判断します。 具体的には、正規分布と仮定した場合、降雨量にマイナスはありえない(要するに下限値がある。)し、 また、度数分布は左側に偏った山となる(大抵の観測地点ではそうなる。)ので、 明らかに正規分布とはみなせません。 2.の場合。 これは、度数分布曲線を描いても、あまりにも曲線が似すぎているため判断不可能です。 ですから、技術的判断が伴う(=人により見解が異なる可能性がある)ことになりますが.... http://www.qsr.mlit.go.jp/osumi/sivsc/home/specialist/item1/01-05.htm の図1.6のようなグラフ(確率紙)を使います。 この場合、対数確率紙を使っているので、雨量データが対数正規分布なら 測定値は直線上に並びます。(理論式は直線です。) 対数正規分布以外なら、理論式は曲線になります。 ※プロッティングポジション公式に何を使うかの問題はあるが.... で、対数確率紙に、直線および各種の仮定分布の結果の曲線を描いてみて、 どれが現実(=測定値)に合っているかを判断します。 ※ガンベル分布用の確率紙も存在します。 で、現実問題として、確率曲線の裾の部分(確率の低い部分)までが 全体傾向に合っている保証はありません。 よって、 ・裾の部分だけを合わせれば良しとする。大雨量10個程度だけのデータをもとに直線回帰する。 ・直線回帰でなく、曲線アリなら全体が合うはず。(岩井法、石原高瀬法) といった手法となります。 >例えば現実の平均的な降水量のようなところでしょうか。それとも >10年に一度(1/10)程度のレベルでの理論カーブとデータ一致性でしょうか。 平均的な降水量とは、確率50%の点を意味するから、どんな分布を想定してもあまりかわりばえしません。 (ポアソン分布とか正規分布まで視野にいれる場合、この限りではない。ポアソン分布や正規分布にならないのは確定的です。) ですから、裾の部分だけを合わせるというような技術的判断もアリです。 裾の部分だけを合わせるというのは、実質的には >10年に一度(1/10)程度のレベルでの理論カーブとデータ一致性 と同じことです。
その他の回答 (4)
- masa2211
- ベストアンサー率43% (178/411)
>30年間で最大の降水量の確率は1/30=0.033で良いのでしょうか。 プロッティングポジション公式を言われるものです。 1/30(カリフォルニア法)でもかまいませんが、1/31(分母に1を足す。トーマスプロット)または 1/30(分母を2倍し、分子は1,3,5,7.....。ハーゼンプロット)が使われます。 >恣意性の混入....どうしてそうするのだろうという疑問 どうしてそうするのかは、現実と合っているからとしか言いようがありません。 少なくとも、現実と合っていないものを選ぶのはおかしいです。 ただ、「現実と合う可能性があるもの」には複数の可能性があり、統計データという性格上、仕方ないです。 恣意的はどうかは別にして、計算手法を変えればどのくらい変わるかというと、 http://www.qsr.mlit.go.jp/osumi/sivsc/home/specialist/item1/01-05.htm ここには、同じデータで、 岩井法、対数正規(トーマス)、対数正規(ハーゼン)、石原高瀬、ガンベルの 4方法で計算した例があります。
- arrysthmia
- ベストアンサー率38% (442/1154)
No.1 の考え方でいけば、100 年に一度の降水量を求めるためには、 過去 100 年の降水量を調べて、その最大値を取ってくればよい… ということになります。身も蓋もありませんが、 主観の入り込む余地もありません。 > サンプル30個をとったら、そのひとつが30000回に1度の頻度で > しか生じないようなものだった …ようなケースを考えるには、31 個目のデータに関しては、 そのようなケースが生じたという条件での条件付確率分布で考える 必要があります。それが不可能ならば、1/30000 だけを部分的に 持ちだしても、意味をなさない。 その条件付確率分布を考えるには、データの分布について、 観測されたデータから解ること意外に、何らかの仮定を置かねば ならないでしょう。実りある結論は、洞察ある仮定から生ずる… という訳です。それが、「経験的によくあう」の世界ですね。
- stomachman
- ベストアンサー率57% (1014/1775)
同じ確率分布に従う互いに独立なサンプル30個をとったら、そのひとつが30000回に1度の頻度でしか生じないようなものだった、という場合を考えますと、31個目のサンプルが1位になる確率は「上記のような単純なもの」で計算した答である1/31には到底及ばないでしょう。 さて、果たして本当に「30000回に1度」のサンプルなのかどうかは確率分布を(推定して)決めないと言えないし、さらにその確率分布が不変であるという仮定、サンプルが独立だという仮定も必要になる。これらの仮定が本質的に重要という訳ですが、でもいずれも疑う余地がある訳で、かくて疑問だらけということになりそうです。
- arrysthmia
- ベストアンサー率38% (442/1154)
既に得られている 30 個のデータと これから測定する 31 個目のデータが、 共通の確率分布に、独立に従っているとすれば、31 個目のデータが順位 n 位になる確率は、 n の値によらず 1/31 です。 これは、各データが独立であれば、 分布関数には依りません。 そういう話?
お礼
回答有難うございます。そういう話です。 私が見ている資料に ”ワイブル分布(k=1.5)に従う有限個の極値データの場合、未超過確率P(H<Xm,N)=1-(m-α)/(N+β) k=1.5の場合α=β=0.42" とあります。単純に順番でなくて、分布型に依存したプロッティングポジション公式?になっているのです。これ何?と思案しているところなのです。これが質問の発端です。
お礼
回答有難うございました。 現実と合致しているということですね。現実と合致しているというのは具体的にはどのような量においてなのでしょうか。 例えば現実の平均的な降水量のようなところでしょうか。それとも10年に一度(1/10)程度のレベルでの理論カーブとデータ一致性でしょうか。 本当の勝負は1/100ぐらいなので実はまだまだ発生した事例がないレベル(あるいは1,2回発生?)程度であり、合っているという意味もまた良く分からないのではないかと思うですが。