レアな現象が発生する確率・発生時間間隔について
梅雨の時期ですが、100年に1回ぐらいに生じる大規模な降水量(1時間降水量mm/h)がどれくらいになるかという問題があります。
例えば、年最大降水量(mm/h)について過去30年間のデータを取得したとします。つまりデータは30個あり、順番に並んでいるとします。
1位 80mm/h
2位 75mm/h
3位 62mm/h
...........
30位 42mm/h
おそらく確率分布とか確率密度関数を仮定し、データに応じたパラメータ設定を行い、年最大降水量(mm/h)⇔確率の関係を整理して、ある確率(例えば100年に1回、すなわち1/100=0.01)の値に応じた降水量を求めたり、ある降水量に対する発生確率(時間間隔の逆数)が求まったりするわけですね。パラメータ同定には最小自乗法とかを使うのだろうと思います。(違うかも知れません。ご指摘ください。)
そうしますと、とにかく確率と降水量のデータを作成する必要があります。ここで質問ですが、30年間で最大の降水量の確率は1/30=0.033で良いのでしょうか。2位は2/30, 3位は3/30,....ということです。
何故だか分かりませんが、確率データの算出は上記のような単純なもの(1/30,2/30...)使用する確率分布関数(あるいは確率密度関数)によって決まっていたのではないでしょうか。そのような気がするのです。いわゆる順序確率といわれる分野になるのではないかと思いますが...。
包括的な質問になりますが、このような確率的な問題を考える上で確率分布の仮定とそれに応じた確率データの算出法というプロセスで恣意性が混入することはないのでしょうか。確率分布の選択というところは”経験的によくあう”、だったり、理論的にそのようになるはずであるとの説明もあると思いますが。これは仕方ないかも知れません。それ以外にどうしてそうするのだろうという疑問は一切ないということになるでしょうか。
お礼
畑作 稲作はどのようなところに適しているのかが1番知りたくて助かりました、わかりやすく答えてくださりありがとうございました!