- ベストアンサー
ある時系列が非定常ポアソン過程に従うことを統計的に示すにはどうしたらよ
ある時系列が非定常ポアソン過程に従うことを統計的に示すにはどうしたらよいのでしょうか?どなたかわかる方、ご教示いただければ幸いに存じます。 データは製品のリリース数(誕生数、1週間単位)です。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
> 週ごとの製品のリリース > 発生時刻の間隔は一定で発生件数が問題 > データをどう変換すれば定常ポアソンになるのか 普通は離散時間のデータを連続時間に変換するのではなく、連続時間の過程を離散時間に翻訳します。 k = 1, 2, ... を週の連番、週毎に観測された発生件数 を y(k) とする。 λ(t) が推定済みなので、各週の期待発生数 x(k) が計算できる。y(k) の x(k) に対する適合度を検定する。x(k) の計算に用いる λ(k) は、 λ(t) の第 k 週における平均を用いる。 どうしても離散時間のデータを連続時間に変換したいなら、どうするか。ポアソン過程なので、ある週の中で生起した事象の生起時刻はランダムです。(うるさく言うと λ(t) によって生起時刻を配分する必要がありますけど、そこまでしなくても。)これを使って、たとえば bootstrapping 用のデータが生成できます。しかしそうすると、週末でも平日と同じように製品がリリースされることになって不自然だ、と言われるでしょうね。
その他の回答 (1)
- ur2c
- ベストアンサー率63% (264/416)
それは原理的に不可能です。 非定常ポアソン過程で「ない」ことを示すことは可能です。たとえば到着率の関数を推定し、それによって時間伸縮をしておいてからポアソン過程の検定をすれば良い。 実際には、何か検定をやって棄却されなかったら帰無仮説を認めちゃうのが慣習の分野が多いです。だから普通は、とりあえず思いつく検定をやっておいてから、しれっと「この時系列を非定常ポアソン過程でモデル化し」くらいで、分析の目的を達成するために必要な議論を進めます。 「非定常ポアソン過程って言えてないだろ」と突っ込まれたら、「そう考えては不都合だとする積極的な理由が私にはみつかりませんでしたので。非定常ポアソンでなくてもいいです。対案を妥当性と合わせて提示してください」と、立証責任をなすりつけるのが手筋です。 原案と対案の比較検討には情報量基準などを用います。対案の方が妥当だという結論なら、今度は分析の目的を達成するために必要な議論をやりなおさないと。
補足
ご回答ありがとうございます。 原理的に不可能というのは帰無仮説検定の限界の話(帰無仮説を 採択するのは望ましくない)ですよね。それは心得ているつもりです。 私の作戦としましては、まさにおっしゃる通りで、ざっくり図を 通して非定常ポワソン(λ(t)の関数はここで特定)になるのを見せたうえで、 ストレステストのような感じで定常に直したプロセスを 検定しても「仮説は棄却されません」と一行論文に書ければと考えております (無論、帰無仮説を採択することになるのですが...)。 ただ、重ねて質問させていただいて恐縮なのですが、 時間伸縮(時間尺度変換?)の具体的な方法がわからなくて 困っております。リンク先の神経の話(発生時刻が問題になっている場合) とは違い、週ごとの製品のリリースの情報のみがある場合(発生時刻の 間隔は一定で発生件数が問題になっている場合)はどうやれば 定常ポアソン過程に変換できるのでしょうか。 現状は元データ列(製品の誕生件数) {4,5,8,6,12,9,7,7,12,8,14,13,5,12,11,8,12,9,2,3,5,4,2,2...} の移動平均値を分析するとλ(t)=r(1+αsin(wt))でかなりきれいに フィット出来る所までは辿りついているのですが、元データをどう変換すれば 定常ポアソンになるのかで引っかかっています。 もしご存知であれば、重ねてご教示頂ければ幸いに存じます。
お礼
丁寧なご回答ありがとうございます。 教えていただいた方法を理論的に発生させた非定常ポアソンに従う時系列に試してみた所、無事に帰無仮説が棄却されずうまく行きました。 個人的には時間に直す方法の方がスマートな気もするのですが、確かに週の中のばらつきを無視するのはどうかと突っ込まれる可能性はありますね。その辺はまた色々考えてみたいと思います。 最後になりますが、この度は親切に教えていただき誠にありがとうございました。 また機会があればよろしくお願いします。