- ベストアンサー
ポアッソン過程の相関について
- お店のレジにお客さんがポアッソン過程でやって来る場合、二つのレジのお客のタイミングの相関を計算する方法について知りたい
- 二つのレジにやってくるお客のタイミングを1日分記録し、相関を計算する方法を教えてください
- また、お客とお客の間の時間間隔の相関についても理論や定義がありましたら教えてください
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
初めからそう書いてあれば,話は簡単でした. ポアソン過程のパラメタは到着率だけですから「ポアソン過程 A と B に関係がある」と言ったら inhomogeneous Poisson process を想定することになり,「 時刻 t における A の rate a(t) と B の rate b(t) に関係がある」ことまで必然です. だからたとえば従来は a(t) と b(t) を独立に想定していたところを簡単に拡張するなら, z(t) という景気動向みたいなものを想定して a(t) = f(z(t)), b(t) = g(z(t)) にします. 混乱のもとは「こっちのレジが混んでたら、こっちに並ぶ。。。」という説明です.「なら,ポアソンじゃないじゃん」となりますから.
その他の回答 (3)
- ur2c
- ベストアンサー率63% (264/416)
> ぼやかして書いてます > 説明が後出し後出し 事情はわかります. > 人がどういうタイミングでどちらのレジにやってくるか それが人の行動モデルです. 私なら,こういう方針で行きます:人の行動モデルを作る.モデルのパラメタを過去のデータから推定する.行動モデルで客の到着過程を生成する. モデルのパラメタとは,たとえば到着率とか,集団到着を仮定するなら集団の大きさの分布とかです. > 人がレジにやってくる過去のデータを分析して、統計量を推定して、その統計量をもった乱数を生成して、人がやってくるタイミングシナリオを多数作って、 待ち行列の計算ではなくシミュレーションでやるという方針が確定なら,そこまで既存の指標を示すことにこだわる必要はないでしょう.自分で便利な指標を定義すれば済むことで. 蛇足ながら,推定するのはモデルの母数であって,統計量ではありません.ついでに,統計量と統計値を区別した方が話が正確に通じると思います. > ヒストリカルシミュレーションと呼称したりします 情報処理では trace-driven simulation なんて呼びます. Historical simulation という言葉は,finance の分野では違う意味 http://en.wikipedia.org/wiki/Historical_simulation で使ってます. > ブートストラップ法 やるなら,resampling でどういう性質を保存するかが問題です.ポアソン性を保存なら必然的に「無相関」なので.
お礼
何度も回答、本当にありがとうございます 正にファイナンスにおけるシミュレーションに取り組んでいるのです (リスク管理のシミュレーションです) 「レジ」と書いたのも、「やって来る人」と書いたのも 質問のためであって、本当は全然違う状況なのです そこでいう所の、「人の行動モデル」(人ではないですが)が、現行では ポアッソン乱数(負の二項乱数なんてのも使ったりする) を使ったモデルなのです そこで、モデルを拡張しようと考え、相関を考慮できないかなぁと、いろいろと考察を 重ねているところです 回答を参考にもう少し練り上げてみます またつっかえた時には質問することがあるかと思いますが、その時はまたよろしくご教示下さい ありがとうございました
- ur2c
- ベストアンサー率63% (264/416)
> シミュレーションをしたい 多分,シミュレーションは手段で,やりたいことではないでしょう.「やりたいこと」は普通,解析の結果を使って「何を決めたいのか」を指します. > 生成されたシナリオで統計をとったら、もちろん過去データと同じ(似た)統計量(平均、分散、そして相関)になっていると、、、ということを考えていました 実測があるのに,更に架空のシナリオを作りたいのは,なぜでしょう?
お礼
回答をありがとうございます 前者の質問に関してですが、やりたいことはシミュレーションです。 「実測があるのに、架空のシナリオ、、、」とありますが、、、ここは説明が足りませんでした。 いろいろと訳があって、ぼやかして書いてますが、実際はレジにやってくる人のシミュレーションではなく、そこから先があります。 例えば、レジAとレジBで人を1人処理するのにコストが幾らかかる、というコストモデルが別に存在します。 そこで、 人がレジにやってくる過去のデータを分析して、統計量を推定して、その統計量をもった乱数を生成して、人がやってくるタイミングシナリオを多数作って、コストのモデルをXにしたらトータル幾らのコストが予想されるか、コストのモデルをYにしたらまた幾らになるか、、、という結果を得る。 というようなことをやりたいと思っています 過去の実測データをそのもま使うという方法もあります(我々はヒストリカルシミュレーションと呼称したりしますが)。それですと過去に100データしかないと、100個の結果しか得られません(ブートストラップ法といって、ヒストリカルデータを水増しする方法もあったりします)。そこで、統計量だけに注目して、統計量を再現するような多数の乱数に基づいたシナリオ(例えば1000000個)をつくって、結果の統計量をもって将来の予想値とする、、、というようなイメージです。 2段階のプロセスがある訳です ●「人がどういうタイミングでどちらのレジにやってくるか」(これを乱数でシミュレーションする) ●「人がやってきたら幾らのコストがかかるか」(いろいろ試したいモデルがある) =>結果として、与えられたコストモデルでトータル幾らのコストがかかるか(期待値、分散)、そして、どういったコストモデルにしたらコストを最小化できるか、、、等が調べたいことです。 この前半の部分(乱数シナリオ生成)は「相関を持った多変量ポアッソン乱数」(レジがAとBなら2変量ポアッソン乱数)を生成することでシナリオが作れるのではないかと考えまして、じゃあ相関は過去データから相関をどうやって計算しようか、、という質問でした。 説明が後出し後出しになって、いろいろとご面倒をかけてしまいました。
- ur2c
- ベストアンサー率63% (264/416)
> 二つのレジに並ぶお客の行動は独立ではなく、何らかの相関があると思います(こっちのレジが混んでたら、こっちに並ぶ。。。逆相関?みたいなものがある?) ポアソン過程は無記憶です.もしもある客の到着がそれ以降の客の到着に影響するなら,到着はポアソン過程ではありえません.ですから > 相関があってもなおそれぞれのレジにやってくるお客はポアッソン過程だとして、、、 というのは,論理的に矛盾です. でも,各レジへの到着をポアソン過程と「みなす」ことはできるかもしれません.たとえば各レジへの到着はポアソン過程だという帰無仮説を立てて棄却されなければ,(社会通念上)ポアソン過程だと思ってもかまわんだろ,ということになります.その場合「二つのレジに並ぶお客の行動は(観測した限り実際上)独立」だ,ということになります. > お互いのレジにやってくるお客さんのタイミングの相関はどうやって定義(計算)されるのか 定義は自由に作れます.でも,その「相関」情報を使って何をするのかを決めておかないと,作った定義が目的に対して適切かどうか判断できません. > レジA にお客が到達する時刻を A(1), A(2),... A(N) > レジBに客が到達する時刻をB(1), B(2),... B(M) > (当然やってきた人数が異なる) > とした場合の相関の計算法が知りたい もともとポアソン過程があって,それが A と B に分割されるとします.ある客がどのレジに行くかの判断は,レジ自体(行きやすいか)と直前の客の判断(先客がどっちに行ったか)とに影響されるかもしれない.そこが知りたいなら AA, AB, BB, BA という遷移を持つマルコフ鎖を考えて,遷移頻度を調べればわかります. もう少し説得力のある行動を想定するなら,「前の客のサービスが済んでいないうちに次の客が到着した場合,その客は短い方の行列にならぶ」とかもありでしょう.つまり先客が見えなくなっていれば影響はないとするわけです. 要するに,客の行動モデルを作るのが先決だという意見です.
お礼
まずは詳細な回答をありがとうございました。 思っていたより、ずっと深い内容で、、、戸惑っています。 根っこから考え直さないといけないようです。 一応やりたいことを書いておきますと、、、 過去3時間におけるレジAとレジBにやってくる客の到達時間を記録します(レジじゃなくても、交差点Aと交差点Bにおける過去1年間の事故の発生時点でもなんでも、、、) 時間軸上に、レジAに人がきた時点に赤い点、レジBに人がきたところに青い点を打ちます。 すると赤い点が濃いところは青い点も濃いとか、その逆とか、まったく関係なさそうだ、、、などがあるとおもいます。 それを上手に定量化して、、、 次に上記でもとめた何らかの相関をもった2つの乱数(ポアソンかな)を生成して、モンテカルロシミュレーションをしたいのです。 赤が濃いところは青も濃い、、、ということであれば、レジAの乱数が大きい時はレジBの乱数も大きく出がち、、、といった感じで相関をもった乱数を生成します。 それを例えば10000回繰り返したとして、生成されたシナリオで統計をとったら、もちろん過去データと同じ(似た)統計量(平均、分散、そして相関)になっていると、、、ということを考えていました もう少し考えてみます ありがとうございました
お礼
大変な遠回りをしてしまったようです にもかかわらず、根気強くお付き合い頂いて感謝しています 教えて頂いたキーワードを中心に調査、こうさつを進めます 本当にありがとうあ