- ベストアンサー
投票数と重み付け評価についての研究状況
- 投票数による重み付け評価の式や手法を探していますが、文献が見つかりません。
- 投票数と信頼性の関係性を明確にするために、重み付け方法を探しています。
- 投票数が少なければ信頼できる割合を増やし、投票数が多ければ現実的な結果とする重み付け方法を研究しています。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
好き・嫌いが信用できる・できないに相当するかどうかは別として、ベイズの方法を使ってはどうでしょうか。 まず、パラメータθと実現値yとの同時確率密度関数 f(y,θ) を考えます。するとベイズの定理から f(θ|y)∝f(θ)f(y|θ) となります。また、今回は二項分布ですので、サンプル数を(今回の例で言えば総投票数)n、成功数(今回の例で言えば「好き」と回答した数)を y とおけば f(y|θ)∝θ^y (1-θ)^(n-y) と書けます。 ここで、θは必ず 0 と 1 の間にありますがどのような値かは分かりませんので、f(θ)に一様分布を仮定します。すると f(θ)は定数ですから、 f(θ|y)∝θ^y (1-θ)^(n-y) ...(1) と書くことができます。θによらず(-∞,∞)の定積分は1にならなければなりません。したがって、β分布になります。β分布とは f(P)=Γ(α+β)/Γ(α)Γ(β) P^(α-1) (1-P)^(β-1) ∝ P^(α-1) (1-P)^(β-1) で定義された分布で、 平均 = α/(α+β) 分散 = αβ/{(α+β)^2 (α+β+1)} となります。(1)式からα=y+1、β=n-y+1 となりますから 平均 = (y+1)/(n+2) 分散 = (y+1)(n-y+1)/{(n+2)^2 (n+3)} となります。 ここからAさん、Bさんの信頼度を計算すると A さん:平均 = 0.5 、分散 = 0.035 B さん:平均 = 0.97 、分散 = 0.0003 と計算できます。 つまり、Aさんは投票数が少ないために、95%信頼区間が0.5±0.07と大きくなり、逆にBさんは0.97±0.0006と小さくなります。
お礼
ありがとうございます。 信用するしないは、それしか思い浮かべられませんでした…(汗) ベイズ統計ですね。私も挑戦したのですが、 これが絶対的かどうかあまり自信がなくて、 他に公式や定義があるのではないかと探していました。 やはりベイズが最有力なのでしょうか。