- 締切済み
適合率と再現率
バグの有無予測のため、Rでロジスティック回帰と線形判別分析で予測しました。 しかし適合率と再現率の求め方がわかりません。 適合率は、検索結果の中にどの程度正解が含まれるかを示す。 再現率は、正解のうち、どの程度が検索にヒットするかを示す。 正解ってなんですか?データの事ですか?予測結果を使うんですか?
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- f272
- ベストアンサー率46% (8477/18147)
回答No.3
> 予測結果が0に近ければ無し、1に近ければバグ有りではないのですか? それは予測です。本当にそれが正しいのかどうかはわかりません。 もう一度いいます。 完全にバグがあるかどうかわかっているデータを使って予測モデルを作成して,そのモデルの適合率や再現率を計算して,予測モデルの良し悪しを見るのです。
- f272
- ベストアンサー率46% (8477/18147)
回答No.2
> 予測結果から調べるのですか? 予測から実際にバグの有無が完全にわかると思っているのですか?そんなことはありえないでしょう。完全にバグがあるかどうかわかっているデータを使って予測モデルを作成して,そのモデルの適合率や再現率を計算して,予測モデルの良し悪しを見るのです。
質問者
補足
目的変数0と1にしたんですが 予測結果が0に近ければ無し、1に近ければバグ有りではないのですか?
- f272
- ベストアンサー率46% (8477/18147)
回答No.1
予測したのならそのバグの有無の予測結果がありますね。それから実際にバグの有無を調べていますね。そういう前提で... バグがあるもののうちバグがあると予測された数N1 バグがあるもののうちバグがあると予測されなかった数N2 バグがないもののうちバグがあると予測された数N3 バグがないもののうちバグがあると予測されなかった数N4 がわかるはずです。 適合率はN1/(N1+N3) 再現率はN1/(N1+N2) のことです。
質問者
補足
バグの有無調べてなかったです。予測結果から調べるのですか?
補足
モデルの比較が終わったらグラフにするんですが普通に折れ線グラフみたいなやつでいいんですか?