- ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:決定木の分岐条件について)
決定木の分岐条件について
このQ&Aのポイント
- 決定木の分岐条件についてお聞きしたいことがございます。分岐に用いる判断としては、分岐前のノードと、分岐後のノードの情報量の差(情報利得: Information Gain)をとり、この値の大きい分類を採用しています。差が大きい場合、分岐後は情報量の不純度が少なくなり、分類の精度が向上すると言えます。
- 決定木の分岐条件についてお聞きしたいことがあります。「情報利得」という値を用いて、分岐前のノードと、分岐後のノードの情報量の差を計算し、その値が大きい分類を選択するという手法が用いられています。差が大きいということは、分岐後のノードの情報量が増え、不純度が減るということを示しています。つまり、分岐後はより純粋な分類が可能となり、分類の精度が向上すると言えます。
- 決定木の分岐条件について教えてください。分岐には情報利得という指標が用いられます。情報利得は、分岐前のノードと、分岐後のノードの情報量の差を表します。この値が大きいほど、分岐後のノードの情報量が増え、分類の精度が向上します。つまり、差が大きいということは、分岐後のノードがより純粋な分類を示していると言えます。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
見込み客を連れてきたとき、その人が買ってくれそうかどうかを、なるべく旨く予測したい。予測に使える判定基準A,B,C, ... のうち、どれを適用すべきか。 この話に出てくる「予測性能の評価尺度」としての情報量は、 http://oshiete1.goo.ne.jp/qa4870476.html と同じ事でして、判定基準A,B,C,...のうち予測性能が一番優秀なのはどれか、を情報量の総計(情報エントロピー)で測って比べているんです。 で、ある判定基準を選んだとする。その判定基準で選抜した対象(顧客)に対して、さらに別の判別基準を適用して精度を上げよう、というわけで、ここでもまた情報エントロピーで予測性能を測って比べる。
お礼
ありがとうございました。