ベストアンサー

『機械学習』に関する質問です。

2012/08/12 13:03

『教師有り学習』の際に『戻り値』を指定してしまいますと、どうして其の学習が『教師無し学習( http://ja.wikipedia.org/wiki/%E6%95%99%E5%B8%AB%E3%81%AA%E3%81%97%E5%AD%A6%E7%BF%92 )』になるのでしょうか？

SakuraiMisato
お礼率39% (237/599)

科学
回答数1
ありがとう数0

みんなの回答 （1）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

LEVELUP100
ベストアンサー率40% (183/453)

2012/08/14 19:56 回答No.1

　こんばんは。　間違っていたら申し訳が無いけど、ずっと調べていました。　これを調べるには「強化学習」で調べると良いようです。　該当する書籍での一部分を抜粋。　人工知能概論　第2版　荒屋真二　著　113ページ＞８．５　強化学習＞強化学習（reinforcement learning）は第１１章で述べるエージェントの学習に対する有効な手段の一つとして注目されています。強化学習は、環境の状態ｓ（ｓｔａｔｅ）に対して行動ａ（ａｃｔｉｏｎ）をとったときに環境から得られる報酬ｒ（ｒｅｗａｒｄ）をもとに、初期状態からゴール状態に渡って受け取る報酬が最大になるような行動戦略を学習します（図８．４）。強化学習は「教師なし学習」に属しており、環境に関する正しい知識をあらかじめ準備する必要はありません。また、行動とその行動の評価を繰り返しながら学習していくため、環境がゆるやかに変化する動的な環境にも対応可能です。さらにアルゴリズムが簡単でプログラミングが容易というメリットもあります。　それ以外での追加の情報です。＞強化学習＞http://ja.wikipedia.org/wiki/%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92

質問者

補足 2012/08/15 00:15

有り難う御座います。御協力に強く感謝します。私が引用したページの内容から類推しまして、「『教師あり学習』の過程の途上で得られた『戻り値』を『引数』にする『循環参照』の結果が、『教師あり学習』を『教師なし学習』へと導く」のだろう、と私は勝手に解釈しておりましたので、此の質問文を纏めてみましたが、私の解釈は『マルコフ決定過程』と関わっていますでしょうか？