- ベストアンサー
『機械学習』に関する質問です。
『教師有り学習』の際に『戻り値』を指定してしまいますと、 どうして其の学習が『教師無し学習( http://ja.wikipedia.org/wiki/%E6%95%99%E5%B8%AB%E3%81%AA%E3%81%97%E5%AD%A6%E7%BF%92 )』になるのでしょうか?
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
こんばんは。 間違っていたら申し訳が無いけど、ずっと調べていました。 これを調べるには「強化学習」で調べると良いようです。 該当する書籍での一部分を抜粋。 人工知能概論 第2版 荒屋真二 著 113ページ >8.5 強化学習 >強化学習(reinforcement learning)は第11章で述べるエージェントの学習に対する 有効な手段の一つとして注目されています。強化学習は、環境の状態s(state)に 対して行動a(action)をとったときに環境から得られる報酬r(reward) をもとに、初期状態からゴール状態に渡って受け取る報酬が最大になるような行動戦略を 学習します(図8.4)。強化学習は「教師なし学習」に属しており、環境に関する正し い知識をあらかじめ準備する必要はありません。また、行動とその行動の評価を繰り返し ながら学習していくため、環境がゆるやかに変化する動的な環境にも対応可能です。さら にアルゴリズムが簡単でプログラミングが容易というメリットもあります。 それ以外での追加の情報です。 >強化学習 >http://ja.wikipedia.org/wiki/%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92
補足
有り難う御座います。御協力に強く感謝します。 私が引用したページの内容から類推しまして、 「『教師あり学習』の過程の途上で得られた『戻り値』を『引数』にする『循環参照』の結果が、『教師あり学習』を『教師なし学習』へと導く」のだろう、 と私は勝手に解釈しておりましたので、 此の質問文を纏めてみましたが、 私の解釈は『マルコフ決定過程』と関わっていますでしょうか?