実際のところ良く分かってないので、半分想像で。 強化学習は、複数の選択肢があるときに、最も利益の高い選択肢を学習する手法である。予め答えを与えなくても学習が進んでいくことが特徴。 ここで、次のようなゲームを考える。A,Bがいて、5つのカードを持…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。