文章基本信息

标题：報酬設計を通した社会的相互作用による行為概念群の構築 : シェマ理論に基づいた累増的強化学習
本地全文：下载
作者：谷口忠大 ; 椹木哲夫
期刊名称：知能と情報
印刷版ISSN：1347-7986
电子版ISSN：1881-7203
出版年度：2006
卷号：18
期号：4
页码：629-640
DOI：10.3156/jsoft.18.629
出版社：Japan Society for Fuzzy Theory and Intelligent Informatics
摘要：
本稿ではJ. Piagetのシェマ理論における同化・調節及び均衡化・分化の概念を強化学習の枠組みに適用することにより累増的に行為概念を獲得することの出来る仕組みを提案する. この手法はただ一つの報酬チャンネルを用いた相互作用を用いてユーザや環境と相互作用する中で様々な行為を獲得していくことの出来る自律ロボットの実現を目指したものである. 提案手法は広く一般のTD学習に適用可能である. 本稿ではQ学習と双シェマモデルにおける強化学習に適用した実験例を示す. いずれの場合にも教師の明示的な指示なしに, 強化学習器を分化させ複数の行為概念を獲得することが出来る. また, この仕組みにより報酬は新規の行為を獲得させるという役割以外に, 獲得した行為を想起させるという役割を担うようになる.
关键词：階層的モジュール型強化学習; 累増型学習; シェマ; 社会的相互作用