首页    期刊浏览 2025年07月10日 星期四
登录注册

文章基本信息

  • 标题:Learning a Transferable World Model by Reinforcement Agent in Deterministic Observable Grid-World Environments
  • 其他标题:Learning a Transferable World Model by Reinforcement Agent in Deterministic Observable Grid-World Environments
  • 作者:Kapočiūtė-Dzikienė, Jurgita ; Raškinis, Gailius
  • 期刊名称:Engineering Economics
  • 印刷版ISSN:2029-5839
  • 出版年度:2012
  • 卷号:41
  • 期号:4
  • 页码:318-327
  • DOI:10.5755/j01.itc.41.4.915
  • 语种:English
  • 出版社:Kaunas University of Technology
  • 摘要:Pastiprinimu paremti agentai mokytis susiduria su problemomis perkeldami vienoje aplinkoje įgytas žinias į naujasaplinkas: taip nutinka dėl receptorių pateikimų interpretavimo būdo ir mechanizmų, leidžiančių tinkamai apibendrinti receptoriųpateikimus, trūkumo. Straipsnyje ši žinių perkeliamumo problema yra sprendžiama pasiūlius agentą, kuris taiko sprendimųmedžio indukcijos ir konstrukcinės indukcijos metodus, o receptorių pateikimus interpretuoja kaip paskirstytą savybių rinkinį.Pradėdamas darbą agentas neturi jokių žinių nei apie aplinką, nei apie savo veiksmų pasekmes. Jis išmoksta pasaulio modelį(sprendimų medžių rinkinį), atitinkantį išsamius veiksmų aprašymus, pagal kurį turint konkrečius receptorių pateikimus, galimaprognozuoti veiksmų pasekmes. Agento planavimo komponentė, paremta paieškos platyn metodu: ji ieško veiksmų grandiniųnuo vienos aplinkos situacijos iki kitos naudodama pasaulio modelį ir pagal jį suprognozuotus receptorių pateikimus. Pasiūlytasmetodas palygintas su Q-mokymo ir Adaptyvaus dinaminio programavimo metodais: pateiktos metodų galimybės siekti tikslųstatinėse stebimose deterministinėse iš laukelių sudarytose aplinkose, taikant ne toje pačioje aplinkoje išmoktus pasauliomodelius.DOI: http://dx.doi.org/10.5755/j01.itc.41.4.915
  • 其他摘要:Reinforcement-based agents have difficulties in transferring their acquired knowledge into new different environments due to the common identities-based percept representation and the lack of appropriate generalization capabilities. In this paper, the problem of knowledge transferability is addressed by proposing an agent dotted with decision tree induction and constructive induction capabilities and relying on decomposable properties-based percept representation. The agent starts without any prior knowledge of its environment and of the effects of its actions. It learns a world model (the set of decision trees) that corresponds to the set of explicit action definitions predicting action effects in terms of agent’s percepts. Agent’s planning component uses predictions of the world model to chain actions via a breadth-first search. The proposed agent was compared to the Q-learning and Adaptive Dynamic Programming based agents and demonstrated better ability to achieve goals in static observable deterministic grid-world environments different from those in which it has learnt its world model.DOI: http://dx.doi.org/10.5755/j01.itc.41.4.915
  • 关键词:Adaptive agent; reinforcement learning; percept generalization; world model
  • 其他关键词:Agent; adaptive behavior; world model; learning; planning; decision tree; grid world; reinforcement; percept generalization
Loading...
联系我们|关于我们|网站声明
国家哲学社会科学文献中心版权所有