首页    期刊浏览 2024年11月29日 星期五
登录注册

文章基本信息

  • 标题:Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma
  • 本地全文:下载
  • 作者:André Luiz Carvalho Ottoni ; Erivelton Geraldo Nepomuceno ; Marcos Santos de Oliveira
  • 期刊名称:Revista Brasileira de Computação Aplicada
  • 电子版ISSN:2176-6649
  • 出版年度:2016
  • 卷号:8
  • 期号:2
  • 页码:44-59
  • DOI:10.5335/rbca.v8i2.5249
  • 语种:Portuguese
  • 出版社:Universidade de Passo Fundo (UPF)
  • 摘要:Nos algoritmos de aprendizado por reforço, a taxa de aprendizado (alpha) e o fator de desconto (gamma) podem ser definidos entre qualquer valor no intervalo entre 0 e 1. Assim, adotando os conceitos de regressão logística, é proposta uma metodologia estatística para a análise da influência da variação de \alpha e \gamma nos algoritmos Q-learning e SARSA. Como estudo de caso, o aprendizado por reforço foi aplicado em experimentos de navegação autônoma. A análise de resultados mostrou que simples variações em \alpha e \gamma podem interferir diretamente no desempenho do aprendizado por reforço.
  • 关键词:Aprendizado por Reforço;Navegação Autônoma;Regressão Logística.
国家哲学社会科学文献中心版权所有