Publicação

Estudo de aprendizagem por reforço em jogo Tower Defense

Detalhes bibliográficos
Resumo:	A aprendizagem por reforço está revolucionando a inteligência artificial, isso representa que sistemas autônomos estão compreendendo cada vez mais o mundo visual. A aprendizagem por reforço é uma das abordagens de aprendizagem de máquina que funciona alterando o comportamento do agente por meio de feedbacks, como recompensas ou penalidades por suas ações. Trabalhos recentes utilizam aprendizagem por reforço para treinar agentes capazes de jogar jogos eletrônicos e obter pontuações até mais altas que jogadores humanos profissionais. As aplicações para agentes inteligentes em jogos incluem propiciar desafios mais complexos aos jogadores, melhorar a ambientação dos jogos proporcionando interações mais complexas e até servem como forma de prever o comportamento dos jogadores quando o jogo está em fase de desenvolvimento. A maioria dos trabalhos atuais, derivados de uma arquitetura conhecida como rede Q profunda, trabalham usando técnicas de aprendizagem profunda para processar a imagem do jogo, criando uma representação intermediária. Esta representação é, então, processada por camadas de rede neural capazes de mapear situações do jogo em ações que visam maximizar a recompensa ao longo do tempo. Entretanto, este método é inviável em jogos modernos, renderizados em alta resolução com taxa de quadros cada vez maior. Além disto, este método não funciona para treinar agentes que não estão mostrados na tela. Desta forma, neste trabalhos propomos um pipeline de aprendizagem por reforço baseado em redes neurais cuja entrada são metadados fornecidos diretamente pelo jogo e as ações são mapeadas diretamente em ações de alto-nível do agente. Propomos esta arquitetura para um agente jogador de defesa de torre, um jogo de estratégia em tempo real cujo agente não é representado na tela diretamente.
Autores principais:	Dias, Augusto Vicente Fernandes
Assunto:	Aprendizagem por reforço Inteligência artificial Rede neural Tower Defense
Ano:	2020
País:	Portugal
Tipo de documento:	dissertação de mestrado
Tipo de acesso:	acesso aberto
Instituição associada:	Instituto Politécnico de Bragança
Idioma:	português
Origem:	Biblioteca Digital do IPB

Descrição
Resumo:	A aprendizagem por reforço está revolucionando a inteligência artificial, isso representa que sistemas autônomos estão compreendendo cada vez mais o mundo visual. A aprendizagem por reforço é uma das abordagens de aprendizagem de máquina que funciona alterando o comportamento do agente por meio de feedbacks, como recompensas ou penalidades por suas ações. Trabalhos recentes utilizam aprendizagem por reforço para treinar agentes capazes de jogar jogos eletrônicos e obter pontuações até mais altas que jogadores humanos profissionais. As aplicações para agentes inteligentes em jogos incluem propiciar desafios mais complexos aos jogadores, melhorar a ambientação dos jogos proporcionando interações mais complexas e até servem como forma de prever o comportamento dos jogadores quando o jogo está em fase de desenvolvimento. A maioria dos trabalhos atuais, derivados de uma arquitetura conhecida como rede Q profunda, trabalham usando técnicas de aprendizagem profunda para processar a imagem do jogo, criando uma representação intermediária. Esta representação é, então, processada por camadas de rede neural capazes de mapear situações do jogo em ações que visam maximizar a recompensa ao longo do tempo. Entretanto, este método é inviável em jogos modernos, renderizados em alta resolução com taxa de quadros cada vez maior. Além disto, este método não funciona para treinar agentes que não estão mostrados na tela. Desta forma, neste trabalhos propomos um pipeline de aprendizagem por reforço baseado em redes neurais cuja entrada são metadados fornecidos diretamente pelo jogo e as ações são mapeadas diretamente em ações de alto-nível do agente. Propomos esta arquitetura para um agente jogador de defesa de torre, um jogo de estratégia em tempo real cujo agente não é representado na tela diretamente.