MODELAGEM DE AGENTES INTELIGENTES USANDO APRENDIZADO POR REFORÇO EM AMBIENTES UNITY

MENDES JUNIOR, Fernando Cesar Lisboa

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/123456789/10090

Título:	MODELAGEM DE AGENTES INTELIGENTES USANDO APRENDIZADO POR REFORÇO EM AMBIENTES UNITY
Título(s) alternativo(s):	Modeling Intelligent Agents Using Reinforcement Learning in Unity Environments
Autor(es):	MENDES JUNIOR, Fernando Cesar Lisboa
Palavras-chave:	Aprendizado por Reforço; Proximal Policy Optimization; Unity; Jogos Digitais Reinforcement Learning; Proximal Policy Optimization; Unity; Digital Games
Data do documento:	5-Jun-2025
Editor:	UFMA
Resumo:	Este trabalho tem como objetivo compreender o processo de aplicação dos algoritmos de aprendizado por reforço por meio da implementação em ambientes da Unity. Como metodologia, optou-se por uma pesquisa do tipo exploratória e abordagem quantitativa, desenvolvida em três etapas: análise da literatura associada aos algoritmos de aprendizado por reforço; implementação do algoritmo de aprendizado por reforço PPO (Proximal Policy Optimization) em ambientes da Unity; desenvolvimento e avaliação da eficácia e desempenho dos agentes em cenários específicos. Para tanto, aplicou-se AR em diferentes tarefas, visando obter a melhoria do desempenho dos agentes em ambientes complexos e dinâmicos. Foram construídos diversos cenários com características e mecânicas comumente utilizadas em jogos digitais. Como resultado deste estudo, verificou-se, por meio da análise da taxa de sucesso, que todos os agentes foram capazes de realizar suas tarefas com grande precisão, com uma taxa mínima de sucesso de 87,4% em 1000 tentativas, mesmo em cenários com desafios significativos. Isso comprova a eficácia do algoritmo utilizado e mostra a capacidade dos agentes de generalizar estratégias e alcançar seus objetivos em diferentes situações.
Descrição:	This work aims to understand the process of applying reinforcement learning algorithms through implementation in Unity environments. As a methodology, an exploratory research approach with a quantitative perspective was chosen, developed in three stages: analysis of the literature related to reinforcement learning algorithms; implementation of the PPO (Proximal Policy Optimization) reinforcement learning algorithm in Unity environments; and development and evaluation of the effectiveness and performance of agents in specific scenarios. To achieve this, reinforcement learning was applied to different tasks, aiming to improve agent performance in complex and dynamic environments. Various scenarios were constructed with characteristics and mechanics commonly used in digital games. As a result of this study, it was found-through success rate analysis-that all agents were able to perform their tasks with high accuracy, achieving a minimum success rate of 87.4% in 1,000 attempts, even in scenarios with significant challenges. This confirms the effectiveness of the algorithm used and demonstrates the agents’ ability to generalize strategies and achieve their objectives in various situations.
URI:	http://hdl.handle.net/123456789/10090
Aparece nas coleções:	TCC de Graduação em Ciência da Computação do Campus do Bacanga

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
FERNANDO CÉSAR LISBOA MENDES JUNIOR.pdf	TCC de Graduação	2,57 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas