Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/123456789/10090| Título: | MODELAGEM DE AGENTES INTELIGENTES USANDO APRENDIZADO POR REFORÇO EM AMBIENTES UNITY |
| Título(s) alternativo(s): | Modeling Intelligent Agents Using Reinforcement Learning in Unity Environments |
| Autor(es): | MENDES JUNIOR, Fernando Cesar Lisboa |
| Palavras-chave: | Aprendizado por Reforço; Proximal Policy Optimization; Unity; Jogos Digitais Reinforcement Learning; Proximal Policy Optimization; Unity; Digital Games |
| Data do documento: | 5-Jun-2025 |
| Editor: | UFMA |
| Resumo: | Este trabalho tem como objetivo compreender o processo de aplicação dos algoritmos de aprendizado por reforço por meio da implementação em ambientes da Unity. Como metodologia, optou-se por uma pesquisa do tipo exploratória e abordagem quantitativa, desenvolvida em três etapas: análise da literatura associada aos algoritmos de aprendizado por reforço; implementação do algoritmo de aprendizado por reforço PPO (Proximal Policy Optimization) em ambientes da Unity; desenvolvimento e avaliação da eficácia e desempenho dos agentes em cenários específicos. Para tanto, aplicou-se AR em diferentes tarefas, visando obter a melhoria do desempenho dos agentes em ambientes complexos e dinâmicos. Foram construídos diversos cenários com características e mecânicas comumente utilizadas em jogos digitais. Como resultado deste estudo, verificou-se, por meio da análise da taxa de sucesso, que todos os agentes foram capazes de realizar suas tarefas com grande precisão, com uma taxa mínima de sucesso de 87,4% em 1000 tentativas, mesmo em cenários com desafios significativos. Isso comprova a eficácia do algoritmo utilizado e mostra a capacidade dos agentes de generalizar estratégias e alcançar seus objetivos em diferentes situações. |
| Descrição: | This work aims to understand the process of applying reinforcement learning algorithms through implementation in Unity environments. As a methodology, an exploratory research approach with a quantitative perspective was chosen, developed in three stages: analysis of the literature related to reinforcement learning algorithms; implementation of the PPO (Proximal Policy Optimization) reinforcement learning algorithm in Unity environments; and development and evaluation of the effectiveness and performance of agents in specific scenarios. To achieve this, reinforcement learning was applied to different tasks, aiming to improve agent performance in complex and dynamic environments. Various scenarios were constructed with characteristics and mechanics commonly used in digital games. As a result of this study, it was found-through success rate analysis-that all agents were able to perform their tasks with high accuracy, achieving a minimum success rate of 87.4% in 1,000 attempts, even in scenarios with significant challenges. This confirms the effectiveness of the algorithm used and demonstrates the agents’ ability to generalize strategies and achieve their objectives in various situations. |
| URI: | http://hdl.handle.net/123456789/10090 |
| Aparece nas coleções: | TCC de Graduação em Ciência da Computação do Campus do Bacanga |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| FERNANDO CÉSAR LISBOA MENDES JUNIOR.pdf | TCC de Graduação | 2,57 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.