Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/123456789/10119Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.contributor.author | SOARES, Steven Roger dos Santos | - |
| dc.date.accessioned | 2025-10-20T13:11:42Z | - |
| dc.date.available | 2025-10-20T13:11:42Z | - |
| dc.date.issued | 2025-08-14 | - |
| dc.identifier.uri | http://hdl.handle.net/123456789/10119 | - |
| dc.description | Gaze position classification is a complex task of great relevance for clinical applications, such as strabismus diagnosis. One method is an ophthalmological examination called the Cover Test, which tests the level of strabismus deviation in five different gaze positions and is essential for surgical planning. This study aims to evaluate the performance of different convolutional neural network (CNN) architectures in predicting five distinct gaze positions in Cover Test videos. Nine modern and robust architectures were selected, systematically applying techniques such as Early Stopping, Fine-Tuning, and Progressive Thawing with different learning rates to optimize performance and generate models capable of performing inference on the Cover Test video database. Experiments were conducted based on the concept of Grid Search. One test case used Progressive Thawing and another used only two Thawed Feature Units, both for varying Learning Rates (LRs). Four distinct data sources were used for training, validation, and testing. The evaluation was conducted based on metrics such as accuracy, precision, F1-Score, and recall, as well as observing the behavior of the loss function (loss) and confusion matrix. The results led to rankings of the best models, which achieved up to 98% in some metrics during validation. When filtering the top five, performance ranged from 70% to 98% for Precision and F1-Score. In tests with real-world data, the AlexNet architecture stood out, achieving 88% precision and 85% recall, while the others performed worse, achieving results below 80. | pt_BR |
| dc.description.abstract | A classificação da posição do olhar é uma tarefa complexa e de grande relevância para aplicações clínicas, como o diagnóstico de estrabismo. Um dos meios seria pelo exame oftalmológico chamado Cover Test, que consiste em testar o nível de desvio de estrabismo em cinco posições diferentes do olhar sendo fundamental para o planejamento cirúrgico. Este estudo tem como objetivo avaliar o desempenho de diferentes arquiteturas de redes neurais convolucionais (CNNs) na predição de cinco posições distintas do olhar em vídeos de Cover Test. Foram selecionadas nove arquiteturas modernas e robustas aplicando de forma sistemática, técnicas como Early Stopping, Fine-Tuning e Descongelamento Progressivo com diferentes taxas de aprendizado, visando otimizar o desempenho e gerar modelos capazes de realizar inferência sobre a base de vídeos do Cover Test, conduzindo os experimentos baseados na ideia de Grid Search, onde dois cenários experimentais foram avaliados: o primeiro empregando o Descongelamento Progressivo das camadas do modelo, e o segundo utilizando o descongelamento de apenas duas camadas de extração de características, ambos os cenários foram submetidos a diferentes taxas de aprendizado. Para o treinamento, validação e teste, utilizaram-se quatro fontes distintas de dados. A avaliação foi conduzida com base em métricas como acurácia, precisão, F1-Score, recall, além da observação do comportamento da função de perda (loss) e matriz de confusão. Por meio dos resultados, foram feitos ranqueamentos dos melhores modelos, que alcançaram até 98% em algumas das métricas durante a validação. Ao filtrar os cinco melhores da validação, observou-se o desempenho variando entre 70% e 98% para Precisão e F1-Score. Nos testes com dados de domínio real, a arquitetura AlexNet se destacou, alcançando precisão de 88% e recall de 85%, enquanto as demais apresentaram resultados inferiores abaixo de 80%. | pt_BR |
| dc.publisher | UFMA | pt_BR |
| dc.subject | Cover Test; | pt_BR |
| dc.subject | Estrabismo; | pt_BR |
| dc.subject | Direção do olhar; | pt_BR |
| dc.subject | Classificação; | pt_BR |
| dc.subject | Redes Convolucionais; | pt_BR |
| dc.subject | Avaliação de arquiteturas | pt_BR |
| dc.subject | Cover Test; | pt_BR |
| dc.subject | Strabismus; | pt_BR |
| dc.subject | Gaze Direction; | pt_BR |
| dc.subject | Classification; | pt_BR |
| dc.subject | Convolutional Networks; | pt_BR |
| dc.subject | Architecture Evaluation | pt_BR |
| dc.title | Avaliação de Redes Neurais Convolucionais na Classificação da Posição do Olhar em Vídeos do Exame Cover Test | pt_BR |
| dc.title.alternative | Evaluation of Convolutional Neural Networks in Gaze Position Classification in Cover Test Exam Videos | pt_BR |
| dc.type | Other | pt_BR |
| Aparece nas coleções: | TCC de Graduação em Ciência da Computação do Campus do Bacanga | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Steven Roger dos Santos Soares.pdf | TCC de Graduação | 11,56 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.