Use este identificador para citar ou linkar para este item: http://hdl.handle.net/123456789/6390
Título: Estudo comparativo de arquiteturas de redes neurais convolucionais aplicado ao diagnóstico de patologias da visão
Título(s) alternativo(s): Comparative study of convolutional neural network architectures applied to the diagnosis of vision pathologies
Autor(es): CARVALHO, Lucas Cunha de
Palavras-chave: convNeXt;
efficientNet;
aprendizado profundo;
imagem de fundo de olho;
convNeXt;
efficientNet;
deep learning;
fundus eye images.
Data do documento: 2023
Editor: Universidade Federal do Maranhão
Resumo: Resumo O diagnóstico precoce de patologias como a retinopatia diabética e glaucoma é fundamental para o tratamento por conta do risco de cegueira, entretanto, essa demanda muitas vezes não pode ser atendida devido ao processo de análise manual que costuma ser demorado além da grande quantidade de exames realizados visando detectar tais patologias que crescem cada vez mais em todo o mundo. Técnicas de aprendizagem profunda podem ser fundamentais na busca pela automatização de tal processo de diagnose de patologias relacionadas ao fundo de olho, por meio da detecção entre imagens patológicas ou saudáveis, favorecendo o diagnóstico precoce, a agilidade em fornecer resultados de novos exames, além de reduzir custos e esforços humanos. Para um trabalho de classificação com tantas características a serem analisadas nas imagens, a escolha da rede neural ideal é fundamental para melhores resultados e economia de custos computacionais. Este estudo realiza uma análise entre duas redes neurais de convolução que possuem abordagens diferentes, a ConvNeXt e EfficientNet. Estas baseam seus funcionamentos em respectivamente, Vision Transformers e escalabilidade de parâmetros em uma rede de convolução convencional. O trabalho proposto também pôde analisar técnicas de pré-processamento de imagens, otimização de parâmetros e balanceamento de imagens, além de testar e avaliar diferentes métodos de treinamento como Shallow Fine Tuning e Deep Fine Tuning sendo os experimentos efetuados em 5748 imagens de fundo de olho da base ODIR-5K. Através das técnicas citadas, os modelos obtiveram médias de métricas entre Precision, Recall e F1-Score de 0,71 para a ConvNeXt e 0,78 para a EfficientNet, resultando em modelos que puderam aprender características das imagens e que foram capazes de detectar imagens de fundo de olho patológicas ou saudáveis com precisão satisfatória.__Abstract Early diagnosis of pathologies such as diabetic retinopathy and glaucoma is essential for treatment due to the risk of blindness, however, this demand often not answered due to the manual review process which is often time consuming in addition to the large number of tests carried out to detect such pathologies that are growing all over the world. Deep learning techniques can be fundamental in the search for the automation of such process of diagnosis of pathologies related to the fundus of the eye, through the detection between pathological or healthy images, favoring early diagnosis, agility in providing results of new exams, in addition to reducing costs and human efforts. For a classification problem with so many features in the images, the choice of the ideal neural network is essential for better results and computational cost savings, this study performs an analysis between two convolution neural networks that have different approaches, the ConvNeXt and EfficientNet, which base their functioning on respectively, Vision Transformers and parameter scalability in a conventional convolution network. The proposed work could also analyze image pre-processing, parameter optimization and image balancing techniques, as well as testing and evaluating different methods of training such as Shallow Fine Tuning and Deep Fine Tuning the experiments were performed on 5748 fundus images from the ODIR-5K base. Through the techniques cited above, the models obtained mean metrics between Precision, Recall and F1-Score of 0.71 for ConvNeXt and 0.78 for EfficientNet, resulting in models that could learn image features and who were able to detect pathological or healthy fundus images with satisfactory accuracy.
URI: http://hdl.handle.net/123456789/6390
Aparece nas coleções:TCCs de Graduação em Ciência da Computação do Campus do Bacanga

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
LucasCarvalho.pdfTrabalho de Conclusão de Curso2,6 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.