Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/123456789/9202
Título: | Desbalanceamento de classes em diagnósticos médicos: revisão de técnicas e seus impactos no machine learning para doenças raras |
Título(s) alternativo(s): | Classroom imbalance in medical diagnostics: review of techniques and their impacts on machine learning for rare diseases |
Autor(es): | PIMENTA, Anderson Carvalhal |
Palavras-chave: | desequilíbrio de classe no diagnóstico médico; doenças raras e aprendizado de máquina; técnicas para lidar com dados desequilibrados; class imbalance in medical diagnosis; rare diseases and machine learning; techniques for handling imbalanced data. |
Data do documento: | 6-Mar-2025 |
Editor: | Universidade Federal do Maranhão |
Resumo: | RESUMO: O desbalanceamento de classes é um desafio significativo em modelos de Machine Learning aplicados ao diagnóstico de doenças raras. Nesses contextos, a maioria dos dados pertence à classe de pacientes saudáveis, o que dificulta a detecção de padrões relevantes na classe minoritária, que são os casos raros. Esse desbalanceamento pode prejudicar a acurácia e a eficácia dos modelos preditivos, tornando a identificação precoce de doenças raras mais difícil. A importância dessa pesquisa reside na necessidade de aprimorar os diagnósticos médicos, especialmente em relação a doenças raras, onde o diagnóstico precoce pode ser determinante para a eficácia do tratamento. O objetivo principal da pesquisa foi analisar e comparar o impacto de diferentes técnicas de balanceamento de classes, como SMOTE e ADASYN, na acurácia de modelos de Machine Learning aplicados ao diagnóstico de doenças raras. A pesquisa foi conduzida por meio de uma revisão bibliográfica integrativa, analisando estudos recentes que discutem as técnicas de balanceamento de classes e sua aplicação no diagnóstico de doenças raras. Foi adotada uma abordagem qualitativa para explorar profundamente os desafios enfrentados pelos modelos de Machine Learning em cenários desbalanceados, além das soluções e inovações propostas por diferentes autores. Os resultados da pesquisa indicaram que as técnicas de oversampling, como SMOTE e ADASYN, têm um impacto positivo na melhoria da performance dos modelos, especialmente em métricas como F1-Score e AUC-ROC, que são mais indicadas para situações de desbalanceamento de classes. No entanto, foi observada a necessidade de cautela, pois o uso excessivo dessas técnicas pode gerar dados sintéticos de baixa qualidade, prejudicando a capacidade de generalização dos modelos. A combinação dessas abordagens com técnicas de Deep Learning mostrou-se promissora, melhorando a captura de relações complexas nos dados clínicos. A pesquisa também destacou a importância de métricas de avaliação adequadas e da aplicação ética da Inteligência Artificial na medicina, para garantir resultados seguros e justos no diagnóstico de doenças raras.___ABSTRACT: Class imbalance is a significant challenge in Machine Learning models applied to the diagnosis of rare diseases. In these contexts, most of the data belongs to the healthy patient class, which makes it difficult to detect relevant patterns in the minority class, which represents rare cases. This imbalance can harm the accuracy and effectiveness of predictive models, making the early identification of rare diseases more difficult. The importance of this research lies in the need to improve medical diagnoses, especially regarding rare diseases, where early diagnosis can be crucial for the effectiveness of treatment. The primary goal of the research was to analyze and compare the impact of different class balancing techniques, such as SMOTE and ADASYN, on the accuracy of Machine Learning models applied to the diagnosis of rare diseases. The research was conducted through an integrative literature review, analyzing recent studies discussing class balancing techniques and their application in the diagnosis of rare diseases. A qualitative approach was adopted to deeply explore the challenges faced by Machine Learning models in imbalanced scenarios, as well as the solutions and innovations proposed by different authors. The research results indicated that oversampling techniques, such as SMOTE and ADASYN, have a positive impact on improving model performance, especially in metrics such as F1 Score and AUC-ROC, which are better suited for class imbalance situations. However, caution was observed, as excessive use of these techniques can generate low-quality synthetic data, harming the models' generalization ability. The combination of these approaches with Deep Learning techniques proved promising, improving the capture of complex relationships in clinical data. The research also highlighted the importance of proper evaluation metrics and the ethical application of Artificial Intelligence in medicine to ensure safe and fair outcomes in the diagnosis of rare diseases. |
URI: | http://hdl.handle.net/123456789/9202 |
Aparece nas coleções: | TCCs de Graduação em Bacharelado Interdisciplinar em Ciência e Tecnologia do Campus Bacanga |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
ANDERSONCARVALHALPIMENTA.pdf | Trabalho de Conclusão de Curso | 399,98 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.