Use este identificador para citar ou linkar para este item: http://hdl.handle.net/123456789/10105
Título: Predição do Impacto de Curto Prazo de Artigos: O Título como Indicador Chave
Título(s) alternativo(s): Predicting the Short-Term Impact of Articles: The Title as a Key Indicator
Autor(es): AZEVEDO, João Pedro Cavalcanti
Palavras-chave: Predição de Citações;
Aprendizado de Máquina;
Título de Artigo;
Processamento de Linguagem Natural (PLN);
Análise Bibliométrica;
Citações
Citation Prediction;
Machine Learning;
Article Title;
Natural Language Processing (NLP);
Bibliometric Analysis;
Citations
Data do documento: 1-Ago-2025
Editor: UFMA
Resumo: Este trabalho propõe o desenvolvimento de modelos preditivos capazes de classificar artigos científicos como altamente ou pouco citados em um horizonte de curto prazo, utilizando majoritariamente informações extraídas dos títulos. A hipótese investigada é a de que o título de um artigo, mesmo de forma isolada, pode conter indícios suficientes para prever seu potencial impacto na comunidade científica. Para isso, foram construídos quatro conjuntos de dados (com e sem metadados, balanceados e desbalanceados) e testados nove algoritmos clássicos de aprendizado supervisionado. Os experimentos revelaram que, mesmo com entradas textuais mínimas (somente o título), é possível obter desempenhos competitivos na predição de impacto. A adição de metadados forneceu ganhos marginais em algumas configurações, mas não superou significativamente os resultados baseados apenas no título. Essa constatação reforça a relevância dos títulos como indicadores-chave na avaliação precoce do impacto científico.
Descrição: This study proposes the development of predictive models capable of classifying scientific articles as highly or lowly cited in the short term, based primarily on information extracted from their titles. The central hypothesis investigated is that an article’s title alone may contain sufficient signals to forecast its future scientific impact. To test this, four datasets were built (with and without metadata, balanced and unbalanced), and nine classical supervised learning algorithms were evaluated. The experiments demonstrated that even with minimal textual input (titles only), competitive performance can be achieved in citation prediction. Adding metadata provided marginal improvements in some settings but did not significantly outperform the models based solely on titles. These findings highlight the value of titles as key indicators for early impact assessment in scientific research.
URI: http://hdl.handle.net/123456789/10105
Aparece nas coleções:TCC de Graduação em Ciência da Computação do Campus do Bacanga

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
João Pedro Cavalcanti Azevedo.pdfTCC de Graduação543,93 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.