Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/123456789/10105| Título: | Predição do Impacto de Curto Prazo de Artigos: O Título como Indicador Chave |
| Título(s) alternativo(s): | Predicting the Short-Term Impact of Articles: The Title as a Key Indicator |
| Autor(es): | AZEVEDO, João Pedro Cavalcanti |
| Palavras-chave: | Predição de Citações; Aprendizado de Máquina; Título de Artigo; Processamento de Linguagem Natural (PLN); Análise Bibliométrica; Citações Citation Prediction; Machine Learning; Article Title; Natural Language Processing (NLP); Bibliometric Analysis; Citations |
| Data do documento: | 1-Ago-2025 |
| Editor: | UFMA |
| Resumo: | Este trabalho propõe o desenvolvimento de modelos preditivos capazes de classificar artigos científicos como altamente ou pouco citados em um horizonte de curto prazo, utilizando majoritariamente informações extraídas dos títulos. A hipótese investigada é a de que o título de um artigo, mesmo de forma isolada, pode conter indícios suficientes para prever seu potencial impacto na comunidade científica. Para isso, foram construídos quatro conjuntos de dados (com e sem metadados, balanceados e desbalanceados) e testados nove algoritmos clássicos de aprendizado supervisionado. Os experimentos revelaram que, mesmo com entradas textuais mínimas (somente o título), é possível obter desempenhos competitivos na predição de impacto. A adição de metadados forneceu ganhos marginais em algumas configurações, mas não superou significativamente os resultados baseados apenas no título. Essa constatação reforça a relevância dos títulos como indicadores-chave na avaliação precoce do impacto científico. |
| Descrição: | This study proposes the development of predictive models capable of classifying scientific articles as highly or lowly cited in the short term, based primarily on information extracted from their titles. The central hypothesis investigated is that an article’s title alone may contain sufficient signals to forecast its future scientific impact. To test this, four datasets were built (with and without metadata, balanced and unbalanced), and nine classical supervised learning algorithms were evaluated. The experiments demonstrated that even with minimal textual input (titles only), competitive performance can be achieved in citation prediction. Adding metadata provided marginal improvements in some settings but did not significantly outperform the models based solely on titles. These findings highlight the value of titles as key indicators for early impact assessment in scientific research. |
| URI: | http://hdl.handle.net/123456789/10105 |
| Aparece nas coleções: | TCC de Graduação em Ciência da Computação do Campus do Bacanga |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| João Pedro Cavalcanti Azevedo.pdf | TCC de Graduação | 543,93 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.