Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/123456789/7549
Título: | Desenvolvimento de um modelo não linear do sucesso futuro de curto prazo de cientistas da física usando regressão simbólica |
Título(s) alternativo(s): | Development of a nonlinear model of the short-term future success of physics scientists using symbolic regression |
Autor(es): | ALMEIDA, José Vinícius Reis de |
Palavras-chave: | aprendizado de máquina; regressão simbólica; predições científicas; machine learning; symbolic regression; scientific predictions |
Data do documento: | 9-Jan-2024 |
Editor: | Universidade Federal do Maranhão |
Resumo: | Resumo: A predição do sucesso científico de curto prazo de físicos, medido pelo número de artigos com 3 citações do cientista nos próximos anos, é uma tarefa importante para diversos atores, como instituições de pesquisa, agências de fomento e empresas. Para esta tarefa, modelos de redes neurais artificiais são capazes de fornecer resultados precisos, mas são complexos e difíceis de interpretar. Modelos de regressão linear múltipla, por outro lado, são mais fáceis de interpretar, mas pressupõem que a relação entre variáveis independentes e dependentes é linear, o que nem sempre é o caso. Neste trabalho, propomos um novo modelo não linear do índice I3 futuro de físicos, baseado em regressão simbólica. O modelo foi treinado e testado com um conjunto de dados que inclui informações sobre o desempenho acadêmico, a experiência de pesquisa e as características pessoais de físicos. O modelo proposto obteve um RMSE menor que o do modelo linear, indicando que é superior em termos de precisão.__Abstract: Predicting the short-term scientific success of physicists, measured by the number of articles with 3 citations of the scientist in the next three years, is an important task for a variety of stakeholders such as research institutions, funding organizations and companies. For this task, artificial neural network models can provide accurate results, but they are complex and difficult to interpret. Multiple linear regression models, on the other hand, are easier to interpret, but they assume that the relationship between independent and dependent variables is linear, which is not always the case. In this work, we propose a new non-linear model of the future I3 index of physicists based on symbolic regression. The model was trained and tested on a dataset containing information about the academic performance, research experience and personal characteristics of physicists. The proposed model achieved a lower RMSE than the linear model, suggesting that it is superior in terms of accuracy. |
URI: | http://hdl.handle.net/123456789/7549 |
Aparece nas coleções: | TCCs de Graduação em Ciência da Computação do Campus do Bacanga |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Jose_Vinicius_Reis_de_Almeida.pdf | Trabalho de Conclusão de Curso | 1,86 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.