Desenvolvimento de um modelo não linear do sucesso futuro de curto prazo de cientistas da física usando regressão simbólica

Nenhuma Miniatura disponível

Data

2024-01-09

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal do Maranhão

Resumo

Resumo: A predição do sucesso científico de curto prazo de físicos, medido pelo número de artigos com 3 citações do cientista nos próximos anos, é uma tarefa importante para diversos atores, como instituições de pesquisa, agências de fomento e empresas. Para esta tarefa, modelos de redes neurais artificiais são capazes de fornecer resultados precisos, mas são complexos e difíceis de interpretar. Modelos de regressão linear múltipla, por outro lado, são mais fáceis de interpretar, mas pressupõem que a relação entre variáveis independentes e dependentes é linear, o que nem sempre é o caso. Neste trabalho, propomos um novo modelo não linear do índice I3 futuro de físicos, baseado em regressão simbólica. O modelo foi treinado e testado com um conjunto de dados que inclui informações sobre o desempenho acadêmico, a experiência de pesquisa e as características pessoais de físicos. O modelo proposto obteve um RMSE menor que o do modelo linear, indicando que é superior em termos de precisão.__Abstract: Predicting the short-term scientific success of physicists, measured by the number of articles with 3 citations of the scientist in the next three years, is an important task for a variety of stakeholders such as research institutions, funding organizations and companies. For this task, artificial neural network models can provide accurate results, but they are complex and difficult to interpret. Multiple linear regression models, on the other hand, are easier to interpret, but they assume that the relationship between independent and dependent variables is linear, which is not always the case. In this work, we propose a new non-linear model of the future I3 index of physicists based on symbolic regression. The model was trained and tested on a dataset containing information about the academic performance, research experience and personal characteristics of physicists. The proposed model achieved a lower RMSE than the linear model, suggesting that it is superior in terms of accuracy.

Descrição

Palavras-chave

aprendizado de máquina;, regressão simbólica;, predições científicas;, machine learning; symbolic regression; scientific predictions

Citação