Desenvolvimento de um modelo não linear do sucesso futuro de curto prazo de cientistas da física usando regressão simbólica
Nenhuma Miniatura disponível
Data
2024-01-09
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal do Maranhão
Resumo
Resumo: A predição do sucesso científico de curto prazo de físicos, medido pelo número de artigos
com 3 citações do cientista nos próximos anos, é uma tarefa importante para diversos atores,
como instituições de pesquisa, agências de fomento e empresas. Para esta tarefa, modelos
de redes neurais artificiais são capazes de fornecer resultados precisos, mas são complexos e
difíceis de interpretar. Modelos de regressão linear múltipla, por outro lado, são mais fáceis
de interpretar, mas pressupõem que a relação entre variáveis independentes e dependentes
é linear, o que nem sempre é o caso. Neste trabalho, propomos um novo modelo não linear
do índice I3 futuro de físicos, baseado em regressão simbólica. O modelo foi treinado e
testado com um conjunto de dados que inclui informações sobre o desempenho acadêmico,
a experiência de pesquisa e as características pessoais de físicos. O modelo proposto obteve
um RMSE menor que o do modelo linear, indicando que é superior em termos de precisão.__Abstract: Predicting the short-term scientific success of physicists, measured by the number of
articles with 3 citations of the scientist in the next three years, is an important task for a
variety of stakeholders such as research institutions, funding organizations and companies.
For this task, artificial neural network models can provide accurate results, but they are
complex and difficult to interpret. Multiple linear regression models, on the other hand,
are easier to interpret, but they assume that the relationship between independent and
dependent variables is linear, which is not always the case. In this work, we propose a new
non-linear model of the future I3 index of physicists based on symbolic regression. The
model was trained and tested on a dataset containing information about the academic
performance, research experience and personal characteristics of physicists. The proposed
model achieved a lower RMSE than the linear model, suggesting that it is superior in
terms of accuracy.
Descrição
Palavras-chave
aprendizado de máquina;, regressão simbólica;, predições científicas;, machine learning; symbolic regression; scientific predictions