Your browser doesn't support javascript.
loading
Prediction of absenteeism in public schools teachers with machine learning / Predição de absenteísmo docente na rede pública com machine learning
Programa de Pós-Graduação em Saúde PúblicaFernandes, Fernando Timoteo; Chiavegatto Filho, Alexandre Dias Porto.
  • Programa de Pós-Graduação em Saúde PúblicaFernandes, Fernando Timoteo; Universidade de São Paulo. Faculdade de Saúde Pública. Programa de Pós-Graduação em Saúde PúblicaFernandes, Fernando Timoteo. São Paulo. BR
  • Chiavegatto Filho, Alexandre Dias Porto; Universidade de São Paulo. Faculdade de Saúde Pública. São Paulo. BR
Rev. saúde pública (Online) ; 55: 23, 2021. tab, graf
Article in English | LILACS, BBO | ID: biblio-1280613
ABSTRACT
ABSTRACT OBJECTIVE To predict the risk of absence from work due to morbidities of teachers working in early childhood education in the municipal public schools, using machine learning algorithms. METHODS This is a cross-sectional study using secondary, public and anonymous data from the Relação Anual de Informações Sociais, selecting early childhood education teachers who worked in the municipal public schools of the state of São Paulo between 2014 and 2018 (n = 174,294). Data on the average number of students per class and number of inhabitants in the municipality were also linked. The data were separated into training and testing, using records from 2014 to 2016 (n = 103,357) to train five predictive models, and data from 2017 to 2018 (n = 70,937) to test their performance in new data. The predictive performance of the algorithms was evaluated using the value of the area under the ROC curve (AUROC). RESULTS All five algorithms tested showed an area under the curve above 0.76. The algorithm with the best predictive performance (artificial neural networks) achieved 0.79 of area under the curve, with accuracy of 71.52%, sensitivity of 72.86%, specificity of 70.52%, and kappa of 0.427 in the test data. CONCLUSION It is possible to predict cases of sickness absence in teachers of public schools with machine learning using public data. The best algorithm showed a better result of the area under the curve when compared with the reference model (logistic regression). The algorithms can contribute to more assertive predictions in the public health and worker health areas, allowing to monitor and help prevent the absence of these workers due to morbidity.
RESUMO
RESUMO OBJETIVO Predizer o risco de ausência laboral decorrente de morbidades dos docentes que atuam na educação infantil na rede pública municipal, com o uso de algoritmos de machine learning. MÉTODOS Trata-se de um estudo transversal utilizando dados secundários, públicos e anônimos da Relação Anual de Informações Sociais, selecionando professores da educação infantil que atuaram na rede pública municipal do estado de São Paulo entre 2014 e 2018 (n = 174.294). Foram também vinculados dados da média de alunos por turma e número de habitantes no município. Os dados foram separados em treinamento e teste, utilizando os registros de 2014 a 2016 (n = 103.357) para treinar cinco modelos preditivos e os dados de 2017 a 2018 (n = 70.937) para testar seus desempenhos em dados novos. A performance preditiva dos algoritmos foi avaliada por meio do valor da área abaixo da curva ROC (AUROC). RESULTADOS Todos os cinco algoritmos testados apresentaram área abaixo da curva acima de 0,76. O algoritmo com melhor performance preditiva (redes neurais artificiais) obteve 0,79 de área abaixo da curva, com acurácia de 71,52%, sensibilidade de 72,86%, especificidade de 70,52% e kappa de 0,427 nos dados de teste. CONCLUSÃO É possível predizer casos de afastamentos por morbidade em docentes da rede pública com machine learning usando dados públicos. O melhor algoritmo apresentou melhor resultado da área abaixo da curva quando comparado ao modelo de referência (regressão logística). Os algoritmos podem contribuir para predições mais assertivas na área da saúde pública e da saúde do trabalhador, permitindo acompanhar e ajudar a prevenir afastamentos por morbidade desses trabalhadores.
Subject(s)


Full text: Available Index: LILACS (Americas) Main subject: Absenteeism / Machine Learning Type of study: Observational study / Prevalence study / Prognostic study Limits: Child, preschool / Humans Country/Region as subject: South America / Brazil Language: English Journal: Rev. saúde pública (Online) Journal subject: Sa£de P£blica Year: 2021 Type: Article Affiliation country: Brazil Institution/Affiliation country: Universidade de São Paulo/BR

Similar

MEDLINE

...
LILACS

LIS


Full text: Available Index: LILACS (Americas) Main subject: Absenteeism / Machine Learning Type of study: Observational study / Prevalence study / Prognostic study Limits: Child, preschool / Humans Country/Region as subject: South America / Brazil Language: English Journal: Rev. saúde pública (Online) Journal subject: Sa£de P£blica Year: 2021 Type: Article Affiliation country: Brazil Institution/Affiliation country: Universidade de São Paulo/BR