Your browser doesn't support javascript.
loading
An interpretable machine learning model for covid-19 screening
Pinasco, Gustavo Carreiro; Farina, Eduardo Moreno Júdice de Mattos; Filho, Fabiano Novaes Barcellos; Fiorotti, Willer França; Ferreira, Matheus Coradini Mariano; Cruz, Sheila Cristina de Souza; Colodette, Andre Louzada; Loureiro, Luciene Rossati; Comério, Tatiane; Farias, Dilzilene Cunha Sivirino; Lima, Eliane de Fátima Almeida; Manhambusque, Katia Valéria; Abreu, Luiz Carlos.
Afiliação
  • Pinasco, Gustavo Carreiro; Universidade Federal do Espírito Santo ­ UFES. Vitória - ES. BR
  • Farina, Eduardo Moreno Júdice de Mattos; Universidade Federal de São Paulo ­ UNIFESP. São Paulo - SP. BR
  • Filho, Fabiano Novaes Barcellos; Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória ­ EMESCAM. Vitória - ES. BR
  • Fiorotti, Willer França; Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória ­ EMESCAM. Vitória - ES. BR
  • Ferreira, Matheus Coradini Mariano; Prefeitura Municipal de Vitória. Vitória - ES. BR
  • Cruz, Sheila Cristina de Souza; Prefeitura Municipal de Vitória. Vitória - ES. BR
  • Colodette, Andre Louzada; Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória ­ EMESCAM. Vitória - ES. BR
  • Loureiro, Luciene Rossati; Prefeitura Municipal de Vitória. Vitória - ES. BR
  • Comério, Tatiane; Prefeitura Municipal de Vitória. Vitória - ES. BR
  • Farias, Dilzilene Cunha Sivirino; Prefeitura Municipal de Vitória. Vitória - ES. BR
  • Lima, Eliane de Fátima Almeida; Universidade Federal do Espírito Santo ­ UFES. Vitória - ES. BR
  • Manhambusque, Katia Valéria; Universidade Federal do Espírito Santo ­ UFES,. Vitória - ES. BR
Artigo em Inglês, Português | LILACS-Express | LILACS | ID: biblio-1437052
Biblioteca responsável: BR1251
ABSTRACT
Introduction: the Coronavirus Disease 2019 (COVID-19) is a viral disease which has been declared a pandemic by the WHO. Diagnostic tests are expensive and are not always available. Researches using machine learning (ML) approach for diagnosing SARS-CoV-2 infection have been proposed in the literature to reduce cost and allow better control of the pandemic. Objective: we aim to develop a machine learning model to predict if a patient has COVID-19 with epidemiological data and clinical features. Methods: we used six ML algorithms for COVID-19 screening through diagnostic prediction and did an interpretative analysis using SHAP models and feature importances. Results: our best model was XGBoost (XGB) which obtained an area under the ROC curve of 0.752, a sensitivity of 90%, a specificity of 40%, a positive predictive value (PPV) of 42.16%, and a negative predictive value (NPV) of 91.0%. The best predictors were fever, cough, history of international travel less than 14 days ago, male gender, and nasal congestion, respectively. Conclusion: we conclude that ML is an important tool for screening with high sensitivity, compared to rapid tests, and can be used to empower clinical precision in COVID-19, a disease in which symptoms are very unspecific.
RESUMO
Introdução: a Doença do Coronavírus 2019 (COVID-19) é uma doença viral que foi declarada uma pandemia pela OMS. Testes diagnósticos são caros e nem sempre estão disponíveis. Pesquisas utilizando a abordagem de aprendizado de máquina (ML) para o diagnóstico de infecção por SARS-CoV-2 têm sido propostas na literatura para reduzir custos e permitir melhor controle da pandemia.Objetivo: nosso objetivo é desenvolver um modelo de aprendizado de máquina para prever se um paciente tem COVID-19 com dados epidemiológicos e características clínicas.Método: usamos seis algoritmos de ML para triagem de COVID-19 por meio de predição diagnóstica e fizemos uma análise interpretativa usando modelos SHAP e importâncias de recursos.Resultados: nosso melhor modelo foi o XGBoost (XGB) que obteve área sob a curva ROC de 0,752, sensibilidade de 90%, especificidade de 40%, valor preditivo positivo (VPP) de 42,16% e valor preditivo negativo ( VPL) de 91,0%. Os melhores preditores foram febre, tosse, história de viagem internacional há menos de 14 dias, sexo masculino e congestão nasal, respectivamente.Conclusão: Concluímos que o ML é uma importante ferramenta de triagem com alta sensibilidade, em comparação aos testes rápidos, e pode ser usado para potencializar a precisão clínica na COVID-19, doença em que os sintomas são muito inespecíficos.

C - Todos os direitos reservados


Texto completo: Disponível Coleções: Bases de dados internacionais Base de dados: LILACS Tipo de estudo: Estudo diagnóstico / Estudo prognóstico / Estudo de rastreamento Idioma: Inglês / Português Revista: Journal of Human Growth and Development (Impresso) Ano de publicação: 2022 Tipo de documento: Artigo

Similares

MEDLINE

...
LILACS

LIS


Texto completo: Disponível Coleções: Bases de dados internacionais Base de dados: LILACS Tipo de estudo: Estudo diagnóstico / Estudo prognóstico / Estudo de rastreamento Idioma: Inglês / Português Revista: Journal of Human Growth and Development (Impresso) Ano de publicação: 2022 Tipo de documento: Artigo