Your browser doesn't support javascript.
loading
Text mining method to unravel long COVID's clinical condition in hospitalized patients.
Veras Florentino, Pilar Tavares; Araújo, Vinícius de Oliveira; Zatti, Henrique; Luis, Caio Vinícius; Cavalcanti, Célia Regina Santos; de Oliveira, Matheus Henrique Citibaldi; Leão, Anderson Henrique França Figueredo; Bertoldo Junior, Juracy; Barbosa, George G Caique; Ravera, Ernesto; Cebukin, Alberto; David, Renata Bernardes; de Melo, Danilo Batista Vieira; Machado, Tales Mota; Bellei, Nancy C J; Boaventura, Viviane; Barral-Netto, Manoel; Smaili, Soraya S.
Affiliation
  • Veras Florentino PT; Laboratório de Medicina e Saúde Pública de Precisão (MeSP2), Instituto Gonçalo Moniz, Fundação Oswaldo Cruz, Salvador, Brazil.
  • Araújo VO; Centro de Integração de Dados e Conhecimentos para a Saúde (CIDACS), Instituto Gonçalo Moniz, Fundação Oswaldo Cruz, Salvador, Brazil.
  • Zatti H; Centro de Integração de Dados e Conhecimentos para a Saúde (CIDACS), Instituto Gonçalo Moniz, Fundação Oswaldo Cruz, Salvador, Brazil.
  • Luis CV; Faculdade de Medicina da Bahia, Universidade Federal da Bahia, Salvador, Brazil.
  • Cavalcanti CRS; Centro de Integração de Dados e Conhecimentos para a Saúde (CIDACS), Instituto Gonçalo Moniz, Fundação Oswaldo Cruz, Salvador, Brazil.
  • de Oliveira MHC; Departamento de Farmacologia, Escola Paulista de Medicina, Universidade Federal de São Paulo, São Paulo, Brazil.
  • Leão AHFF; Departamento de Farmacologia, Escola Paulista de Medicina, Universidade Federal de São Paulo, São Paulo, Brazil.
  • Bertoldo Junior J; Departamento de Farmacologia, Escola Paulista de Medicina, Universidade Federal de São Paulo, São Paulo, Brazil.
  • Barbosa GGC; Departamento de Farmacologia, Escola Paulista de Medicina, Universidade Federal de São Paulo, São Paulo, Brazil.
  • Ravera E; Centro de Integração de Dados e Conhecimentos para a Saúde (CIDACS), Instituto Gonçalo Moniz, Fundação Oswaldo Cruz, Salvador, Brazil.
  • Cebukin A; Centro de Integração de Dados e Conhecimentos para a Saúde (CIDACS), Instituto Gonçalo Moniz, Fundação Oswaldo Cruz, Salvador, Brazil.
  • David RB; Departamento de Farmacologia, Escola Paulista de Medicina, Universidade Federal de São Paulo, São Paulo, Brazil.
  • de Melo DBV; Departamento de Farmacologia, Escola Paulista de Medicina, Universidade Federal de São Paulo, São Paulo, Brazil.
  • Machado TM; Departamento de Farmacologia, Escola Paulista de Medicina, Universidade Federal de São Paulo, São Paulo, Brazil.
  • Bellei NCJ; Faculdade de Medicina, Universidade de São Paulo, São Paulo, Brazil.
  • Boaventura V; Centro de Integração de Dados e Conhecimentos para a Saúde (CIDACS), Instituto Gonçalo Moniz, Fundação Oswaldo Cruz, Salvador, Brazil.
  • Barral-Netto M; Diretoria de Tecnologia da Informação, Universidade Federal de Ouro Preto, Ouro Preto, Brazil.
  • Smaili SS; Disciplina de Moléstias Infecciosas, Escola Paulista de Medicina, Universidade Federal de São Paulo, São Paulo, Brazil.
Cell Death Dis ; 15(9): 671, 2024 Sep 13.
Article in En | MEDLINE | ID: mdl-39271699
ABSTRACT
Long COVID is characterized by persistent that extends symptoms beyond established timeframes. Its varied presentation across different populations and healthcare systems poses significant challenges in understanding its clinical manifestations and implications. In this study, we present a novel application of text mining technique to automatically extract unstructured data from a long COVID survey conducted at a prominent university hospital in São Paulo, Brazil. Our phonetic text clustering (PTC) method enables the exploration of unstructured Electronic Healthcare Records (EHR) data to unify different written forms of similar terms into a single phonemic representation. We used n-gram text analysis to detect compound words and negated terms in Portuguese-BR, focusing on medical conditions and symptoms related to long COVID. By leveraging text mining, we aim to contribute to a deeper understanding of this chronic condition and its implications for healthcare systems globally. The model developed in this study has the potential for scalability and applicability in other healthcare settings, thereby supporting broader research efforts and informing clinical decision-making for long COVID patients.
Subject(s)

Full text: 1 Collection: 01-internacional Database: MEDLINE Main subject: Data Mining / COVID-19 Limits: Humans Country/Region as subject: America do sul / Brasil Language: En Journal: Cell Death Dis / Cell death and disease Year: 2024 Document type: Article Affiliation country: Brasil Country of publication: Reino Unido

Full text: 1 Collection: 01-internacional Database: MEDLINE Main subject: Data Mining / COVID-19 Limits: Humans Country/Region as subject: America do sul / Brasil Language: En Journal: Cell Death Dis / Cell death and disease Year: 2024 Document type: Article Affiliation country: Brasil Country of publication: Reino Unido