Your browser doesn't support javascript.
loading
Recuperação de informações em campos de texto livres de prontuários eletrônicos do paciente baseada em semelhança semântica e ortográfica / Information retrieval from free text s of electronic patient records, based on semantic and orthographic portuguese similarity
Martha, Amilton Souza; Campos, Carlos José Reis de; Sigulem, Daniel.
Afiliação
  • Martha, Amilton Souza; Universidade Federal de São Paulo. Informática em Saúde. São Paulo. BR
  • Campos, Carlos José Reis de; Universidade Federal de São Paulo. Disciplina de Informática em Saúde. São Paulo. BR
  • Sigulem, Daniel; Universidade Federal de São Paulo. Disciplina de Informática em Saúde. São Paulo. BR
J. health inform ; 2(3): 63-71, jul.-set. 2010. tab, ilus
Article em Pt | LILACS | ID: lil-581013
Biblioteca responsável: BR1.2
RESUMO
A maior parte da informação médica em forma digital se encontra na forma de textos livres como nos sites de medicina e saúde, artigos científicos em banco de dados da literatura biomédica e em prontuários eletrônicos do paciente (PEP). Muitos problemas podem ocorrer em sistemas de recuperação de informações médicas como o uso de sinonímia, erros de digitação e variações semânticas na linguagem médica. Para analisar a quantidade de informações que são perdidas em sistemas de busca tradicionais, que fazem um busca do termo exato, foram selecionados 34 termos médicos de duas bases de dados de PEPs e pesquisados com um algoritmo tradicional de busca direta embutido em um PEP chamado Clinic ManagerÒ e um sistema desenvolvido batizado SIRIMED que embutiu algoritmos de semelhança semântica (incorporação de sinônimos) e semelhança ortográfica (edit distance+stemming).Os resultados mostram que a recuperação dos termos aumenta em cerca de 30% em relação à busca tradicional, com uma quantidade de falsos positivos baixa (menos de 1%), o que mostra que muitas informações são perdidas normalmente.
ABSTRACT
Most medical information in digital form occurs in internet health sites, biomedical literature databases and electronic patient record (EPR). Many problems can be found in medical information retrieval systems like problems of synonyms, mistakes on typing and semantic variations in medical language. To analyse the amount of lost infomation in traditional information retrieval systems which use exact string matching, 34 medical terms were selected from two databases of EPRs and they were analysed with traditional search found in EPR System called Clinic Manager and a new system called Sirimed developed by autor which was added algorithms to semantic approximate (synonymous) and approximate string matching (edit distance + stemming). The results show that information retrieval was improved in 30% in compare with the traditional search, with little amopunt of false positives (less 1%), that show a lot of lost informations.
Assuntos
Palavras-chave
Texto completo: 1 Coleções: 01-internacional Base de dados: LILACS Assunto principal: Semântica / Armazenamento e Recuperação da Informação / Sistemas Computadorizados de Registros Médicos / Indexação e Redação de Resumos / Serviços de Informação Idioma: Pt Revista: J. health inform Assunto da revista: INFORMATICA MEDICA / SERVICOS DE SAUDE / TECNOLOGIA Ano de publicação: 2010 Tipo de documento: Article País de afiliação: Brasil
Texto completo: 1 Coleções: 01-internacional Base de dados: LILACS Assunto principal: Semântica / Armazenamento e Recuperação da Informação / Sistemas Computadorizados de Registros Médicos / Indexação e Redação de Resumos / Serviços de Informação Idioma: Pt Revista: J. health inform Assunto da revista: INFORMATICA MEDICA / SERVICOS DE SAUDE / TECNOLOGIA Ano de publicação: 2010 Tipo de documento: Article País de afiliação: Brasil