Recuperação de informações em campos de texto livres de prontuários eletrônicos do paciente baseada em semelhança semântica e ortográfica

Martha, Amilton Souza; Campos, Carlos José Reis de; Sigulem, Daniel

Recuperação de informações em campos de texto livres de prontuários eletrônicos do paciente baseada em semelhança semântica e ortográfica / Information retrieval from free text s of electronic patient records, based on semantic and orthographic portuguese similarity

Martha, Amilton Souza; Campos, Carlos José Reis de; Sigulem, Daniel.

Afiliação

Martha, Amilton Souza; Universidade Federal de São Paulo. Informática em Saúde. São Paulo. BR
Campos, Carlos José Reis de; Universidade Federal de São Paulo. Disciplina de Informática em Saúde. São Paulo. BR
Sigulem, Daniel; Universidade Federal de São Paulo. Disciplina de Informática em Saúde. São Paulo. BR

J. health inform ; 2(3): 63-71, jul.-set. 2010. tab, ilus

Article em Pt | LILACS | ID: lil-581013

Biblioteca responsável: BR1.2

RESUMO
ABSTRACT

RESUMO

A maior parte da informação médica em forma digital se encontra na forma de textos livres como nos sites de medicina e saúde, artigos científicos em banco de dados da literatura biomédica e em prontuários eletrônicos do paciente (PEP). Muitos problemas podem ocorrer em sistemas de recuperação de informações médicas como o uso de sinonímia, erros de digitação e variações semânticas na linguagem médica. Para analisar a quantidade de informações que são perdidas em sistemas de busca tradicionais, que fazem um busca do termo exato, foram selecionados 34 termos médicos de duas bases de dados de PEPs e pesquisados com um algoritmo tradicional de busca direta embutido em um PEP chamado Clinic ManagerÒ e um sistema desenvolvido batizado SIRIMED que embutiu algoritmos de semelhança semântica (incorporação de sinônimos) e semelhança ortográfica (edit distance+stemming).Os resultados mostram que a recuperação dos termos aumenta em cerca de 30% em relação à busca tradicional, com uma quantidade de falsos positivos baixa (menos de 1%), o que mostra que muitas informações são perdidas normalmente.

ABSTRACT

Most medical information in digital form occurs in internet health sites, biomedical literature databases and electronic patient record (EPR). Many problems can be found in medical information retrieval systems like problems of synonyms, mistakes on typing and semantic variations in medical language. To analyse the amount of lost infomation in traditional information retrieval systems which use exact string matching, 34 medical terms were selected from two databases of EPRs and they were analysed with traditional search found in EPR System called Clinic Manager and a new system called Sirimed developed by autor which was added algorithms to semantic approximate (synonymous) and approximate string matching (edit distance + stemming). The results show that information retrieval was improved in 30% in compare with the traditional search, with little amopunt of false positives (less 1%), that show a lot of lost informations.

Assuntos

Armazenamento e Recuperação da Informação; Indexação e Redação de Resumos/métodos; Semântica; Serviços de Informação; Sistemas Computadorizados de Registros Médicos

Palavras-chave

Armazenamento e Recuperação da Informação; Information Services; Information Storage and Retrieval; Medical Records Systems Computerized; Serviços de Informação; Sistemas Computadorizados de Registros Médicos

Texto completo

Adicionar na Minha BVS

Imprimir

XML

Buscar no Google

Texto completo: 1 Coleções: 01-internacional Base de dados: LILACS Assunto principal: Semântica / Armazenamento e Recuperação da Informação / Sistemas Computadorizados de Registros Médicos / Indexação e Redação de Resumos / Serviços de Informação Idioma: Pt Revista: J. health inform Assunto da revista: INFORMATICA MEDICA / SERVICOS DE SAUDE / TECNOLOGIA Ano de publicação: 2010 Tipo de documento: Article País de afiliação: Brasil

Texto completo

Adicionar na Minha BVS

Imprimir

XML

Buscar no Google