Your browser doesn't support javascript.
loading
Mostrar: 20 | 50 | 100
Resultados 1 - 6 de 6
Filtrar
1.
J. health inform ; 13(1): 10-16, jan.-mar. 2021. ilus, tab
Artículo en Portugués | LILACS | ID: biblio-1363035

RESUMEN

Objetivo: Este estudo pretende aplicar a técnica de geração de dados sintéticos com auxílio de técnicas de limpeza de dados para a classificação de disléxicos e não - disléxicos. Método: Os outliers foram selecionados por especialista. Foi feito uma geração sintética de dados. para cada um de cinco algoritmos foram selecionados características com busca exaustiva. Cada algoritmo foi executado com as características selecionadas e então suas curvas de calibração foram comparadas. Resultados: A regressão logística se destacou como o melhor algoritmo, apresentando o resultado de 99% de acurácia e área sob a curva ROC de 0,999, além de ter obtido a melhor curva de calibração Conclusão: O uso da geração sintética de dados e seleção de características foram capazes de fazer todos os algoritmos avaliados obterem ótimos resultados na classificação de disléxicos e não disléxicos. A regressão logística foi selecionado como melhor algoritmo para classificação de disléxicos.


Objective: This study aims to apply the synthetic data generation technique with the aid of data cleaning techniques for the classification of dyslexics and non - dyslexics. Method: Outliers were selected by specialist. Synthetic of data Generated. For each of five algorithms, characteristics were selected with exhaustive search. Each algorithm was executed with the selected characteristics and then their calibration curves were compared. Results: Logistic regression presented the best results with 99% accuracy and area under the ROC curve of 0.999, besides obtaining the best calibration curve. Conclusion: The use of synthetic data generation and feature selection were able to make all algorithms achieve excellent results in the classification of dyslexic and non - dyslexic. Logistic regression was selected as the best algorithm for dyslexic classification.


Objetivo: Este estudio tiene como objetivo aplicar la técnica de generación de datos sintéticos con la ayuda de técnicas de limpieza de datos para la clasificación de disléxicos y no disléxicos. Método: los valores atípicos fueron seleccionados por especialistas. Se realizó una generación sintética de datos. Para cada uno de los cinco algoritmos, se seleccionaron características con búsqueda exhaustiva. Cada algoritmo se ejecutó con las características seleccionadas y luego se compararon sus curvas de calibración. Resultados: La regresión logística se destacó como el mejor algoritmo, presentando el resultado del 99% de precisión y área bajo la curva ROC de 0.999, además de obtener la mejor curva de calibración. Conclusión: El uso de la generación de datos sintéticos y la selección de Estas características lograron que todos los algoritmos evaluados obtuvieron excelentes resultados en la clasificación de disléxicos y no disléxicos. Se seleccionó la regresión logística como el mejor algoritmo para la clasificación disléxica.


Asunto(s)
Humanos , Niño , Adolescente , Adulto , Adulto Joven , Algoritmos , Dislexia/clasificación , Aprendizaje Automático , Modelos Logísticos , Curva ROC , Sensibilidad y Especificidad , Exactitud de los Datos
2.
J. health inform ; 4(3): 95-99, jul.-set. 2012. ilus
Artículo en Portugués | LILACS | ID: lil-683544

RESUMEN

Objetivo: Identificar na literatura científica estudos sobre análise de sentimento por meio do tratamento computacional de opiniões, sentimentos e subjetividades em textos relacionados à saúde provenientes de mídias sociais. Métodos: Pesquisa de revisão narrativa de literatura com artigos publicados entre 2009-2011, nas bases de dados PubMed, ISI, ACM e IEEE. Resultados: Foram selecionados cinco artigos, segundo os critérios de inclusão. Há resultados positivos referentes à utilização da análise de sentimento como uma técnica auxiliar ou principal processo para diferentes temas. Embora o sentimento seja altamente variável e dependente do contexto, verificou-se que o método disponibiliza um conjunto de técnicas para extrair essa avaliação e lidar com os conteúdos subjetivos. Conclusão: Análise de sentimento tem sido pouco explorada em temas relacionados à saúde. Entretanto, investigações descrevem as potencialidades da aplicação destas técnicas na área da saúde como promissora para prover benefícios aos consumidores, serviços de saúde e governos.


Objective: Identify in the scientific literature studies on sentiment analysis using the computational analysis of opinions, sentiments and subjectivity in health texts presented in social media. Methods: A narrative literature review research of articles published between 2009-2011 in databases PubMed, ISI, ACM and IEEE. Results: Five articles were selected that met the inclusion criteria. All articles presented positive results regarding the use of sentiment analysis as a technical aid process for the different topics. Although the sentiment is highly variable and dependent on context, this method has a set of techniques to extract this assessment and dealing with subjectivity. Conclusions: Sentiment analysis has been underexplored in health issues. However investigations describe the potential of these techniques in healthcare as promising to provide benefits to consumers, health services and governments.


Objetivo: Identificar en la literatura científica, los estudios sobre análisis de los sentimientos con el tratamiento computacional de opiniones, sentimientos y la subjetividad en textos relacionados con la salud creada en los medios sociales. Métodos: La investigación consistió en la revisión narrativa de la literatura publicada entre 2009-2011, en  la bases de datos PubMed, ISI, ACM y el IEEE. Resultados: cinco artículos fueron seleccionados de acuerdo a los criterios de inclusión. El conjunto mostró resultados positivos con respecto a la utilización de análisis de los sentimientos como proceso principal o auxiliar de diversos temas. Aunque los sentimientos son muy variable y depende del contexto, se encontró que el método proporciona una serie de técnicas para la extracción de la evaluación y tratar con los contenidos subjetivos. Conclusión: El análisis de los sentimientos ha sido poco explorado en temas de salud. Sin embargo, las investigaciones demuestran que el potencial de estas técnicas en el campo de la salud como una promesa de proporcionar beneficios a los consumidores, servicios de salud y los gobiernos.


Asunto(s)
Emociones , Minería de Datos , Medios de Comunicación Sociales , Salud , Bases de Datos Bibliográficas
3.
J. health inform ; 4(1): 10-16, jan.-mar. 2012. tab, ilus
Artículo en Portugués | LILACS | ID: lil-621715

RESUMEN

Objetivo: Investigar aplicação de diferentes métodos de representação de textos por vetores de pesos com classificador bayesiano para classificação automática de conteúdos web de saúde em português. Métodos: Foi utilizado conjunto de 3.702 páginas web de saúde em português dividido em 19 categorias provenientes do Open Directory Project. Foram comparados desempenho de 4 métodos de representação de textos por vetores de pesos utilizados com o classificador Naive Bayes, medidos por revocação, precisão e F2, considerando da primeira à quinta posições dos rankings de relevância de categorias. Resultados: A representação dos textos por ocorrência dos termos utilizada com o classificador Naive Bayes (nb-to) atingiu 0,91 de revocação, precisão e F2 para a primeira posição do ranking de relevância de categorias; para a quinta posição os valores foram 0,98; 0,20 e 0,54, respectivamente. Estes valores colocam nb-to como o melhor classificador dos investigados para a base de dados utilizada, com diferença estatística entre este e todos os demais classificadores. Conclusão: Métodos de recuperação de informação baseados no Naive Bayes podem ser utilizados com sucesso para categorizar conteúdo web de saúde em idioma português, sendo que o classificador nb-to atingiu o melhor desempenho na tarefa de classificação.


Objective: To investigate the application of different methods of text representation by weighting vectors with a Bayesian classifier to automatically categorize health-related web pages in Brazilian Portuguese language. Methods: We used a set of 3,702 health-related web pages in Brazilian Portuguese language, separated in 19 categories, from Open Directory Project. We compared the effectiveness of 4 different methods of text representation by weighting vectors used with the Naive Bayes classifier, according to recall, precision and F2 measures and considering from the first to the fifth positions of category relevance ranking produced by the classifiers. Results: The text representation by counting the term occurrence with the Naive Bayes classifier (nb-to) reached 0.91 of recall, precision and F2 to the first position of the category relevance ranking, while to the fifth position the values were 0.98, 0.20, and 0.54, respectively. These results place nb-to as the best classifier to the database used in this work, with statistical differences between this classifier and all other. Conclusion: The information retrieval methods based on Naïve Bayes can be successfully used to categorize health-related web content in Brazilian Portuguese language and the nb-to classifier achieved the best performance at classification.


Objetivo: Investigar aplicación de diferentes métodos de representación de textos con un clasificador bayesiano para clasificación automática de contenidos web sobre salud en portugués de Brasil. Métodos: Se utilizó un conjunto de 3.702 páginas web sobre salud en portugués de Brasil, en 19 categorías y provenientes del Open Directory Project. Se comparó el desempeño de 4 métodos de representación de textos por vector de pesos utilizados con el clasificador Naive Bayes, medidos por recall, precisión y F2, considerándose de la primera a la quinta posición en los rankings de relevancia de categorías. Resultados: El clasificador Naive Bayes (nb-to) alcanzó 0,91 de recall, precisión y F2 para la primera posición en el ranking de relevancia de categorías, mientras que para la quinta posición, los valores fueron de 0,98, 0,20 y 0,54, respectivamente. Estos valores colocan el nb-to como el mejor clasificador para la base de datos utilizado, con diferencia estadística entre éste y todos los clasificadores testados. Conclusión: Los métodos de recuperación de información basados en el Naive Bayes pueden ser utilizados con éxito para categorizar contenidos web sobre salud en el idioma portugués de Brasil, pero el clasificador nb-to alcanzó el mejor desempeño al ejecutar la tarea de clasificación.


Asunto(s)
Clasificación , Información de Salud al Consumidor , Inteligencia Artificial , Internet , Teorema de Bayes
4.
J. health inform ; 3(3): 103-108, jul.-set. 2011. ilus, tab
Artículo en Portugués | LILACS | ID: lil-621845

RESUMEN

Objetivos: Neste trabalho foi comparada a percepção de usuários sobre a qualidade de conteúdos de websites da área da saúde e suas respectivas avaliações sobre a adequação destes websites aos critérios éticos propostos pela HON. Métodos: Uma interface web foi desenvolvida com tecnologias Web 2.0 para a avaliação dos critérios de adequação e da percepção de qualidade. Estudantes da área de informática em saúde foram selecionados para determinar a percepção de qualidade e adequação de conteúdos de 50 websites no domínio da saúde. Resultados: Participaram deste estudo 352 estudantes, que realizaram 2.277 avaliações. Cada website foi avaliado em média 36,83 vezes, e os websites avaliados tiveram uma média de adequação de 50,11% e a pontuação da percepção de qualidade foi de 49,06 em uma escala de 0 a 100. Diante dos 12 critérios propostos, apenas 3 apresentaram correlação estatisticamente significante se comparado com a percepção dos usuários sobre a qualidade do conteúdo de websites de saúde. Conclusão: Diante das análises foi possível identificar que os websites apresentaram poucos indícios de adequação (50,11) e na visão dos avaliadores mesmo com pouca adequação, os websites foram considerados bons.


Objectives: This study compared the user quality perception of health content regarding their assessments of the adequacy of the criteria for websites based on HON code recommendations. Methods: A web interface was developed with Web 2.0 technologies for this assessment of adequacy criteria. Students of health domain voted their quality perception and adequacy of content for 50 websites in the health domain, based on the criteria of adequacy defined by the HON code. Results: This study included 352 students and showed that the average adequacy assessed for the websites were 50.11 and 49.06 of perception, in a range from 0 to 100. Given the 12 criteria, only 3 showed a statistically significant correlation compared with the users? perception about the quality of health websites content. Conclusion: Against the analysis it was found that the websites showed little evidence of adequacy (50.11) and in view of the evaluators even in low adequacy, the websites were considered good.


Objetivos: Este estudio comparó la percepción de calidad de contenido del dominio de salud por usuarios com su evaluación de la adecuación dos sítios web con los criterios de recomendaciones basados en código HON. Métodos: Una interfaz web fue desarrollado con las tecnologías Web 2.0 para la evaluación de los criterios de adecuación. Estudiantes de área de salud determina su percepción de la calidad y de la adecuación de contenidos para 50 sitios web en el ámbito de la salud, con base en los criterios de adecuacion definidos por el código HON. Resultados: Este estudio incluyó 352 estudiantes que mostraron la media de la evaluación de adecuación para los sitios web de 50,11 y 49,06 de la percepción, en un rango de 0 a 100. Teniendo en cuenta los 12 criterios, sólo 3 mostraron una correlación estadísticamente significativa en comparación con la percepción de los usuarios sobre la calidad de los contenidos en sitios web en salud. Conclusión: Diante de los análisis se encontró que los sitios web mostraron pocas pruebas de adecuación (50,11) y, en opinión de los evaluadores, incluso en la aptitud baja, los sitios web se considera buenos.


Asunto(s)
Control de Calidad , Informática Médica , Internet , Estándares de Referencia , Percepción , Sistemas de Información
5.
J. health inform ; 3(2): 35-42, abr.-jun. 2011. tab, ilus
Artículo en Portugués | LILACS | ID: lil-621835

RESUMEN

Objective: There has been a considerable growth of the architecture and complexity of digital repositories in Health Informatics (HI). For information retrieval different information treatment and representation, such as automatic content classification, are required. The purpose of this study is to present the results of a procedure for automatic classification of scientific articles in HI using a specific thesaurus. Design: Statistical, vector, and artificial intelligence methods were applied to classify HI-related content. Articles extracted from the HI and Health journals and a specialized HI thesaurus were used for method application and result evaluation. Measurements: Statistical procedures and measures of accuracy, precision, recall, area under the ROC curve, and combination of precision and recall (F1 measure) were performed to measure the degree of similarity between terms of the specialized HI thesaurus and the selected articles. Results: The percentage of accuracy achieved was 0.87, F1 measure was 0.87 and the area under the ROC curve was 0.94. Conclusion: The results were positive, showing that the use of a specialized thesaurus on Health Informatics in conjunction with the methods used allows the classification of articles in the areas of Health Informatics and Health.


Objetivo: Há um crescimento considerável na arquitetura e complexidade dos repositórios digitais em Informática em Saúde (IS). A recuperação de informação neste cenário requer diferentes tratamentos e representações, como a classificação automática de conteúdo. O propósito deste estudo é apresentar os resultados de um processo automatizado para a classificação de artigos científicos de Informática em Saúde, utilizando um tesauro especializado neste domínio de conhecimento. Métodos: Métodos estatísticos, vetoriais e de inteligência artificial foram aplicados para classificar conteúdo relacionado à Informática em Saúde. Artigos científicos publicados em revistas de Saúde e Informática em Saúde, bem como um tesauro especializado em Informática em Saúde foram utilizados para a aplicação dos métodos e avaliação dos resultados.Avaliação: Métodos estatísticos e medidas de acurácia, precisão, revocação, área sob a curva ROC e F1-measure foram realizadas para medir o grau de similaridade entre os termos do tesauro especializado e os artigos selecionados. Resultados: O percentual de acurácia obtido foi de 0.87, F1-measure foi 0.87 e a área sob a curva ROC foi 0.94. Conclusão: Os resultados obtidos foram positivos, mostrando que a utilização de um tesauro especializado em Informática em Saúde em conjunto com os métodos aplicados possibilita a classificação de artigos nos domínios da Informática em Saúde e Saúde.


Objetivo: Hay un aumento considerable de la complejidad y la arquitectura de los repositorios digitales en Informática de la Salud (IS). La recuperación de la información en este escenario requiere diferentes tratamientos y actuaciones, como la clasificación automática de contenidos. El propósito de este estudio es presentar los resultados de un proceso automatizado para la clasificación de artículos científicos sobre Informática en Salud, utilizando un diccionario de sinónimos en la misma área de interés. Métodos: Los métodos estadísticos, el vector y la inteligencia artificial han sido aplicados para clasificar los contenidos relacionados con la Informática en Salud. Artículos publicados en revistas de Salud y de Informática en Salud, así como un diccionario especializado en Informática en Salud se utilizó para la aplicación de métodos y la evaluación de los resultados. Clasificación: Métodos estadísticos y medidas de la exactitud, precisión, cobertura, área bajo la curva ROC y F1 mediciones se realizaron para medir el grado de similitud entre los términos del diccionario de sinónimos y artículos especializados seleccionados. Resultados: El porcentaje de precisión obtenido fue de 0,87, F1-medida fue de 0,87 y el área bajo la curva ROC fue de 0,94. Conclusión: Los resultados fueron positivos, demostrando que el uso de un tesauro especializado en Informática en Salud en relación con los métodos que permite la clasificación de los artículos en las áreas de Informática en Salud y Salud.


Asunto(s)
Análisis de Datos , Informática Médica , Inteligencia Artificial , Publicaciones Periódicas como Asunto , Sistemas de Computación , Vocabulario Controlado
6.
J. health inform ; 2(3): 72-77, jul.-set. 2010. tab
Artículo en Portugués | LILACS | ID: lil-581014

RESUMEN

Introdução: Complicações associadas ao transplante de rim e imunossupressão podem ser prevenidas ou tratadas efetivamente quando são diagnosticadas em fases iniciais com o monitoramento pós-transplante. Objetivo: O objetivo deste estudo exploratório é comparar classificadores automáticos de padrões utilizando diferentes técnicas de inteligência artificial para prever eventos de nefrotoxicidade e rejeição celular aguda (RCA) em pacientes com até um ano do transplante renal. Métodos: Foram realizados testes estatísticos de incidência e regressão logística nas variáveis em relação à nefrotoxicidade e RCA. Foram utilizados diferentes classificadores (redes neurais, support vector machines (SVM), árvores de decisão, inferência bayesiana, e vizinhos mais próximos) com o objetivo de prever RCA e nefrotoxicidade. Os classificadores foram avaliados segundo o valor de sensibilidade, especificidade e área sob a curva ROC (AUC). Resultados: A incidência de RCA foi de 31,0% e de nefrotoxicidade de 26,9%. A técnica que apresentou o melhor valor de sensibilidade foi a SVM (algoritmo LIBSVM) com sensibilidade 0,87 (taxa de acerto 79,86%; especificidade 0,70; AUC 0,79). A técnica que apresentou o melhor valor de AUC para prever nefrotoxicidade ou RCA foi a de inferência bayesiana (algoritmo NaiveBayes) com AUC 0,80 (taxa de acerto 75,92%). Conclusão: Os resultados são animadores, com taxas de tentativa e erro condizentes com a determinação de rejeição celular aguda e nefrotoxicidade.


Background: Complications associated with kidney transplantation and immunosuppression can be prevented or treated effectively if diagnosed in early stages with monitoring post-transplant. Objective: The objective of this exploratory study is compare automatic classifiers using different techniques of artificial intelligenceáto predict events of nephrotoxicity and acute cellular rejection (ACR), with up to one year of renal transplantation Methods: The incidence and the statistical test logistic regression have been calculated in variables regarding nephrotoxicity and ACR.áWe used different classifiers (neural networks, support vector machines (SVM), decision trees, Bayesian inference, and closest neighbors) in order to provide ACR and nephrotoxicity. The classifiers were evaluated according to the value of sensitivity, specificity and area under ROC curve (AUC). Results: The prevalence of acute cellular rejection was 31.0% and 26.9% of nephrotoxicity. The technique had the highest sensitivity value prediction for the submission to the transplanted kidney biopsy was SVM (LIBSVM algorithm) with sensitivity rates of 0.87 (accuracy rate 79.86; specificity 0.70; AUC 0.79). The technique had the highest AUC for predicting nephrotoxicity and ACR was bayesian inference (NaiveBayes), with AUC rates of 0.8 (accuracy rate 75.92).Conclusion: The results are encouraging, with rates of accuracy and error consistent with the determination of acute cellular rejection and nephrotoxicity.


Asunto(s)
Humanos , Informática Médica , Inteligencia Artificial , Rechazo de Injerto , Trasplante de Riñón/efectos adversos , Sensibilidad y Especificidad
SELECCIÓN DE REFERENCIAS
DETALLE DE LA BÚSQUEDA