Your browser doesn't support javascript.
loading
Mostrar: 20 | 50 | 100
Resultados 1 - 19 de 19
Filtrar
Mais filtros










Filtros aplicados
Intervalo de ano de publicação
1.
Educ. med. super ; 37(2)jun. 2023. ilus, tab
Artigo em Espanhol | LILACS, CUMED | ID: biblio-1528540

RESUMO

Introducción: Los avances de unas tecnologías y la obsolescencia de otras marchan a una velocidad inimaginable, especialmente en este siglo xxi. En los últimos meses de 2022 y primeros meses de 2023 muchas incógnitas y controversias en diferentes campos han surgido en torno a los Chat GPS, una innovación que presenta desafíos nunca pensados para la sociedad actual, así como nuevos retos que impactarán de manera directa en la formación y/o desempeño de profesores, estudiantes, profesionales de la salud, juristas, políticos, informáticos, bibliotecarios, científicos y cualquier ciudadano. Objetivo: Identificar algunas características del chat GPT y su posible impacto en el educación. Posicionamiento de los autores: Se leen en las noticias y reportajes valoraciones de especialistas; se han realizado encuentros virtuales y exposiciones; y están disponibles diversos artículos y videos sobre este tema, algunos llegan a ser elaborados con el propio asistente. Por la novedad del tema, la reciente incorporación como herramienta para el desarrollo profesional, así como por el interés mostrado en los últimos días por la comunidad de profesores de las ciencias médicas cubanas, y considerando que esta herramienta es resultado del desarrollo de la inteligencia artificial, cabe preguntarse: ¿en qué consiste? y ¿cuáles son sus perspectivas? Conclusiones: Resulta oportuno acercarse al tema desde las posibilidades y los retos que abre a la educación y el aprendizaje, en particular a la docencia médica(AU)


Introduction: The advances of some technologies and the obsolescence of others are marching at an unimaginable speed, especially in this twenty-first century. In the last months of 2022 and first months of 2023, many questions and controversies in different fields have arisen with respect to Chat GPT, an innovation that presents challenges never thought of before for today's society, as well as new challenges that will have a direct impact on the training and/or performance of professors, students, health professionals, law practitioners, politicians, computer scientists, librarians, scientists and any citizen. Objective: To identify some technological characteristics of Chat GPT. Positioning of the authors: In news and reports, assessments by specialists are read; virtual meetings and presentations have been held; and several articles and videos on this topic are available, some of them even elaborated by the assistant itself. Due to the novelty of the subject, its recent assimilation as a tool for professional development, as well as the interest shown in recent days by the community of professors of Cuban medical sciences and considering that this tool is the result of the development of artificial intelligence, it is worth wondering what it consists in and what its prospects are. Conclusions: It is appropriate to approach the subject with a focus on the possibilities and challenges that it opens to education and learning (AU)


Assuntos
Humanos , Ensino/educação , Inteligência Artificial/história , Inteligência Artificial/tendências , Educação Médica/métodos , Educação Médica/tendências , Aprendizado de Máquina , Aprendizagem , Universidades , Processamento de Linguagem Natural , Comunicação não Verbal
2.
Artigo em Espanhol | LILACS, CUMED | ID: biblio-1408108

RESUMO

Este artículo tuvo como propósito caracterizar el texto libre disponible en una historia clínica electrónica de una institución orientada a la atención de pacientes en embarazo. La historia clínica electrónica, más que ser un repositorio de datos, se ha convertido en un sistema de soporte a la toma de decisiones clínicas. Sin embargo, debido al alto volumen de información y a que parte de la información clave de las historias clínicas electrónicas está en forma de texto libre, utilizar todo el potencial que ofrece la información de la historia clínica electrónica para mejorar la toma de decisiones clínicas requiere el apoyo de métodos de minería de texto y procesamiento de lenguaje natural. Particularmente, en el área de Ginecología y Obstetricia, la implementación de métodos del procesamiento de lenguaje natural podría ayudar a agilizar la identificación de factores asociados al riesgo materno. A pesar de esto, en la literatura no se registran trabajos que integren técnicas de procesamiento de lenguaje natural en las historias clínicas electrónicas asociadas al seguimiento materno en idioma español. En este trabajo se obtuvieron 659 789 tokens mediante los métodos de minería de texto, un diccionario con palabras únicas dado por 7 334 tokens y se estudiaron los n-grams más frecuentes. Se generó una caracterización con una arquitectura de red neuronal CBOW (continuos bag of words) para la incrustación de palabras. Utilizando algoritmos de clustering se obtuvo evidencia que indica que palabras cercanas en el espacio de incrustación de 300 dimensiones pueden llegar a representar asociaciones referentes a tipos de pacientes, o agrupar palabras similares, incluyendo palabras escritas con errores ortográficos. El corpus generado y los resultados encontrados sientan las bases para trabajos futuros en la detección de entidades (síntomas, signos, diagnósticos, tratamientos), la corrección de errores ortográficos y las relaciones semánticas entre palabras para generar resúmenes de historias clínicas o asistir el seguimiento de las maternas mediante la revisión automatizada de la historia clínica electrónica(AU)


The purpose of this article was to characterize the free text available in an electronic health record of an institution, directed at the care of patients in pregnancy. More than being a data repository, the electronic health record (HCE) has become a clinical decision support system (CDSS). However, due to the high volume of information, as some of the key information in EHR is in free text form, using the full potential that EHR information offers to improve clinical decision-making requires the support of methods of text mining and natural language processing (PLN). Particularly in the area of gynecology and obstetrics, the implementation of PLN methods could help speed up the identification of factors associated with maternal risk. Despite this, in the literature there are no papers that integrate PLN techniques in EHR associated with maternal follow-up in Spanish. Taking into account this knowledge gap, in this work a corpus was generated and characterized from the EHRs of a gynecology and obstetrics service characterized by treating high-risk maternal patients. PLN and text mining methods were implemented on the data, obtaining 659 789 tokens and a dictionary with unique words given by 7 334 tokens. The characterization of the data was developed from the identification of the most frequent words and n-grams and a vector representation of embedding words in a 300-dimensional space was performed using a CBOW (Continuous Bag of Words) neural network architecture. The embedding of words allowed to verify by means of Clustering algorithms, that the words associated to the same group can come to represent associations referring to types of patients, or group similar words, including words written with spelling errors. The corpus generated and the results found lay the foundations for future work in the detection of entities (symptoms, signs, diagnoses, treatments), correction of spelling errors and semantic relationships between words to generate summaries of medical records or assist the follow-up of mothers through the automated review of the electronic health record(AU)


Assuntos
Humanos , Feminino , Gravidez , Processamento de Linguagem Natural , Registros Eletrônicos de Saúde
3.
Rev. méd. Chile ; 147(10): 1229-1238, oct. 2019. tab, graf
Artigo em Espanhol | LILACS | ID: biblio-1058589

RESUMO

Background: Free-text imposes a challenge in health data analysis since the lack of structure makes the extraction and integration of information difficult, particularly in the case of massive data. An appropriate machine-interpretation of electronic health records in Chile can unleash knowledge contained in large volumes of clinical texts, expanding clinical management and national research capabilities. Aim: To illustrate the use of a weighted frequency algorithm to find keywords. This finding was carried out in the diagnostic suspicion field of the Chilean specialty consultation waiting list, for diseases not covered by the Chilean Explicit Health Guarantees plan. Material and Methods: The waiting lists for a first specialty consultation for the period 2008-2018 were obtained from 17 out of 29 Chilean health services, and total of 2,592,925 diagnostic suspicions were identified. A natural language processing technique called Term Frequency-Inverse Document Frequency was used for the retrieval of diagnostic suspicion keywords. Results: For each specialty, four key words with the highest weighted frequency were determined. Word clouds showing words weighted by their importance were created to obtain a visual representation. These are available at cimt.uchile.cl/lechile/. Conclusions: The algorithm allowed to summarize unstructured clinical free-text data, improving its usefulness and accessibility.


Assuntos
Humanos , Processamento de Linguagem Natural , Processamento Eletrônico de Dados/métodos , Registros Médicos , Armazenamento e Recuperação da Informação/métodos , Técnicas e Procedimentos Diagnósticos , Mineração de Dados/métodos , Encaminhamento e Consulta/estatística & dados numéricos , Fatores de Tempo , Computação em Informática Médica , Chile , Reprodutibilidade dos Testes , Medicina
4.
J. health inform ; 8(supl.I): 373-380, 2016. tab
Artigo em Inglês | LILACS | ID: biblio-906292

RESUMO

Ontologias terminológicas padronizadas e corretamente traduzidas são essenciais para o desenvolvimento de aplicações de processamento de linguagem natural na área da saúde. Para o desenvolvimento de uma aplicação de busca semântica em narrativas clínicas em português se fez necessária a utilização dos termos clínicos da Unified Medical Language System (UMLS). OBJETIVOS: Traduzir termos da UMLS em Português Europeu para Português Brasileiro. MÉTODOS: Foi desenvolvido um algoritmo de tradução semi-automática baseada em regras de substituição de texto. RESULTADOS: Após execução do algoritmo e avaliação por parte de especialistas, o algoritmo deixou de traduzir corretamente apenas 0.1% dos termos da base de testes. CONCLUSÃO: A utilização do método proposto se mostrou efetivo na tradução dos termos da UMLS e pode auxiliar em posteriores adaptações de listagens em Português Europeu para Português Brasileiro.


Correctly translated and standardized clinical ontologies are essential for development of Natural LanguageProcessing application for the medical domain. To develop an ontology-driven semantic search application for Portuguese clinical notes we needed to implement the Unified Medical Language System (UMLS) ontologies, specifically for Brazilian Portuguese. OBJECTIVES: To translate UMLS terms from European Portuguese to Brazilian Portuguese. METHODS: To develop a semi-automatic translation algorithm based on string replacement rules. RESULTS: Following the experiments and specialists' evaluation the algorithm mis-translated only 0.1% of terms in our test set. CONCLUSION: The proposed method proved to be effective for UMLS clinical terms translation and can be useful for posterior adaption ofa set of clinical terms from European Portuguese to Brazilian Portuguese.


Assuntos
Humanos , Tradução , Processamento de Linguagem Natural , Congressos como Assunto
5.
J. health inform ; 8(supl.I): 405-416, 2016. ilus, tab, graf
Artigo em Inglês | LILACS | ID: biblio-906301

RESUMO

OBJECTIVE: To conduct a systematic review of the use in sentiment analysis on social media to identify or assess patient's treatment adherence, and evaluate its application, benefits and future research. METHODS: A systematic review of the literature was carried out by identifying published articles on the main databases of computing and healthcare. Search strings were built by combining keywords related to adherence, social media, data analysis and sentiment analysis. RESULTS: From a total of 709 articles screened, it wasn't possible to identify any study related to the objective. However, we could select 15 which presented some similarity degree and yet very heterogeneous, they were analyzed accordingto six dimensions: Adherence, Data Source, Psychology, Methods, Tools and Sentiment Analysis. CONCLUSIONS: A strong agreement and trend can be observed on the potential use and importance of automatic techniques to collectand analyzed online patient data, especially related to assessment of adherence with sentiment analysis.


Assuntos
Humanos , Processamento de Linguagem Natural , Cooperação do Paciente , Congressos como Assunto
6.
J. health inform ; 8(supl.I): 1031-1040, 2016. ilus
Artigo em Português | LILACS | ID: biblio-906773

RESUMO

A utilização de técnicas de Processamento de Linguagem Natural (PLN) em textos clínicos é amplamente dependente de grandes quantidades de dados textuais anotados, denominados corpus ou padrão ouro. Sendo essenciais para a modelagem da linguagem durante a fase de treinamento de diversos algoritmos de PLN. Porém, para a criação de um padrão ouro é necessário um extenso e custoso trabalho manual de anotação, que demanda um grande esforço de especialistas. OBJETIVO: Realizar uma revisão da literatura, visando o estudo de metodologias e ferramentas utilizadas em procedimentos de anotação de textos. MÉTODO: Levantamento em bases científicas referentes à elaboração de corpus morfológicos, sintáticos e morfossintáticos foi realizado, analisando 32 estudos de anotação e mais 12 ferramentas. RESULTADOS: Foram levantados os principais aspectos nos processos de anotação, bem como realizada uma avaliação dentre critérios pré-definidos de cada das ferramentas de suporte encontradas.


The use of natural language processing techniques (NLP) in clinical texts is dependent on large amounts of annotated text data, called corpus or gold standard. Are essential for the modelling language during the training phase of NLP algorithms. However, for the creation of a gold standard is required extensive and costly manual annotation task, that demands a great deal of experts. OBJECTIVES: To review the literature to identify methodologies and tools applied to text annotation. METHODS: Scientifics databases search regarding the development of morphological, syntactic and morphosyntactic corpus was performed by analyzing 32 annotation studies and 12 tools. RESULTS: Main aspects of the annotation process description, as well as an assessment from pre-defined criteria for each one of the annotation tools identified.


Assuntos
Humanos , Processamento de Linguagem Natural , Software , Armazenamento e Recuperação da Informação , Congressos como Assunto
7.
Dement. neuropsychol ; 8(3)set. 14.
Artigo em Inglês | LILACS | ID: lil-724274

RESUMO

Discourse production is an important aspect in the evaluation of brain-injured individuals. We believe that studies comparing the performance of brain-injured subjects with that of healthy controls must use groups with compatible education. A pioneering application of machine learning methods using Brazilian Portuguese for clinical purposes is described, highlighting education as an important variable in the Brazilian scenario. Objective: The aims were to describe how to: (i) develop machine learning classifiers using features generated by natural language processing tools to distinguish descriptions produced by healthy individuals into classes based on their years of education; and (ii) automatically identify the features that best distinguish the groups. Methods: The approach proposed here extracts linguistic features automatically from the written descriptions with the aid of two Natural Language Processing tools: Coh-Metrix-Port and AIC. It also includes nine task-specific features (three new ones, two extracted manually, besides description time; type of scene described ? simple or complex; presentation order ? which type of picture was described first; and age). In this study, the descriptions by 144 of the subjects studied in Toledo18 were used,which included 200 healthy Brazilians of both genders. Results and Conclusion: A Support Vector Machine (SVM) with a radial basis function (RBF) kernel is the most recommended approach for the binary classification of our data, classifying three of the four initial classes. CfsSubsetEval (CFS) is a strong candidate to replace manual feature selection methods.


Um importante aspecto na avaliação de indivíduos com lesão cerebral é a produção de discurso. Acreditamos que estudos que comparam o desempenho de lesados com grupos de controles sadios devem utilizar grupos com escolaridade compatíveis. Nós apresentamos uma abordagem pioneira ao utilizar métodos de aprendizado de máquina com propósitos clínicos, para o Português do Brasil, destacando a escolaridade como variável de importância no cenário brasileiro. Objetivo: Nosso objetivo é descrever como: (i) desenvolver classificadores via aprendizado de máquina, usando features criadas por ferramentas de processamento de línguas naturais, para diferenciar descrições produzidas por indivíduos sadios em classes de anos de escolaridade e (ii) identificar automaticamente as features que melhor distinguem esses grupos. Métodos: A abordagem proposta neste estudo extrai características linguísticas automaticamente a partir das descrições escritas com a ajuda de duas ferramentas de Processamento de Linguagem Natural: Coh-Metrix-Port e AIC. Ela inclui ainda nove features dedicadas à tarefa (três novas, duas extraídas manualmente, além de tempo de descrição; tipo de cena descrita - simples ou complexa; ordem de apresentação das figuras e idade). Neste estudo, foram utilizadas as descrições de 144 indivíduos estudados em Toledo18, que incluiu 200 brasileiros, sadios, de ambos sexos. Resultados e Conclusão: SMV com kernel RBF é o mais recomendado para a classificação binária dos nossos dados, classificando três das quatro classes iniciais. O método de seleção das features CfsSubsetEval (CSF) é um forte candidato para substituir métodos de seleção manual.


Assuntos
Humanos , Processamento de Linguagem Natural , Adulto , Escolaridade , Grupos Etários
8.
Rev. colomb. rehabil ; 10(1): 94-105, 2011. ilus, graf
Artigo em Espanhol | LILACS, COLNAL | ID: biblio-909073

RESUMO

El objetivo de este artículo fue identificar las tendencias investigativas mundiales de los estu-dios de la Lengua de Señas entre el año 2000 y el 2011 (primer bimestre) a partir de la revisión de 20 revistas indexadas que se encuentran en las bases de datos electrónicas Scielo, Pubmed, y PROQUEST. Los artículos están escritos en diferentes lenguas como Español, Inglés y Por-tugués. Para este propósito cinco variables fueron registradas: a) el nombre de las revistas; b) la producción investigativa por año, c) el porcentaje de autores por artículo, d) los autores más destacados, y e) los temas trabajados. Los resultados muestran 196 artículos de investiga-ción en términos de frecuencia y porcentajes. También hay siete temas: el 25,7% de estos artí-culos se refiere a las características de la lengua de señas; el 24,5% estudia la lengua de señas y la educación; el 22,7% se centra en las variaciones sociolingüísticas de la Lengua de Señas; el 7% se refiere a la comunicación bimodal; el 6% se centra en el proceso lecto-escrito; el 4% estudia el procesamiento psicolingüístico, y el 3% revisa las bases neurológicas de la lengua de señas. Teniendo en cuenta lo anterior, se determinan los siete temas expuestos como las tendencias investigativas en cuanto a la Lengua de Señas. Al finalizar hay algunas propuestas de investigación que pueden ser desarrolladas con el fin de apoyar la comprensión de esta lengua.


The objective of this article was to identify the research world tendencies in Sign Langua-ge studies between 2000 and 2011 (first two months) from the review of 20 indexed journals which are on electronic databases Scielo, Pubmed, and PROQUEST. The articles are written in different languages such as Spanish, English and Portuguese. For this purpose five varia-bles were registered: a) journals' name; b) research production by year; c) authors' percentage by article; d) authors and higher productivity; and e) worked themes. The results show 196 research articles that were analyzed in terms of frequency and percentage. Also there are seven themes: 25,7% of these articles refers to the sign language characteristics; 24,5% studies the sign language and education; 22,7% is focused in sign language and its socio-cultural variables; 7% refers to bimodal communication; 6% is focused in reading-writing process; 4% studies the psycholinguistics processing; and 3% reviews the sign language ́s neurological bases. Given the above, the seven themes were identified as research tendency about Sing Language. At the end, there are some research purposes that can be developed in order to support the understanding of this language.


Assuntos
Humanos , Idioma , Processamento de Linguagem Natural , Pesquisa , Fonoaudiologia
9.
Subj. procesos cogn ; 14(2): 32-40, dic. 2010.
Artigo em Espanhol | LILACS | ID: lil-576362

RESUMO

El trabajo comienza describiendo los resultados obtenidos en una investigación previa donde a partir del discurso de pacientes con psoriasis y asma se detectaron los deseos y defensas dominantes que aparecían en sus relatos y actos del habla. Estos resultados se estudiaron en relación a cada afección en particular para finalmente investigar qué vinculación guardan con la respuesta desigual que presentaban los pacientes respecto a la medicación indicada para sus respectivos tratamientos.


The study describes, in the first place, the results obtained in a previous research in which the discourse of patients with psoriasis and asthma leads to detect the main wishes and defenses that surfaced in their narrations and speech acts. These results were studied in relation to each particular ailment so as to finally research the link to the dissimilar response the patients presented regarding the indicated medication fortheir respective treatments.


Assuntos
Doença Crônica , Fala , Idioma , Mecanismos de Defesa , Processamento de Linguagem Natural , Psicologia
10.
Subj. procesos cogn ; 14(2): 50-69, dic. 2010. tab, ilus
Artigo em Espanhol | LILACS | ID: lil-576375

RESUMO

En este trabajo se plantea la necesidad de desarrollar lo que se denominan ontologías como forma de procesar el lenguaje natural y como herramientas para la exploración y análisis de las verbalizaciones obtenidas mediante entrevistas en profundidad y grupos focales. Cada ontología operará en el contexto de un proceso abductivo, lo cual permitiría el enriquecimiento de la ontología inicial. Es decir, no se trata de la construcción de una ontología para su formalización informática, sino más bien porque se considera que el uso del concepto de “ontología” está dado por su pertinencia en la representación de un cuerpo de conocimientos seleccionado de un determinado dominio de la realidad que resulta de interés. La hipótesis del texto es: el análisis de las verbalizaciones de los sujetos en un proceso de investigación debería seguir el método abductivo que se inicia con la construcción de una ontología-E y en seguida se desarrolla un proceso recursivo de refinamiento y reconfiguraciones de lo que Samara (2003) denomina pre-concepciones modelizantes.


This study looks into the need to develop what is known as ontologies as a way to process natural language and as a tool for the exploration and analysis of the verbalizations obtained through interviews in depth and focus groups. Each ontology operates in the context of an abductive process, which allows the expansion of the initial ontology. The main idea isn’t the construction of ontology for its computerized formalization butrather the compliance with the concept of ontology according to which its use is linked to its pertinence in the representation of a body of knowledge selected from a specific domain of reality which is of interest. The hypothesis of the text is: the analysis of the verbalizations in a research process should follow the abductive method that begins with the construction of an E-ontology and immediately develops into a recursive process of refinement and reconfigurations of what Samaja (2003) calls modeling preconceptions.


Assuntos
Automação , Fala , Idioma , Processamento de Linguagem Natural , Psicologia
11.
Subj. procesos cogn ; 14(2): 79-88, dic. 2010. ilus
Artigo em Espanhol | LILACS | ID: lil-576376

RESUMO

A medida que las tecnologías de procesamiento del habla continúan mejorando, gradualmente nos acercamos al viejo sueño de crear una máquina que hable. Los actuales sistemas interactivos de diálogo hablado permiten que los usuarios realicen tareas simples, tales como transacciones bancarias y reservas en hoteles, mediante la interacción verbal. Pese a ser relativamente exitosas, estas conversaciones humano-computadora aún tienen un largo camino para recorrer en cuanto a su naturalidad: estos sistemas tienden a ser descriptos por los usuarios como “extraños” o incluso “intimidantes”. Entre las razones principales para esta falta de naturalidad, figura el modelado imperfecto de la variación prosódica, o cómo algunas propiedades del habla (tales como la entonación, la intensidad o el ritmo) cambian en las expresiones verbales. Los sistemas actuales todavía son incapaces de manejar estas características en forma correcta, tanto al entender el habla del usuario como para producir respuestas sintetizadas. La variación prosódica es extremadamente compleja en el habla espontánea, y se sabe que la afectan varios niveles de representación lingüística (léxica, sintáctica, semántica y pragmática). En el presente artículo, enfocamos nuestra atención en una dimensión particular de variación prosódica, conocida como “mimetización entre interlocutores”, que consiste en la alineación automática de características del habla entre los participantes de un diálogo. Tras un repaso general de la literatura de estos temas, describimos un proyecto de investigación en curso que busca modelar la mimetización prosódica en diálogos.


As speech processing technologies continue to improve, the old dream of creating a machine that talks gradually becomes real. The present interactive speech systems enable users to perform simple tasks such as banking transactions and hotel reservations,through verbal interaction. Despite being relatively successful, these human-computer conversations still have a long way to go regarding their naturalness: these systems tend to be described as “odd” or even “intimidating” by users. Among the main reasons for this lack of naturalness, is the flawed modeling of prosodic variation or the way some properties of speech (such as intonation, intensity and rhythm) change in verbalexpressions. Current systems are still unable to handle these features correctly, both to understand the speech of the user as to produce synthesized responses. Prosodic variation is extremely complex in spontaneous speech, and it is well known that it´saffected by several levels of linguistic representation (lexical, syntactic, semantic and pragmatic). The present article focuses on a specific dimension of prosodic variation, known as “mimetization between interlocutors”, which consists in the automatic alignment of speech features between the participants of a dialogue. After a general overview of the literature on these subjects, a research project in process that seeks to model the prosodic mimetization in dialogues is described.


Assuntos
Fala , Idioma , Processamento de Linguagem Natural , Psicologia
12.
Subj. procesos cogn ; 14(2): 247-259, dic. 2010. tab, ilus
Artigo em Espanhol | LILACS | ID: lil-576377

RESUMO

Describimos la aplicación de la tecnología de procesamiento de lenguaje natural (NLP) al análisis del lenguaje subjetivo. En particular, nos concentramos en la problemática de la clasificación de opinión de material textual extraído de fuentes de datos relacionados con negocios. Estudiamos la derivación de los valores de opiniones de palabras a partir del recurso léxico SentiWordNet y utilizamos estos valores para la interpretación de texto con el objetivo de obtener la valoración de una opinión a partir de sus palabras y frases. Utilizamos características de las palabras para inducir un clasificador basado en el uso de Máquinas de Vectores de Soporte que alcanzan resultados acordes con el estado del arte. También mostramos experimentos preliminares en los que el uso de resúmenes de opiniones ofrece ventaja competitiva para el problema de clasificación respecto del uso de documentos completos cuando los documentos son extensos y contienen material tanto subjetivo como no-subjetivo.


We describe the application of natural language processing (NLP) technology to the analysis of subjective language. In particular we concentrate on the problem of opinion classification of textual material extracted from business-related data-sources. We study the derivation of sentiment values for words from the SentiWordNet lexicalresource and use them for text interpretation to produce word, sentence, and text based sentiment features for opinion classification. We use word-based and sentiment basedfeatures to induce a classifier based on the use of Support Vector Machinesachieving state of the art results. We also show preliminary experiments where the use of summaries before opinion classification provides competitive advantage over the use of full documents when the documents are long and contain both subjective andnon-subjective material.


Assuntos
Idioma , Processamento de Linguagem Natural , Software , Psicologia
13.
Subj. procesos cogn ; 14(2): 113-126, dic. 2010. tab
Artigo em Espanhol | LILACS | ID: lil-576378

RESUMO

Este artículo presenta un estudio preliminar de los fenómenos presentes en la Web 2.0, concretamente en blogs y cómo se reflejan en los correspondientes resúmenes generados. El principal objetivo es cuantificar en qué medida dichos fenómenos están presentes tanto en los blogs como en los resúmenes. La presencia de estos fenómenos en los resúmenes tiene como consecuencia directa la disminución de la calidad de estos, en criterios como la corrección gramatical o la coherencia de los resúmenes. Los resultados preliminares obtenidos muestran que los nuevos géneros textuales derivados de la Web 2.0 contienen un alto número de rasgos lingüísticos típicos que es necesario tratar con métodos y herramientas adecuadas para que dichos rasgos no se propaguen a otras tareas del Procesamiento del Lenguaje Natural, en concreto, en este estudio, a los resúmenes de textos. Además, se proponen posibles soluciones para abordar el problema, con la finalidad de ayudar a que la calidad de los resúmenes no se vea afectada debido a la presencia de estos fenómenos.


This article presents a preliminary study of the phenomena present in Web 2.0,specifically in blogs and how they are reflected in the corresponding generatedsummaries. The main objective is to provide a measure of the occurrence of these phenomena in both blogs and summaries. The presence of these phenomena in the summaries has as a direct consequence in their diminishing quality in terms of grammar accuracy or coherence. Preliminary results obtained show that the new text genres derived from Web 2.0 contain a great quantity of linguistic typical traits which need to be tackled with appropriate tools for these traits not to propagate to other tasks of Natural Language Processing, in particular, in this study, to the textsummaries. In addition, possible solutions to address the problem are proposed, in order that the quality of the summaries might remain unaffected by the occurrence of these phenomena.


Assuntos
Blogging , Ciência da Informação , Internet , Processamento de Linguagem Natural , Psicologia , Resumos
14.
Subj. procesos cogn ; 14(2): 89-98, dic. 2010.
Artigo em Espanhol | LILACS | ID: lil-576380

RESUMO

En este trabajo se presentan dos sistemas de análisis acústico del habla con aplicaciones a la descripción de segmentos de discurso espontáneo y un sistema de reconocimiento automático de habla espontánea orientado a la detección de palabras. El primer sistema de análisis presenta detalladamente todos los rasgos instintivos segmentales y suprasegmentales del habla en forma simultánea asociados a la frecuencia, energía y duración. El segundo presenta automáticamente los parámetros físicos asociados a la entonación en una superficie que cuantifica el campo vocal del hablante y mide el rango vocal y dinámico en el discurso hablado. Se presenta un histograma de la frecuencia fundamental útil para comparar las tendencias entonativas de sesión a sesión. Finalmente se ha desarrollado una herramienta de reconocimiento con modelos acústicos para el español hablado en la Argentina. El mismo transcribe los sonidos grabados a texto y posibilita la aplicación de otras herramientas para el procesamiento de lenguaje natural.


In this paper two acoustic speech analysis systems are presented with applications to the description of spontaneous speech segments and a system of automatic spontaneousspeech recognition oriented to word detection. The first analysis system presents in detail all segment and supra-segment instinct speech features simultaneously and associated frequency, power and duration. The second automatically displays thephysical parameters associated to intonation in a surface that quantifies the vocal field of the speaker and measures the vocal and dynamic range in spoken discourse. A histogram of the fundamental frequency proves useful to compare intonation tendencies from session to session. Finally a recognition tool with acoustic models was developed for Spanish spoken in Argentina. It transcribes the recorded text sounds and enables the application of other tools for natural language processing.


Assuntos
Fala , Processamento de Linguagem Natural , Psicologia
15.
Rev. colomb. reumatol ; 14(4): 287-296, dic. 2007. ilus
Artigo em Espanhol | LILACS | ID: lil-636731

RESUMO

Introducción: los sistemas biológicos han sido objeto de muchas observaciones y recientemente se han convertido en modelos para ser emulados en diversos ambientes y ofrecer soluciones a problemas de la vida real. El sistema inmune es uno de los más representativos y en la actualidad constituye motivo de inspiración para la implementa-ción de sistemas computacionales que respondan a diversas tareas, constituyendo los Sistemas Inmunes Artificiales. Objetivo: este estudio busca desarrollar mecanismos computacionales inspirados en la inmunología para el diagnóstico de enfermedades reumatológicas que contribuyan en la educación y la toma de decisiones diagnósticas en reuma-tología. Se pretende obtener una herramienta computacional que, partiendo de un conjunto de historias clínicas como datos de entrenamiento, obtenga una efectividad en el diagnóstico comparable a los sistemas de clasificación de documentos actuales. El sistema está inspirado en la interacción entre los tejidos y los linfocitos B, y se apoya en conceptos de la teoría de la información para extraer relaciones entre términos. Los linfocitos B tendrán la función de discriminar la enfermedad reumatológica de un paciente con base en su historia clínica. Materiales y métodos: se utilizó un conjunto de datos compuesto por 54 historias clínicas de 54 pacientes en reumatología, entre los cuales 21 padecían artritis reumatoide, y el resto padecían otras enfermedades reumatológicas. El conjunto de datos se dividió en dos grupos: pacientes con artritis reumatoide y pacientes sin artritis reumatoide. Se hizo un procesamiento manual de las historias clínicas para eliminar toda la información que no fuera relevante para el sistema en la tarea de diagnóstico. La efectividad del sistema fue comparada frente a otros tres algoritmos de clasificación de texto ampliamente utilizados en tareas de clasificación de documentos (ID3, BayesNet y PsoSVM). Resultados: el sistema obtuvo resultados de efectividad prometedores en comparación con los demás algoritmos, con un promedio de 87,65% de efectividad en el diagnóstico. Sin embargo, debido a la limitación de datos, cabe la posibilidad de sesgo en los resultados. Se observó, como se había previsto, que los anticuerpos que representan la información en varios casos son redundantes. Adicionalmente, la información que representan no corresponde necesariamente a conocimiento médico, sino a reglas de clasificación de texto. Conclusiones: la teoría de la información, ayudada por la teoría del sistema inmunológico adapta-tivo y un mecanismo de señalización, muestra tener un potencial grande para la clasificación de historias clínicas. Debido a la posibilidad de sesgo observada en los resultados, será necesario realizar experimentos adicionales sobre un conjunto de historias clínicas más numeroso y más heterogéneo. Aunque entre los experimentos no se obtuvo anticuerpos que representaran claramente los conceptos, de tal manera que puedan ayudar a un profesional médico en el aprendizaje para la toma de decisiones, el trabajo a seguir consiste en adaptar técnicas de procesamiento de lenguaje natural (i.e., sintaxis y semántica), para así llegar a un sistema de obtención de conocimiento en lugar de un sistema de obtención de reglas de clasificación de texto.


Introduction: the biological systems have been observed and analyzed carefully and they have transformed into models to be emulated in many types of scenery and these offer solutions to problems of the real life, more recently. The immune system is one of the most representatives and at the moment is used for implementation of computational systems to respond to many tasks, constituting the Artificial Immune Systems. Objective: in this work a computational method inspired by immunology for diagnosis of rheuma-tologic diseases is developed. The goal is to obtain a computational tool that, given a group of clinical histories as training data, performs rheumatologic diagnosis comparable to the current systems used in document classification. The proposed tool is expected to contribute in education and decision making in rheumatologic diagnosis. The proposed system is inspired by the interaction between tissues and B lymphocytes, and it relies on concepts of information theory to extract relationships among terms. The B lymphocytes will have the function of discriminating a patient’s rheumatic diseases based on its clinical history. Materials and methods: a dataset consisting of 54 medical records from 54 patients with rheumatologic diseases was used; 21 patients suffered rheumatoid arthritis, and the rest suffered other rheumatologic diseases. The dataset was divided into two groups: patients with and without rheumatoid arthritis. A manual process on the clinical histories was performed to eliminate the irrelevant information in the diagnosis task. The effectiveness of the system was compared to other three text classification algorithms widely used in document classification tasks, namely, ID3, BayesNet and PsoSVM. Results: the proposed system obtained promising results in comparison with other algorithms, with an average of 87,65% effectiveness in the diagnosis. However, due to the limitation of the data, there is a possibility that the results are biased. It was observed, as expected that the antibodies that represent the information in several cases are redundant. Additionally, the information that it represents not necessarily corresponds to medical knowledge, but to rules of text classification. Conclusions: information theory in conjunction with an adaptive immune system and a signaling mechanism showed great potential for the classi-fication of medical records. Due to the possibility of a bias in the results, it will be necessary to carry out additional experiments on a larger and more heterogeneous group of medical records. From the experiments, antibodies that clearly represented concepts explaining rheumatoid arthritis were not obtained, which could help medical trainees in the learning process and medical doctors in decision making. Therefore, in future work, the task to continue consists on adapting natural language processing methods (i.e., syntax and semantics) to obtain a knowledge extraction system instead of a set of rules for text classification.


Assuntos
Humanos , Simulação por Computador , Diagnóstico , Sistema Imunitário , Reumatologia , Processamento de Linguagem Natural , Métodos
16.
São Paulo; s.n; 2007. [111] p. ilus, tab.
Tese em Português | LILACS | ID: lil-522676

RESUMO

O registro eletrônico do paciente (REP) está sendo gradativamente implantado no meio médico hospitalar. Grande parte das informações essenciais do REP está armazenada na forma de texto narrativo livre, dificultando operações de procura, análise e comparação de dados. O processamento de linguagem natural (PLN) refere-se a um conjunto de técnicas computacionais, cujo objetivo é a análise de texto através de conhecimentos léxicos, gramaticais e semânticos. O presente projeto propõe a criação de uma ferramenta computacional de investigação clínicoepidemiológica aplicada a textos narrativos médicos. Como metodologia propomos a utilização do processador de linguagem natural especializado em medicina MEDLEE desenvolvido para textos em Inglês. Para que seu uso seja possível textos médicos em Português são traduzidos ao Inglês automaticamente. A tradução automatizada (TA) é realizada utilizando o aplicativo baseado em regras SYSTRAN especialmente configurado para processar textos médicos através da incorporação de terminologias especializadas. O resultado desta seqüência de TA e PLN são informações conceituais que serão investigadas à procura de achados clínicos pré-definidos, através de inferência lógica sobre uma ontologia. O objetivo experimental desta tese foi conduzir um estudo de recuperação de informações em um conjunto de 12.869 relatórios de radiografias torácicas à procura de vinte e dois achados clínicos e radiológicas. A sensibilidade e especificidade médias obtidas em comparação com referência formada pela opinião de três médicos radiologistas foram de 0,91 e 0,99 respectivamente. Os resultados obtidos indicam a viabilidade da procura de achados clínicos em relatórios de radiografias torácicas através desta metodologia de acoplamento da TA e PLN. Conseqüentemente em trabalhos futuros poderá ser ampliado o número de achados investigados, estendida a metodologia para textos de outras modalidades, bem como de outros idiomas.


The Electronic Medical Record (EMR) is gradually replacing paper storage on clinical care settings. Most of essential information contained on EMR is stored as free narrative text, imposing several difficulties on automated data extraction and retrieval. Natural language processing (NLP) refers to computational linguistics tools, whose main objective is text analysis using lexical, grammatical and semantic knowledge. This project describes the creation of a computational tool for clinical and epidemiologic queries on narrative medical texts. The proposed methodology uses the specialized natural language processor MEDLEE developed for English language. To use this processor on Portuguese medical texts chest x-ray reports were Machine Translated into English. The machine translation (MT) was performed by SYSTRAN software, a rule based system customized with a specialized lexicon developed for this project. The result of serial coupling of MT an NLP is tagged text which needs further investigation for extracting clinical findings, whish was done by logical inference upon an ontolgy. The experimental objective of this thesis project was to investigate twenty-two clinical and radiological findings on 12.869 chest x-rays reports. Estimated sensitivity and specificity were 0.91 and 0.99 respectively. The gold standard reference was formed by the opinion of three radiologists. The obtained results indicate the viability of extracting clinical findings from chest x-ray reports using the proposed methodology through coupling MT and NLP. Consequently on future works the number of investigated conditions could be expanded. It is also possible to use this methodology on other medical texts, and on texts of other languages.


Assuntos
Processamento Eletrônico de Dados , Armazenamento e Recuperação da Informação , Sistemas de Informação , Sistemas Computadorizados de Registros Médicos , Processamento de Linguagem Natural , Radiografia Torácica , Radiologia
17.
Rosario; s.n; 2002. 112 p. tab, graf.
Tese em Espanhol | LILACS | ID: lil-356514

RESUMO

La presente investigación es un estudio de tipo descriptivo, en el que se pretende investigar qué tipo de paréntesis se presenta con mayor frecuencia y qué funciones cumplen en las paráfrasis que realizan niños de cinco años de edad, en ocasión de narrar un cuento escuchado previamente. La investigación se llevó a cabo con los alumnos concurrentes a los jardines Estrellita de Belén y Homerito de la ciudad de Cañada de Gómez, provincia de Santa Fe. Los registros fueron obtenidos en el mes de agosto del año 2002, utilizándose como técnica la escucha y posterior paráfrasis del cuento "El Garbanzo Peligroso" de Laura Devetach. Se empleó el grabador para hacerle escuchar el cuento a cada niño y para registrar sus producciones orales. El corpus sobre el que se llevó a cabo el análisis de los paréntesis y sus funciones está constituido por la versión monologal que cada niño realizó del cuento. Se comprobó que en las paráfrasis que realizan los niños de cinco años de edad se presentan con mayor frecuencia los paréntesis no escindidos sintagmáticamente con función evaluativa, complementativa, reformulativa y complementativa-evaluativa simultáneamente. Los datos obtenidos demuestran la importancia que reviste para la clínica fonoaudiológica tener conocimiento acerca de la presencia regular de estas construcciones parentéticas en los enunciados orales, ya que su desconocimiento pude llevar al profesional a realizar en el quehacer clínico una apreciación negativa de aquellos fenómenos lingüísticos que, aunque lleven la marca de la incompletud, o de la fragmentariedad, dan cuenta del normal y real funcionamiento del sujeto en el lenguaje.


Assuntos
Humanos , Criança , Linguagem Infantil , Idioma , Processamento de Linguagem Natural
18.
Rev. méd. Hosp. Gen. Méx ; 56(2): 58-65, abr.-jun. 1993. tab
Artigo em Espanhol | LILACS | ID: lil-134976

RESUMO

Se simplificó el lenguaje del Inventario Multifásico de la Personalidad (MMPI), versión original traducido al español, para hacerlo comprensible a la población de escolaridad limitada de nuestro país, utilizando como muestra 280 sujetos normales de uno y otro sexos, de edad entre 18 y 60 años, con escolaridad máxima de sexto grado de primaria. Para la validación de esta muestra se incluyó una segunda población de 201 sujetos masculinos normales de escolaridad equivalente. En esta validación, se utilizó el diseño de una sola muestra Método Test-Retest. Para el Test se utilizó la versión original de MMPI y para el Retest la versión del lenguaje simplificado de la misma prueba. La significancia de los cambios de respuesta de cada uno de los 383 reactivos de la prueba entre el Test y el Retest se analizó mediante la prueba de Mc Nemar. La correlación Test-Retest de cada una de las 13 escalas clínicas del MMPI se analizó mediante el coeficiente de correlación Producto-Momento de Pearson. En nueve de las 13 escalas de la prueba que contenían el mayor número de reactivos modificados, se encontraron diferencias significativas. De los 383 reactivos, 171 fueron modificados o simplificados y, de éstos, 58 presentaron cambios significativos en al respuesta entre Test-Retest, lo que permite suponer que la simplificación del lenguaje aumenta la sensibilidad del instrumento. De las 113 respuestas que no tuvieron cambios significativos, 32 corresponden a reactivos que reafirman la consistencia interna de la prueba. Los 81 restantes corresponden a reactivos extremos, los cuales hacen alusión a experiencias de vida que manifiestan una patología o son culturalmente inaceptables en sujetos normales, independientemente del lenguaje que se utilice. Los 29 reactivos que no fueron modificados y presentaron cambios significativos corresponden a preguntas sensibles a los cambios ambientales o de las circunstancias del sujeto. Concluimos que la simplificación del lenguaje no afectó la consistencia de la prueba y mejoró la confiabilidad al aumentar la comprensión de las preguntas


Assuntos
Humanos , Masculino , Feminino , Adolescente , Adulto , Pessoa de Meia-Idade , Psicometria/educação , Processamento de Linguagem Natural , MMPI/normas , Inquéritos e Questionários , Escolaridade
19.
Neurobiologia ; 53(3/4): 85-112, jul.-dez. 1990. tab
Artigo em Português | LILACS | ID: lil-93113

RESUMO

O autor observa se um modelo linguistico recente - o das implicaturas de Grice - pode clivar o desempenho de varios grupos de sujeitos com lesoes cerebrais. Esta teoria tem como preocupaçao fundamental, explicar como pode o significado do falante ser diferente do significado do estritamente dito (limitado aos verbetes dos dicionarios) e para a explicaçao de sua teoria, oferece um exemplo que se tornou classico: suponha que (A) e (B) estejam conversando sobre um amigo comum (C) que esta atualmente trabalhando num banco. (A) pergunta para (B) como (C) esta se dando em seu novo emprego, e (B) retruca: "Oh! Muito bem, eu acho: ele gosta de seus colegas e ainda nao foi preso". Neste ponto (A) deve procurar o que (B) estava implicando (implicitar, implicatura - 'implicature' -- 'implicatum'), o que ele estava sugerindo, ou ate mesmo o que ele quis dizer ou dizer que (C) ainda nao tinha sido preso. Elaboramos um protocolo com vinte itens assemelhados aos do exemplo de Grice, abarcando os varios tipos de implicaturas e, justamente com um teste de inteligencia nao verbal e um teste verbal simples, aplicamo-lo a 90 sujeitos, classificados pela localizaçao da lesao conforme a tomografia computadorizada do encefalo: 30 sujeitos com lesoes focais hemisfericas esquerdas, sendo que destes, 24 eram afasicos e 6 eram nao afasicos; 20 com lesoes focais hemisfericas direitas; 20 com lesoes encefalicas difusas dementes, excluidos os com lesoes multifocais) e 20 controles sem lesao encefalica pareados aos demais pela procedencia, nivel socio-economico e anos de escolarizaçao. Pelo tratamento estatistico, observamos que o protocolo das implicaturas separou os controles dos dementese dos afasicos. No grupo de dementes, e com menor intensidade no de lesados a direita, o desmepenho no protocolo com o teste de inteligencia nao-verbal e nao com o verbal, mostrando-nos que o protocolo avalia "inteligencia na linguagem". Pela analise dos rros varificamos que os dementese, em menor intensidade, os com lesoes hemisfericas direitas, tem dificuldades em parear os contextos extra-linguisticos com o dito, manifestas por tipos de erros que quase so ocorrem nestes dois grupos, poupando os afasicos, os sujeitos com lesoes hemisfericas esquerdas mas nao afasicos e os controles. Ficam-se com a impressao de que existe um aparelho pareador de contestos (extra-linguisticos) com odito no hemisferio direito


Assuntos
Cérebro/lesões , Testes de Inteligência , Linguística , Processamento de Linguagem Natural , Língua de Sinais
SELEÇÃO DE REFERÊNCIAS
DETALHE DA PESQUISA
...