Your browser doesn't support javascript.
loading
Análisis clúster para big data: una aplicación con variables demográficas en provincias del Ecuador / Cluster analysis for big data: an application with demographic variables in provinces of Ecuador
Jaramillo-Feijoo, Leyda Elizabeth; Galindo-Villardon, María Purificación; Real-Cotto, Jhony Joe.
Afiliação
  • Jaramillo-Feijoo, Leyda Elizabeth; SOLCA. Departamento Gestión de la Información y Productividad. Guayaquil. EC
  • Galindo-Villardon, María Purificación; Universidad de Salamanca. ES
  • Real-Cotto, Jhony Joe; Universidad de Guayaquil. EC
J. health med. sci. (Print) ; 6(1): 45-50, ene.-mar. 2020. tab, ilus
Artigo em Espanhol | LILACS | ID: biblio-1096716
Biblioteca responsável: CL1.1
RESUMEN
Los métodos de clasificación permiten explorar y analizar grandes conjuntos de datos visualmente, lo cual es de gran utilidad para tomar decisiones rápidas. El objetivo fue comparar dos métodos de análisis de clúster para big data en variables demográficas de las provincias del Ecuador. Se hizo uso de un estudio observacional de tipo comparativo mediante la representación simultanea del HJ-Biplot y el método Two Step (clúster bietápico), a través del software MultBiplot y SPSS. Los datos corresponden a variables demográficas de interés sociosanitarias tasa de mortalidad general, tasa de mortalidad infantil, tasa de natalidad, densidad poblacional, porcentaje urbano y esperanza de vida, medidas en las provincias del Ecuador. Se utilizaron datos provenientes del Instituto de Estadísticas y Censos INEC. Se analizó la asociación entre variables y se identificaron clústeres de las provincias del Ecuador según estas variables demográficas. Según la representación simultánea del HJ-Biplot se identificaron 3 clústeres, el clúster 1 son provincias con mayor densidad poblacional y tasas de mortalidad general, pero valores bajos de tasas de natalidad, el clúster 2 agrupa provincias con mayor esperanza de vida y tasas de mortalidad infantil pero bajos valores de tasa de natalidad y el clúster 3 están las provincias con valores altos de tasas de natalidad y valores bajos de densidad poblacional, esperanza de vida, tasas de mortalidad general y mortalidad infantil, distintos resultados se obtuvieron con el método Two Step. Se pudo concluir que estos métodos son de utilidad para explorar las similitudes entre las provincias según variables demográficas.
ABSTRACT
The classification methods allow to explore and analyze big data sets visually, which is very useful for making quick decisions. This work aimed to compare of two methods of cluster analysis for big data in demographic variables of the provinces of Ecuador. An observational study of comparative type was carried out through the simultaneous representation of the HJ/Biplot and the Two Step method (two-stage cluster), through the MultBiplot and SPSS software. The data correspond to demographic variables of socio-health interest, general mortality rate, infant mortality rate, birth rate, population density, urban percentage and life expectancy, measured in the provinces of Ecuador. Data from Statistics and Census Institute were used. The association between variables was analyzed and clusters of the provinces of Ecuador were identified according to these demographic variables. According to the simultaneous representation of the HJBiplot, 3 clusters were identified, cluster 1 are provinces with higher population density and general mortality rates, but low birth rates values, cluster 2 are provinces with higher life expectancy and mortality rates infantile but low birth rate values and cluster 3 are the provinces with high birth rates values and low population density, life expectancy, general mortality and infant mortality rates, different results were obtained with the Two Step method. It was concluded that these methods are useful for exploring the similarities between provinces according to demographic variables.
Assuntos

Texto completo: Disponível Coleções: Bases de dados internacionais Temas: Análise de dados espaciais em saúde Base de dados: LILACS Assunto principal: Análise por Conglomerados / Demografia / Modelos Estatísticos Idioma: Espanhol Revista: J. health med. sci. (Print) Assunto da revista: Medicina Ano de publicação: 2020 Tipo de documento: Artigo País de afiliação: Equador / Espanha Instituição/País de afiliação: SOLCA/EC / Universidad de Guayaquil/EC / Universidad de Salamanca/ES

Similares

MEDLINE

...
LILACS

LIS

Texto completo: Disponível Coleções: Bases de dados internacionais Temas: Análise de dados espaciais em saúde Base de dados: LILACS Assunto principal: Análise por Conglomerados / Demografia / Modelos Estatísticos Idioma: Espanhol Revista: J. health med. sci. (Print) Assunto da revista: Medicina Ano de publicação: 2020 Tipo de documento: Artigo País de afiliação: Equador / Espanha Instituição/País de afiliação: SOLCA/EC / Universidad de Guayaquil/EC / Universidad de Salamanca/ES