Your browser doesn't support javascript.

Portal de Pesquisa da BVS Veterinária

Informação e Conhecimento para a Saúde

Home > Pesquisa > ()
Imprimir Exportar

Formato de exportação:

Exportar

Exportar:

Email
Adicionar mais destinatários

Enviar resultado
| |

Seleção Ótima dos Parâmetros de Varredura Espacial para Detecção de Conglomerados: Um Estudo de Simulação / Seleção ótima dos parâmetros de varredura espacial para detecçãode conglomerados: um estudo de simulação

Ribeiro, Sergio Henrique Rodrigues.
Tese em Português | VETTESES | ID: vtt-759

Resumo

O desenvolvimento e o estudo de métodos que sejam capazes de detectar eficientemente um conjunto de áreas que tenha uma maior ou menor incidência de um determinado evento são de extrema importância para a sociedade. Por exemplo, um método que indique a existência de um conjunto de bairros que tenha uma maiorincidência de crimes ou casos de dengue de uma cidade. Nesse contexto nos deparamos com os métodos de análises estatísticas de conglomerados espaciais. Carpenter (2011) relata que uma das principais razões para o grande uso das análises estatísticas deconglomerados espaciais é a disponibilização gratuita de softwares, como o SaTScan. Por exemplo, no site do SaTScan (www.satscan.org; acessado em 1 de janeiro de 2011) pode ser encontrada uma lista de aplicações nas áreas de doenças infecciosas, parasitologia, vigilância síndrômica, câncer, pediatria, geriatria, doenças neurológicas,psicologia, demografia, veterinária, botânica, silvicultura, ecologia e meio-ambiente, desastres naturais, criminologia, transporte, entre outras. Costa e Kulldorff (2009) revisaram algumas dessas aplicações.A estatística de varredura espacial é baseada no clássico artigo de Naus (1965) que desenvolve expressões matemáticas para calcular a probabilidade de encontrar pontos dentro de uma janela retangular fixa que varre a área de um quadrado unitário. Kulldorff (1997), com a estatística de varredura circular, estendeu esta abordagemassumindo um processo de Poisson ou Bernoulli que gera eventos ou casos em uma região geográfica, também conhecida como região de estudo. A região de estudo pode ser dividida em áreas menores onde as populações sob risco e os casos são observados. Os candidatos a conglomerados são gerados por círculos com os seus centrosposicionados nos centroides das áreas e, em seguida, variando os seus raios. Para cada círculo, uma estatística da razão da log-verossimilhança é calculada. O círculo com a maior estatística observada é a potencial sub-região crítica. A inferência sob a suposiçãode aleatoriedade espacial é realizada por meio de simulações Monte Carlo (Dwass, 1957; Turnbull et al., 1990). Algumas extensões e modificações da estatística de varredura puramente espacial são encontradas na literatura. Por exemplo, a estatística de varredura puramente espacial foi estendida para três dimensões (Kulldorff et al., 1998; Kulldorff, 2001; Kulldorff et al., 2005), onde o tempo geralmente representa a terceira dimensão. Novos modelos de probabilidade também foram propostos (Jung et al., 2010, 2007; Huang etal., 2007; Kulldorff et al., 2009; Huang et al., 2009), bem como geometrias diferentes para a forma do conglomerado (Duczmal e Assunção, 2004; Patil e Taillie, 2004; Assunção et al., 2006; Takahashi et al., 2005, 2008; Costa et al., 2012). No entanto, a estatística de varredura circular e elíptica (Kulldorff et al., 2006) são as metodologiasmais utilizadas. Pode-se argumentar que as estatísticas de varredura circular e elíptica são amplamente utilizadas porque estão disponíveis no software SaTScan. O usuário da estatística de varredura circular precisa selecionar apenas um parâmetro, que é o tamanho máximo da janela de varredura. Este parâmetro é normalmente escolhido em termos percentuais da população total na região de estudo. Alguns autores, Kulldorff e Nagarwalla (1995), Coulston e Riitters (2003), Forand et al. (2002), Donnan et al. (2005) e Chaput et al. (2002), discutem a utilização de alguns valores específicos desse parâmetro. Costa e Kulldorff (2009) descrevem algumas razões para escolher um tamanho menor de conglomerado. Uma razão é que um conglomerado circular menor pode ser um indício de que o conglomerado verdadeirotem uma forma irregular, assim, representa uma análise exploratória para conglomerados irregulares, antes da execução de qualquer método de detecção de conglomerados irregulares. Outra razão, é que a escolha por um tamanho de conglomerado menor pode ser feita com base nos recursos disponíveis para a intervenção, que é o caso em estudos epidemiológicos e aplicações de vigilância sindrômica. Por exemplo, a detecção de um conglomerado com um tamanho de 50% doterritório nacional dos EUA não é muito informativa. Neste trabalho, são estudas as medidas de desempenho dos métodos de detecçãode conglomerados espaciais para diferentes valores do tamanho máximo do conglomerado com base em cenários simulados. Procuramos evidências empíricas sobre valor ideal para o parâmetro do tamanho máximo do conglomerado. Simulações extensivas foram feitas utilizando a estatística de varredura circular, a estatística de varredura elíptica e a estatística de varredura double (Costa et al., 2012). Esta última aplica uma regra de parada prematura ao processo de construção do candidato à conglomerado, o que pode evitar que o conglomerado detectado alcance o tamanho máximo previamente escolhido pelo usuário. Foram investigados conglomeradossimulados de geometria circular e irregular. Além disso, foram investigados os conglomerados secundários detectados, sob a suposição de que a estatística de varredura espacial pode dividir um único conglomerado desconhecido em vários pedaços, ou seja,detectar conglomerados primários e secundários. Os resultados indicam que existem escolhas ótimas e únicas para cada um dosseguintes parâmetros: o tamanho máximo do conglomerado, a geometria, e o critério de sobreposição entre os conglomerados primários e secundários. Estas escolhas otimizam as medidas de desempenho: sensibilidade, poder, especificidade e erro de classificação. Contudo, não há uma escolha única, entre todos os parâmetros, que forneça os melhores resultados para todas as medidas de desempenho avaliadas. Os detalhes são apresentados a seguir
Circular and elliptic spatial scan statistics requires the user to choose a maximum cluster size. A common value for this parameter is 50% of the underlying population. In addition to the detected primary cluster, the user may be interested in the analysis of significant secondary clusters. It can also be argued that if the true cluster is irregular, then choosing a small value for the maximum cluster size and evaluating significant secondary clusters may improve cluster detection and avoid the use of irregular cluster methods. This work explores the performance of the circular, elliptic and double scan statistics for different values of the maximum cluster size and different options for the analysis of secondary clusters. Empirical results show that for hot-spot clusters, the analysis of secondary clusters which are statistically significant do not improve the detection of the true unknown cluster, on average. There is evidence that a variable maximum cluster size improves performance. That is, the double scan statistic applies an early-stopping procedure which improves positive predictive values
Biblioteca responsável: BR68.1