RESUMEN
BACKGROUND: No-show to medical appointments has significant adverse effects on healthcare systems and their clients. Using machine learning to predict no-shows allows managers to implement strategies such as overbooking and reminders targeting patients most likely to miss appointments, optimizing the use of resources. METHODS: In this study, we proposed a detailed analytical framework for predicting no-shows while addressing imbalanced datasets. The framework includes a novel use of z-fold cross-validation performed twice during the modeling process to improve model robustness and generalization. We also introduce Symbolic Regression (SR) as a classification algorithm and Instance Hardness Threshold (IHT) as a resampling technique and compared their performance with that of other classification algorithms, such as K-Nearest Neighbors (KNN) and Support Vector Machine (SVM), and resampling techniques, such as Random under Sampling (RUS), Synthetic Minority Oversampling Technique (SMOTE) and NearMiss-1. We validated the framework using two attendance datasets from Brazilian hospitals with no-show rates of 6.65% and 19.03%. RESULTS: From the academic perspective, our study is the first to propose using SR and IHT to predict the no-show of patients. Our findings indicate that SR and IHT presented superior performances compared to other techniques, particularly IHT, which excelled when combined with all classification algorithms and led to low variability in performance metrics results. Our results also outperformed sensitivity outcomes reported in the literature, with values above 0.94 for both datasets. CONCLUSION: This is the first study to use SR and IHT methods to predict patient no-shows and the first to propose performing z-fold cross-validation twice. Our study highlights the importance of avoiding relying on few validation runs for imbalanced datasets as it may lead to biased results and inadequate analysis of the generalization and stability of the models obtained during the training stage.
Asunto(s)
Algoritmos , Benchmarking , Humanos , Brasil , Aprendizaje Automático , Técnicas de Apoyo para la DecisiónRESUMEN
In this work, we apply Convolutional Neural Networks (CNNs) to detect gravitational wave (GW) signals of compact binary coalescences, using single-interferometer data from real LIGO detectors. Here, we adopted a resampling white-box approach to advance towards a statistical understanding of uncertainties intrinsic to CNNs in GW data analysis. We used Morlet wavelets to convert strain time series to time-frequency images. Moreover, we only worked with data of non-Gaussian noise and hardware injections, removing freedom to set signal-to-noise ratio (SNR) values in GW templates by hand, in order to reproduce more realistic experimental conditions. After hyperparameter adjustments, we found that resampling through repeated k-fold cross-validation smooths the stochasticity of mini-batch stochastic gradient descent present in accuracy perturbations by a factor of 3.6. CNNs are quite precise to detect noise, 0.952 for H1 data and 0.932 for L1 data; but, not sensitive enough to recall GW signals, 0.858 for H1 data and 0.768 for L1 data-although recall values are dependent on expected SNR. Our predictions are transparently understood by exploring tthe distribution of probabilistic scores outputted by the softmax layer, and they are strengthened by a receiving operating characteristic analysis and a paired-sample t-test to compare with a random classifier.
RESUMEN
The aim of this study was to evaluate the experimental precision of different methods of statistical analysis for trials with large numbers of soybean genotypes, and their relationship with the number of replicates. Soybean yield data (nine trials; 324 genotypes; 46 cultivars; 278 lines; agricultural harvest of 2014/15) were used. Two of these trials were performed at the same location, side by side, forming a trial with six replicates. Each trial was analyzed by the randomized complete block, triple lattice design, and use of the Papadakis method. The selective accuracy, least significant difference, and Fasoulas differentiation index were estimated, and model assumptions were tested. The resampling method was used to study the influence of the number of replicates, by varying the number of blocks and estimating the precision measurements. The experimental precision indicators of the Papadakis method are more favorable as compared to the randomized complete block design and triple lattice. To obtain selective accuracy above the high experimental precision range in trials with 324 soybean genotypes, two repetitions can be used, and data can be analyzed using the randomized complete block design or Papadakis method.(AU)
O objetivo deste estudo foi avaliar a precisão experimental de diferentes métodos de análise estatística para ensaios com grande número de genótipos de soja e sua relação com o número de repetições. Foram usados dados de produtividade de grãos de soja (nove ensaios, 324 genótipos, 46 cultivares, 278 linhagens, safra agrícola de 2014/15). Dois destes ensaios foram realizados no mesmo local, lado a lado, constituindo um ensaio com seis repetições. Cada ensaio foi analisado pelos delineamentos de blocos ao acaso, látice triplo e uso do método de Papadakis. Foram estimados a acurácia seletiva, diferença mínima significativa e índice de diferenciação de Fasoulas, e, ainda foram testados os pressupostos do modelo. O método de reamostragem foi usado para estudar a influência do número de repetições, variando o número de blocos e estimando as medidas de precisão. Os indicadores de precisão experimental do método de Papadakis são mais favoráveis, quando comparados com os delineamentos de blocos ao acaso e látice triplo. Para obter acurácia seletiva acima da faixa de alta precisão experimental em ensaios com 324 genótipos de soja, pode-se usar duas repetições e analisar os dados, usando o delineamento de blocos completos ao acaso ou método de Papadakis.(AU)
Asunto(s)
Interpretación Estadística de Datos , Genotipo , Glycine max/genética , Técnicas de Genotipaje , Exactitud de los DatosRESUMEN
The aim of this study was to evaluate the experimental precision of different methods of statistical analysis for trials with large numbers of soybean genotypes, and their relationship with the number of replicates. Soybean yield data (nine trials; 324 genotypes; 46 cultivars; 278 lines; agricultural harvest of 2014/15) were used. Two of these trials were performed at the same location, side by side, forming a trial with six replicates. Each trial was analyzed by the randomized complete block, triple lattice design, and use of the Papadakis method. The selective accuracy, least significant difference, and Fasoulas differentiation index were estimated, and model assumptions were tested. The resampling method was used to study the influence of the number of replicates, by varying the number of blocks and estimating the precision measurements. The experimental precision indicators of the Papadakis method are more favorable as compared to the randomized complete block design and triple lattice. To obtain selective accuracy above the high experimental precision range in trials with 324 soybean genotypes, two repetitions can be used, and data can be analyzed using the randomized complete block design or Papadakis method.
O objetivo deste estudo foi avaliar a precisão experimental de diferentes métodos de análise estatística para ensaios com grande número de genótipos de soja e sua relação com o número de repetições. Foram usados dados de produtividade de grãos de soja (nove ensaios, 324 genótipos, 46 cultivares, 278 linhagens, safra agrícola de 2014/15). Dois destes ensaios foram realizados no mesmo local, lado a lado, constituindo um ensaio com seis repetições. Cada ensaio foi analisado pelos delineamentos de blocos ao acaso, látice triplo e uso do método de Papadakis. Foram estimados a acurácia seletiva, diferença mínima significativa e índice de diferenciação de Fasoulas, e, ainda foram testados os pressupostos do modelo. O método de reamostragem foi usado para estudar a influência do número de repetições, variando o número de blocos e estimando as medidas de precisão. Os indicadores de precisão experimental do método de Papadakis são mais favoráveis, quando comparados com os delineamentos de blocos ao acaso e látice triplo. Para obter acurácia seletiva acima da faixa de alta precisão experimental em ensaios com 324 genótipos de soja, pode-se usar duas repetições e analisar os dados, usando o delineamento de blocos completos ao acaso ou método de Papadakis.
Asunto(s)
Genotipo , Interpretación Estadística de Datos , Glycine max/genética , Exactitud de los Datos , Técnicas de GenotipajeRESUMEN
ABSTRACT: The aim of this study was to evaluate the experimental precision of different methods of statistical analysis for trials with large numbers of soybean genotypes, and their relationship with the number of replicates. Soybean yield data (nine trials; 324 genotypes; 46 cultivars; 278 lines; agricultural harvest of 2014/15) were used. Two of these trials were performed at the same location, side by side, forming a trial with six replicates. Each trial was analyzed by the randomized complete block, triple lattice design, and use of the Papadakis method. The selective accuracy, least significant difference, and Fasoulas differentiation index were estimated, and model assumptions were tested. The resampling method was used to study the influence of the number of replicates, by varying the number of blocks and estimating the precision measurements. The experimental precision indicators of the Papadakis method are more favorable as compared to the randomized complete block design and triple lattice. To obtain selective accuracy above the high experimental precision range in trials with 324 soybean genotypes, two repetitions can be used, and data can be analyzed using the randomized complete block design or Papadakis method.
RESUMO: O objetivo deste estudo foi avaliar a precisão experimental de diferentes métodos de análise estatística para ensaios com grande número de genótipos de soja e sua relação com o número de repetições. Foram usados dados de produtividade de grãos de soja (nove ensaios, 324 genótipos, 46 cultivares, 278 linhagens, safra agrícola de 2014/15). Dois destes ensaios foram realizados no mesmo local, lado a lado, constituindo um ensaio com seis repetições. Cada ensaio foi analisado pelos delineamentos de blocos ao acaso, látice triplo e uso do método de Papadakis. Foram estimados a acurácia seletiva, diferença mínima significativa e índice de diferenciação de Fasoulas, e, ainda foram testados os pressupostos do modelo. O método de reamostragem foi usado para estudar a influência do número de repetições, variando o número de blocos e estimando as medidas de precisão. Os indicadores de precisão experimental do método de Papadakis são mais favoráveis, quando comparados com os delineamentos de blocos ao acaso e látice triplo. Para obter acurácia seletiva acima da faixa de alta precisão experimental em ensaios com 324 genótipos de soja, pode-se usar duas repetições e analisar os dados, usando o delineamento de blocos completos ao acaso ou método de Papadakis.
RESUMEN
The aim of this study was to determine the required sample size for estimation of the Pearson coefficient of correlation between cherry tomato variables. Two uniformity tests were set up in a protected environment in the spring/summer of 2014. The observed variables in each plant were mean fruit length, mean fruit width, mean fruit weight, number of bunches, number of fruits per bunch, number of fruits, and total weight of fruits, with calculation of the Pearson correlation matrix between them. Sixty eight sample sizes were planned for one greenhouse and 48 for another, with the initial sample size of 10 plants, and the others were obtained by adding five plants. For each planned sample size, 3000 estimates of the Pearson correlation coefficient were obtained through bootstrap re-samplings with replacement. The sample size for each correlation coefficient was determined when the 95% confidence interval amplitude value was less than or equal to 0.4. Obtaining estimates of the Pearson correlation coefficient with high precision is difficult for parameters with a weak linear relation. Accordingly, a larger sample size is necessary to estimate them. Linear relations involving variables dealing with size and number of fruits per plant have less precision. To estimate the coefficient of correlation between productivity variables of cherry tomato, with a confidence interval of 95% equal to 0.4, it is necessary to sample 275 plants in a 250m² greenhouse, and 200 plants in a 200m² greenhouse.(AU)
O objetivo deste trabalho foi determinar o tamanho de amostra necessário para estimar o coeficiente de correlação de Pearson entre variáveis do tomate cereja. Foram instalados dois ensaios de uniformidade em ambiente protegido na primavera/verão de 2014. As variáveis observadas em cada planta foram comprimento médio de fruto, largura média de fruto, peso médio de fruto, número de cachos, número de frutos por cacho, número de frutos e peso total de frutos, sendo calculada a matriz de correlação de Pearson entre elas. Foram planejados 68 tamanhos de amostra em uma estufa e 48 em outra, com tamanho inicial composto de 10 plantas e os demais obtidos acrescentando cinco plantas. Para cada tamanho de amostra planejado foram obtidas 3000 estimativas do coeficiente de correlação de Pearson através de reamostragens bootstrap com reposição. O tamanho de amostra de cada coeficiente de correlação foi determinado quando o valor da amplitude do intervalo de confiança de 95% foi menor ou igual a 0,4. A obtenção das estimativas do coeficiente de correlação de Pearson com elevada precisão é difícil para caracteres com relação linear fraca e, consequentemente, maior é o tamanho amostra necessário para estima-los. As relações lineares envolvendo as variáveis relacionadas com o tamanho e o número de frutos por planta tem menor precisão. Para estimar o coeficiente de correlação entre variáveis produtivas do tomate cereja, com intervalo de confiança de 95% igual a 0,4, é necessário amostrar 275 plantas na estufa de 250m², e 200 plantas na estufa de 200m².(AU)
RESUMEN
The aim of this study was to determine the required sample size for estimation of the Pearson coefficient of correlation between cherry tomato variables. Two uniformity tests were set up in a protected environment in the spring/summer of 2014. The observed variables in each plant were mean fruit length, mean fruit width, mean fruit weight, number of bunches, number of fruits per bunch, number of fruits, and total weight of fruits, with calculation of the Pearson correlation matrix between them. Sixty eight sample sizes were planned for one greenhouse and 48 for another, with the initial sample size of 10 plants, and the others were obtained by adding five plants. For each planned sample size, 3000 estimates of the Pearson correlation coefficient were obtained through bootstrap re-samplings with replacement. The sample size for each correlation coefficient was determined when the 95% confidence interval amplitude value was less than or equal to 0.4. Obtaining estimates of the Pearson correlation coefficient with high precision is difficult for parameters with a weak linear relation. Accordingly, a larger sample size is necessary to estimate them. Linear relations involving variables dealing with size and number of fruits per plant have less precision. To estimate the coefficient of correlation between productivity variables of cherry tomato, with a confidence interval of 95% equal to 0.4, it is necessary to sample 275 plants in a 250m² greenhouse, and 200 plants in a 200m² greenhouse.
O objetivo deste trabalho foi determinar o tamanho de amostra necessário para estimar o coeficiente de correlação de Pearson entre variáveis do tomate cereja. Foram instalados dois ensaios de uniformidade em ambiente protegido na primavera/verão de 2014. As variáveis observadas em cada planta foram comprimento médio de fruto, largura média de fruto, peso médio de fruto, número de cachos, número de frutos por cacho, número de frutos e peso total de frutos, sendo calculada a matriz de correlação de Pearson entre elas. Foram planejados 68 tamanhos de amostra em uma estufa e 48 em outra, com tamanho inicial composto de 10 plantas e os demais obtidos acrescentando cinco plantas. Para cada tamanho de amostra planejado foram obtidas 3000 estimativas do coeficiente de correlação de Pearson através de reamostragens bootstrap com reposição. O tamanho de amostra de cada coeficiente de correlação foi determinado quando o valor da amplitude do intervalo de confiança de 95% foi menor ou igual a 0,4. A obtenção das estimativas do coeficiente de correlação de Pearson com elevada precisão é difícil para caracteres com relação linear fraca e, consequentemente, maior é o tamanho amostra necessário para estima-los. As relações lineares envolvendo as variáveis relacionadas com o tamanho e o número de frutos por planta tem menor precisão. Para estimar o coeficiente de correlação entre variáveis produtivas do tomate cereja, com intervalo de confiança de 95% igual a 0,4, é necessário amostrar 275 plantas na estufa de 250m², e 200 plantas na estufa de 200m².
RESUMEN
ABSTRACT: The aim of this study was to evaluate the experimental precision of different methods of statistical analysis for trials with large numbers of soybean genotypes, and their relationship with the number of replicates. Soybean yield data (nine trials; 324 genotypes; 46 cultivars; 278 lines; agricultural harvest of 2014/15) were used. Two of these trials were performed at the same location, side by side, forming a trial with six replicates. Each trial was analyzed by the randomized complete block, triple lattice design, and use of the Papadakis method. The selective accuracy, least significant difference, and Fasoulas differentiation index were estimated, and model assumptions were tested. The resampling method was used to study the influence of the number of replicates, by varying the number of blocks and estimating the precision measurements. The experimental precision indicators of the Papadakis method are more favorable as compared to the randomized complete block design and triple lattice. To obtain selective accuracy above the high experimental precision range in trials with 324 soybean genotypes, two repetitions can be used, and data can be analyzed using the randomized complete block design or Papadakis method.
RESUMO: O objetivo deste estudo foi avaliar a precisão experimental de diferentes métodos de análise estatística para ensaios com grande número de genótipos de soja e sua relação com o número de repetições. Foram usados dados de produtividade de grãos de soja (nove ensaios, 324 genótipos, 46 cultivares, 278 linhagens, safra agrícola de 2014/15). Dois destes ensaios foram realizados no mesmo local, lado a lado, constituindo um ensaio com seis repetições. Cada ensaio foi analisado pelos delineamentos de blocos ao acaso, látice triplo e uso do método de Papadakis. Foram estimados a acurácia seletiva, diferença mínima significativa e índice de diferenciação de Fasoulas, e, ainda foram testados os pressupostos do modelo. O método de reamostragem foi usado para estudar a influência do número de repetições, variando o número de blocos e estimando as medidas de precisão. Os indicadores de precisão experimental do método de Papadakis são mais favoráveis, quando comparados com os delineamentos de blocos ao acaso e látice triplo. Para obter acurácia seletiva acima da faixa de alta precisão experimental em ensaios com 324 genótipos de soja, pode-se usar duas repetições e analisar os dados, usando o delineamento de blocos completos ao acaso ou método de Papadakis.
RESUMEN
ABSTRACT: The aim of this study was to determine the required sample size for estimation of the Pearson coefficient of correlation between cherry tomato variables. Two uniformity tests were set up in a protected environment in the spring/summer of 2014. The observed variables in each plant were mean fruit length, mean fruit width, mean fruit weight, number of bunches, number of fruits per bunch, number of fruits, and total weight of fruits, with calculation of the Pearson correlation matrix between them. Sixty eight sample sizes were planned for one greenhouse and 48 for another, with the initial sample size of 10 plants, and the others were obtained by adding five plants. For each planned sample size, 3000 estimates of the Pearson correlation coefficient were obtained through bootstrap re-samplings with replacement. The sample size for each correlation coefficient was determined when the 95% confidence interval amplitude value was less than or equal to 0.4. Obtaining estimates of the Pearson correlation coefficient with high precision is difficult for parameters with a weak linear relation. Accordingly, a larger sample size is necessary to estimate them. Linear relations involving variables dealing with size and number of fruits per plant have less precision. To estimate the coefficient of correlation between productivity variables of cherry tomato, with a confidence interval of 95% equal to 0.4, it is necessary to sample 275 plants in a 250m² greenhouse, and 200 plants in a 200m² greenhouse.
RESUMO: O objetivo deste trabalho foi determinar o tamanho de amostra necessário para estimar o coeficiente de correlação de Pearson entre variáveis do tomate cereja. Foram instalados dois ensaios de uniformidade em ambiente protegido na primavera/verão de 2014. As variáveis observadas em cada planta foram comprimento médio de fruto, largura média de fruto, peso médio de fruto, número de cachos, número de frutos por cacho, número de frutos e peso total de frutos, sendo calculada a matriz de correlação de Pearson entre elas. Foram planejados 68 tamanhos de amostra em uma estufa e 48 em outra, com tamanho inicial composto de 10 plantas e os demais obtidos acrescentando cinco plantas. Para cada tamanho de amostra planejado foram obtidas 3000 estimativas do coeficiente de correlação de Pearson através de reamostragens "bootstrap" com reposição. O tamanho de amostra de cada coeficiente de correlação foi determinado quando o valor da amplitude do intervalo de confiança de 95% foi menor ou igual a 0,4. A obtenção das estimativas do coeficiente de correlação de Pearson com elevada precisão é difícil para caracteres com relação linear fraca e, consequentemente, maior é o tamanho amostra necessário para estima-los. As relações lineares envolvendo as variáveis relacionadas com o tamanho e o número de frutos por planta tem menor precisão. Para estimar o coeficiente de correlação entre variáveis produtivas do tomate cereja, com intervalo de confiança de 95% igual a 0,4, é necessário amostrar 275 plantas na estufa de 250m², e 200 plantas na estufa de 200m².
RESUMEN
O objetivo deste trabalho foi estimar o tamanho de amostra para medir a densidade populacional de espécies de percevejos, variando métodos de coleta, altitude e cultivares de soja. Foram utilizadas 100 lavouras de soja, distribuídas em nove municípios da região central do Rio Grande do Sul, em três safras agrícolas (2010/2011, 2011/2012, 2012/2013). Em cada lavoura, foram demarcados 30 pontos distantes em 20 metros entre si. Em cada ponto, foram coletados percevejos (adultos + ninfas) das espécies Dichelops sp., Piezodorus guildinii e Euchistus heros, por meio dos métodos pano-de-batida largo e rede entomológica, totalizando 6.000 coletas. Para cada lavoura, método de coleta e espéciede percevejo, foram estimadas a média da densidade populacional e o tamanho de amostra por meio de reamostragem. O tamanho de amostra (número de pontos) para determinar a densidade populacional de percevejos varia com o método de coleta e a densidade populacional. Usando o pano-de-batida largo para a coleta de percevejos em soja, para um erro de estimação (amplitude do intervalo de credibilidade) igual a dois percevejos e densidade populacional na classe de 1,5 a 2,0 percevejos m-2, o tamanho de amostra é 13, 77 e 15, respectivamente, para as espécies Dichelops sp., P. guildinii e E. heros.(AU)
The objective was to estimate the sample size to evaluate the population density of bugs species, varying collection methods, altitude and soybean cultivars. There were used 100 soybean fields, distributed in nine districts of the central region of Rio Grande do Sul on three growing seasons (2010/2011, 2011/2012, 2012/2013). In each field, 30 equidistant points were marked at 20 meters. Bugs (adults and nymphs) of Dichelops sp., Piezodorus guildinii and Euchistus heros species were collected at each point using beat cloth and sweep net, totaling 6,000 collections. For each field, collection method and bug speciesit was estimated average population density, and sample size by resampling. The sample size (number of points) to estimate the population density of bugs vary with the species, altitude, soybean cultivar and the collection method. Using the beat cloth method to collect bugs in soybean, for an estimate error equal to two bugs and population density at class of 1.5 to 2.0 bugs m-2, the number of sampling points are 13, 77 and 15, respectively, for Dichelops sp., P. guildinii and E. heros.(AU)
Asunto(s)
Cimicidae , Glycine max , Plagas Agrícolas , Tamaño de la Muestra , InsectosRESUMEN
RESUMO: O objetivo deste trabalho foi estimar o tamanho de amostra para medir a densidade populacional de espécies de percevejos, variando métodos de coleta, altitude e cultivares de soja. Foram utilizadas 100 lavouras de soja, distribuídas em nove municípios da região central do Rio Grande do Sul, em três safras agrícolas (2010/2011, 2011/2012, 2012/2013). Em cada lavoura, foram demarcados 30 pontos distantes em 20 metros entre si. Em cada ponto, foram coletados percevejos (adultos + ninfas) das espécies Dichelops sp., Piezodorus guildinii e Euchistus heros, por meio dos métodos pano-de-batida largo e rede entomológica, totalizando 6.000 coletas. Para cada lavoura, método de coleta e espéciede percevejo, foram estimadas a média da densidade populacional e o tamanho de amostra por meio de reamostragem. O tamanho de amostra (número de pontos) para determinar a densidade populacional de percevejos varia com o método de coleta e a densidade populacional. Usando o pano-de-batida largo para a coleta de percevejos em soja, para um erro de estimação (amplitude do intervalo de credibilidade) igual a dois percevejos e densidade populacional na classe de 1,5 a 2,0 percevejos m-2, o tamanho de amostra é 13, 77 e 15, respectivamente, para as espécies Dichelops sp., P. guildinii e E. heros.
ABSTRACT: The objective was to estimate the sample size to evaluate the population density of bugs species, varying collection methods, altitude and soybean cultivars. There were used 100 soybean fields, distributed in nine districts of the central region of Rio Grande do Sul on three growing seasons (2010/2011, 2011/2012, 2012/2013). In each field, 30 equidistant points were marked at 20 meters. Bugs (adults and nymphs) of Dichelops sp., Piezodorus guildinii and Euchistus heros species were collected at each point using beat cloth and sweep net, totaling 6,000 collections. For each field, collection method and bug speciesit was estimated average population density, and sample size by resampling. The sample size (number of points) to estimate the population density of bugs vary with the species, altitude, soybean cultivar and the collection method. Using the beat cloth method to collect bugs in soybean, for an estimate error equal to two bugs and population density at class of 1.5 to 2.0 bugs m-2, the number of sampling points are 13, 77 and 15, respectively, for Dichelops sp., P. guildinii and E. heros.
RESUMEN
Estimates of diversity indices provide information on distribution, richness and abundance of species within a community. The aim of the current study was to estimate faunistic indices (richness, constancy, dominance and abundance) of the species collected by beat cloth and entomological net sampling methods in different soybean crops and to determine the sample size necessary to estimate faunistic indices. Fauna density from 100 soybeans crops located in nine municipalities in Rio Grande do Sul, Brazil, were evaluated. Thirty points, 20 meters apart from one another, were marked in the crops. At each point, insect pests and natural enemies were collected using the two sampling methods. Faunistic indices, including the average and interval estimates carried out by the resampling method, were calculated for each soybean crop. In the samplings using the beat cloth, richness > dominance = abundance > constancy, and using the entomological nets, richness > dominance > abundance > constancy. All faunistic indices other than dominance were greater when using the beat cloth method than those estimated by the entomological net method. The sample sizes required to estimate richness, constancy, dominance and abundance indices were 38, 78, 47 and more than 300, respectively, with an estimation error of 20 % of the average (p = 0.05). Higher values were observed when entomological net was used.
Asunto(s)
Muestreo , Biodiversidad , Estadística como Asunto , Grupos de Población Animal , Glycine max , Fauna , Productos Agrícolas , Tamaño de la MuestraRESUMEN
Estimates of diversity indices provide information on distribution, richness and abundance of species within a community. The aim of the current study was to estimate faunistic indices (richness, constancy, dominance and abundance) of the species collected by beat cloth and entomological net sampling methods in different soybean crops and to determine the sample size necessary to estimate faunistic indices. Fauna density from 100 soybeans crops located in nine municipalities in Rio Grande do Sul, Brazil, were evaluated. Thirty points, 20 meters apart from one another, were marked in the crops. At each point, insect pests and natural enemies were collected using the two sampling methods. Faunistic indices, including the average and interval estimates carried out by the resampling method, were calculated for each soybean crop. In the samplings using the beat cloth, richness > dominance = abundance > constancy, and using the entomological nets, richness > dominance > abundance > constancy. All faunistic indices other than dominance were greater when using the beat cloth method than those estimated by the entomological net method. The sample sizes required to estimate richness, constancy, dominance and abundance indices were 38, 78, 47 and more than 300, respectively, with an estimation error of 20 % of the average (p = 0.05). Higher values were observed when entomological net was used.(AU)
Asunto(s)
Muestreo , Grupos de Población Animal , Biodiversidad , Estadística como Asunto , Glycine max , Productos Agrícolas , Tamaño de la Muestra , FaunaRESUMEN
O objetivo deste trabalho foi determinar o número de folhas e de plantas necessário para a estimação da média do índice SPAD em crambe, cultivar 'FMS Brilhante'. Em um experimento foram selecionadas, aleatoriamente, 66 plantas. Nessas plantas, foi mensurado o índice SPAD em seis folhas, escolhidas aleatoriamente em cada planta, aos 34 e 40 dias após a emergência, totalizando 396 folhas em cada avaliação. A partir dos dados do índice SPAD, foram calculadas medidas de tendência central e de variabilidade, verificadas a normalidade e a homogeneidade de variâncias. Foram realizadas análises de variância com base no modelo hierárquico (variação entre plantas e variação entre folhas dentro de plantas). O número de folhas, necessário para a estimação da média do índice SPAD, em cada momento de avaliação (34 e 40 dias após emergência), foi determinado por reamostragens, com reposição. Mensurar uma folha por planta, em 36 plantas (36 folhas), é suficiente para a estimação da média do índice SPAD de crambe, com amplitude do intervalo de confiança de 95% igual a três.
The objective of this work was to determine the number of leaves and plants required to estimate the average SPAD index in crambe, cultivar 'FMS Brilhante'. In one experiment were randomly selected 66 plants. These plants, the SPAD index was measured in six leaves, selected randomly from each plant at 34 and 40 days after emergence, totaling 396 leaves on each evaluation. From data of the SPAD index it was calculated measures of central tendency and variability. Analyses of variance based hierarchical model (variation between plants and variation among leaves into plants) were carried. The number of leaves required to estimate the average SPAD index, at each evaluation point (34 and 40 days after emergence), was determined by resampling with replacement. Measure a leaf per plant on 36 plants (36 leaves), is sufficient to estimate the average SPAD index of crambe, with amplitude of confidence interval of 95% equal to three.
Asunto(s)
Hojas de la Planta , Crambe (Planta) , Clorofila , BiocombustiblesRESUMEN
O objetivo deste trabalho foi determinar o tamanho de amostra necessário para a estimação da média do comprimento, dos diâmetros maior e menor e da massa de sementes de feijão de porco (Canavalia ensiformis) e de mucuna cinza (Stizolobium cinereum). Em 300 sementes de feijão de porco e em 300 sementes de mucuna cinza, foram mensurados os seguintes caracteres: comprimento, diâmetros maior e menor e massa. Foram calculadas medidas de tendência central e de variabilidade. Após, foram testadas as hipóteses de igualdade entre as médias e de homogeneidade entre as variâncias. Foi determinado o tamanho de amostra por meio de reamostragem, com reposição de 10.000 amostras. Para a estimação da média do comprimento, dos diâmetros maior e menor e da massa, com intervalo de confiança de 95% igual a 10% da estimativa da média, 117 e 66 sementes são suficientes, respectivamente, para feijão de porco e mucuna cinza.
The objective of this research was to determine the sample size (number of seeds) to estimate the average of length, major and minor diameters and weight of seeds of jack bean (Canavalia ensiformis) and velvet bean (Stizolobium cinereum). In 300 seeds of jack bean and 300 seeds of velvet bean it was measured following characters: length, major and minor diameters and weight. It was calculated measures of central tendency and variability. After the hypothesis of equality between the means and homogeneity of variances, were tested. It was determined the sample size using resampling with replacement of 10,000 samples. For estimating the average of length, major and minor diameters and weight, with amplitude of confidence interval of 95%, equal 10% of average estimate, 117 and 66 seeds are sufficient, respectively, for jack bean and velvet bean.
RESUMEN
O objetivo deste trabalho foi determinar o tamanho de amostra (número de anos) para a estimação da média decendial de duração diária de brilho solar em 30 locais do Rio Grande do Sul. Com os dados de duração de brilho solar do período de 1960 a 2007, formaram-se 1.080 séries temporais (30 locais x 36 decêndios) de média decendial de duração diária de brilho solar. Testou-se a aleatoriedade e a normalidade dos dados, de cada série temporal, por meio dos testes de sequência (run test) e de Lilliefors, respectivamente. Para cada decêndio e local, foi determinado o tamanho de amostra por meio de reamostragem bootstrap, com reposição de 3.000 amostras. Vinte e cinco anos de observações são suficientes para a estimação da média decendial de duração diária de brilho solar, com amplitude do intervalo de confiança de bootstrap de 95% igual a 2,00 horas dia-1.
The objective of this research was to determine the sample size (number of years) to estimate the ten-day average of daily sunshine duration in 30 locations of the Rio Grande do Sul State, Brazil. With sunshine data duration of the period from 1960 to 2007, 1,080 time series (30 locations x 36 ten-days) of ten-day of daily sunshine duration average were formed. The aleatory and normality, in each time series, was verified through the run test and Lilliefors test, respectively. For each ten-day and locality, it was determined the sample size using bootstrap resampling with replacement of 3,000 samples. Twenty-five years of data are enough to predict the ten-day average of daily sunshine duration, with amplitude of bootstrap confidence interval of 95%, equal to 2.00 hour day-1.
RESUMEN
The objective of this research was to determine the sample size (number of seeds) to estimate the average of length, major and minor diameters and weight of seeds of jack bean (Canavalia ensiformis) and velvet bean (Stizolobium cinereum). In 300 seeds of jack bean and 300 seeds of velvet bean it was measured following characters: length, major and minor diameters and weight. It was calculated measures of central tendency and variability. After the hypothesis of equality between the means and homogeneity of variances, were tested. It was determined the sample size using resampling with replacement of 10,000 samples. For estimating the average of length, major and minor diameters and weight, with amplitude of confidence interval of 95%, equal 10% of average estimate, 117 and 66 seeds are sufficient, respectively, for jack bean and velvet bean.
O objetivo deste trabalho foi determinar o tamanho de amostra necessário para a estimação da média do comprimento, dos diâmetros maior e menor e da massa de sementes de feijão de porco (Canavalia ensiformis) e de mucuna cinza (Stizolobium cinereum). Em 300 sementes de feijão de porco e em 300 sementes de mucuna cinza, foram mensurados os seguintes caracteres: comprimento, diâmetros maior e menor e massa. Foram calculadas medidas de tendência central e de variabilidade. Após, foram testadas as hipóteses de igualdade entre as médias e de homogeneidade entre as variâncias. Foi determinado o tamanho de amostra por meio de reamostragem, com reposição de 10.000 amostras. Para a estimação da média do comprimento, dos diâmetros maior e menor e da massa, com intervalo de confiança de 95% igual a 10% da estimativa da média, 117 e 66 sementes são suficientes, respectivamente, para feijão de porco e mucuna cinza.
RESUMEN
The objective of this research was to determine the sample size (number of years) to estimate the ten-day average of daily sunshine duration in 30 locations of the Rio Grande do Sul State, Brazil. With sunshine data duration of the period from 1960 to 2007, 1,080 time series (30 locations x 36 ten-days) of ten-day of daily sunshine duration average were formed. The aleatory and normality, in each time series, was verified through the run test and Lilliefors test, respectively. For each ten-day and locality, it was determined the sample size using bootstrap resampling with replacement of 3,000 samples. Twenty-five years of data are enough to predict the ten-day average of daily sunshine duration, with amplitude of bootstrap confidence interval of 95%, equal to 2.00 hour day-1.
O objetivo deste trabalho foi determinar o tamanho de amostra (número de anos) para a estimação da média decendial de duração diária de brilho solar em 30 locais do Rio Grande do Sul. Com os dados de duração de brilho solar do período de 1960 a 2007, formaram-se 1.080 séries temporais (30 locais x 36 decêndios) de média decendial de duração diária de brilho solar. Testou-se a aleatoriedade e a normalidade dos dados, de cada série temporal, por meio dos testes de sequência (run test) e de Lilliefors, respectivamente. Para cada decêndio e local, foi determinado o tamanho de amostra por meio de reamostragem bootstrap, com reposição de 3.000 amostras. Vinte e cinco anos de observações são suficientes para a estimação da média decendial de duração diária de brilho solar, com amplitude do intervalo de confiança de bootstrap de 95% igual a 2,00 horas dia-1.
RESUMEN
The objective of this research was to determine the sample size (number of insects) to estimate the average duration for larval, pupal and larval + pupal periods for M. ochroloma and M. semilaevis. Adults of both species were collected at a 0.25ha experimental area of forage turnip (Raphanus sativus L.) and for laboratory rearing (temperature 25±2°C, relative humidity 60±10% and photoperíod 12 hours). Afterwards larval, pupal and larval + pupal periods were measured, in days, of 119 and 81 insects, respectively, M. ochroloma and M. semilaevis. It was calculated measures of central tendency and variability and determined the sample size using bootstrap with replacement of 10000 samples. For estimating the average larval, pupal and larval + pupal periods, with amplitude of bootstrap confidence interval of 95%, equal a day, 42 and 35 insects are sufficient, respectively for both M. ochroloma and M. semilaevis.
O objetivo deste trabalho foi determinar o tamanho de amostra (número de insetos) para a estimação da média de duração dos períodos larval, pupal e larval + pupal de Microtheca ochroloma e de Microtheca semilaevis (Coleoptera: Chrysomelidae). Foram coletados adultos dessas espécies em uma área experimental de 0,25ha de nabo forrageiro (Raphanus sativus L.) e foi estabelecida uma criação em laboratório (temperatura de 25±2°C, umidade relativa de 60±10% e fotoperíodo de 12 horas). Após, foram mensurados os períodos larval, pupal e larval + pupal, em dias, de 119 e 81 insetos, respectivamente, de M. ochroloma e de M. semilaevis. Foram calculadas medidas de tendência central e de variabilidade. Foi determinado o tamanho de amostra por meio de bootstrap, com reposição de 10.000 amostras. Para a estimação da média dos períodos larval, pupal e larval + pupal, com intervalo de confiança de bootstrap de 95% de um dia, 42 e 35 insetos são suficientes, respectivamente, para M. ochroloma e M. semilaevis.
RESUMEN
The objective of this research was to determine the sample size (number of seeds) to estimate the average of length, major and minor diameters and weight of seeds of jack bean (Canavalia ensiformis) and velvet bean (Stizolobium cinereum). In 300 seeds of jack bean and 300 seeds of velvet bean it was measured following characters: length, major and minor diameters and weight. It was calculated measures of central tendency and variability. After the hypothesis of equality between the means and homogeneity of variances, were tested. It was determined the sample size using resampling with replacement of 10,000 samples. For estimating the average of length, major and minor diameters and weight, with amplitude of confidence interval of 95%, equal 10% of average estimate, 117 and 66 seeds are sufficient, respectively, for jack bean and velvet bean.
O objetivo deste trabalho foi determinar o tamanho de amostra necessário para a estimação da média do comprimento, dos diâmetros maior e menor e da massa de sementes de feijão de porco (Canavalia ensiformis) e de mucuna cinza (Stizolobium cinereum). Em 300 sementes de feijão de porco e em 300 sementes de mucuna cinza, foram mensurados os seguintes caracteres: comprimento, diâmetros maior e menor e massa. Foram calculadas medidas de tendência central e de variabilidade. Após, foram testadas as hipóteses de igualdade entre as médias e de homogeneidade entre as variâncias. Foi determinado o tamanho de amostra por meio de reamostragem, com reposição de 10.000 amostras. Para a estimação da média do comprimento, dos diâmetros maior e menor e da massa, com intervalo de confiança de 95% igual a 10% da estimativa da média, 117 e 66 sementes são suficientes, respectivamente, para feijão de porco e mucuna cinza.