Resumo
The growth differentiation factor 9 (GDF9) gene plays a vital role in the growth and maturation of ovarian follicles in laying hens. However, its messenger ribonucleic acid (mRNA) expression levels in preovulatory ovarian follicles of indigenous chickens remain poorly understood. The study aimed to identify the association between egg weight and egg quality traits, ovarian follicles morphology, and mRNA expression levels of the GDF9 gene in pre-ovulatory ovarian follicles of the South African Potchefstroom Koekoek chicken breed. The correlation results showed that egg weight (EW) had a positively high significant correlation (p<0.01) with egg width (EWD), yolk weight (YW), shell surface area (SSA), albumen weight (AW), albumen ratio (AR) and egg volume (EV), and a positive significant correlation (p<0.05) with egg length (EL). The Student's T-test results revealed that the numbers of large yellow follicles were significantly lower (p<0.05) than those of small yellow follicles. ANOVA findings showed that there was a significant difference (p<0.05) in the average weight of the large yellow follicles. The quantitative Reverse Transcription Polymerase Chain Reaction (RT-qPCR) findings indicated that there were significant differences (p<0.05) in the mRNA expression levels of the GDF9 gene in preovulatory ovarian follicles of the Potchefstroom Koekoek chicken breed. The mRNA expression was more abundant in F1 and F4 than in other ovarian follicles.(AU)
Assuntos
Animais , Ovos/análise , Folículo Ovariano/anatomia & histologia , RNA Mensageiro/genética , Fator 9 de Diferenciação de CrescimentoResumo
ABSTRACT: This study analyzed the response of the Bartlett test as a function of sample size and to define the optimal sample size for the test with soybean grain yield data. Six experiments were conducted in a randomized block design with 20 or 30 cultivars and three repetitions. Grain yield was determined per plant, totaling 9,000 sampled plants. Next, sample scenarios of 1, 2, ..., 100 plants were simulated and the optimal sample size was defined via maximum curvature points. The increase in sampled plants per experimental unit favors Bartlett test's precision. Also, the sampling of 17 to 20 plants per experimental unit is enough to maintain the accuracy of the test.
RESUMO: Os objetivos deste estudo foram analisar a resposta do teste de Bartlett em função do tamanho de amostra e definir o tamanho amostral ótimo para o teste com dados de produtividade de grãos de soja. Foram conduzidos seis experimentos em delineamento de blocos ao acaso com 20 ou 30 cultivares e três repetições. A produtividade de grãos foi definida por planta, totalizando 9.000 plantas amostradas. Logo, foram simulados cenários amostrais de 1, 2, ..., 100 plantas e definido o tamanho amostral ótimo via pontos de máxima curvatura. O aumento de plantas amostradas por unidade experimental favorece a precisão do teste de Bartlett. Além disso, a amostragem de 17 a 20 plantas por unidade experimental é suficiente para manter a acurácia do teste.
Resumo
ABSTRACT: This study analyzed the interference of sample size on Tukey's test for non-additivity and found the sample size to optimize the test for soybean grain yield. Six experiments were conducted in a completely randomized block design with either 20 or 30 cultivars and three repetitions of each treatment. Grain yield was determined per plant, totaling 9,000 sampled plants. Next, sample scenarios up to 100 plants were simulated, estimating F statistic for a degree of freedom of the error in each scenario. After that, the optimal sample size was defined via power models and maximum curvature point. Results showed the number of sampled plants per experimental unit influences the estimates of Tukey's test for non-additivity. Also, the sampling of 14 to 19 plants per experimental unit allows for maintaining the accuracy of the test.
RESUMO: Os objetivos deste estudo foram analisar a interferência do tamanho amostral no teste de não aditividade de Tukey e encontrar o tamanho de amostra para otimizar o teste para a produtividade de grãos em soja. Seis experimentos em delineamento de blocos ao acaso foram conduzidos com 20 ou 30 cultivares de soja em três repetições de cada tratamento. A produtividade de grãos foi definida por planta, totalizando 9.000 plantas amostradas. A seguir, foram simulados cenários amostrais de até 100 plantas, estimando a estatística F para um grau de liberdade do erro em cada cenário. Após, foi definido o tamanho amostral ótimo via modelos de potência e pontos de máxima curvatura. Os resultados mostram que o número de plantas amostradas por unidade experimental influencia as estimativas do teste de não aditividade de Tukey. Além disso, a amostragem de 14 a 19 plantas por unidade experimental possibilita manter a acurácia do teste.
Resumo
This study analyzed the interference of sample size on Tukey's test for non-additivity and found the sample size to optimize the test for soybean grain yield. Six experiments were conducted in a completely randomized block design with either 20 or 30 cultivars and three repetitions of each treatment. Grain yield was determined per plant, totaling 9,000 sampled plants. Next, sample scenarios up to 100 plants were simulated, estimating F statistic for a degree of freedom of the error in each scenario. After that, the optimal sample size was defined via power models and maximum curvature point. Results showed the number of sampled plants per experimental unit influences the estimates of Tukey's test for non-additivity. Also, the sampling of 14 to 19 plants per experimental unit allows for maintaining the accuracy of the test.
Os objetivos deste estudo foram analisar a interferência do tamanho amostral no teste de não aditividade de Tukey e encontrar o tamanho de amostra para otimizar o teste para a produtividade de grãos em soja. Seis experimentos em delineamento de blocos ao acaso foram conduzidos com 20 ou 30 cultivares de soja em três repetições de cada tratamento. A produtividade de grãos foi definida por planta, totalizando 9.000 plantas amostradas. A seguir, foram simulados cenários amostrais de até 100 plantas, estimando a estatística F para um grau de liberdade do erro em cada cenário. Após, foi definido o tamanho amostral ótimo via modelos de potência e pontos de máxima curvatura. Os resultados mostram que o número de plantas amostradas por unidade experimental influencia as estimativas do teste de não aditividade de Tukey. Além disso, a amostragem de 14 a 19 plantas por unidade experimental possibilita manter a acurácia do teste.
Assuntos
Glycine max , Análise de Variância , Tamanho da AmostraResumo
This study analyzed the response of the Bartlett test as a function of sample size and to define the optimal sample size for the test with soybean grain yield data. Six experiments were conducted in a randomized block design with 20 or 30 cultivars and three repetitions. Grain yield was determined per plant, totaling 9,000 sampled plants. Next, sample scenarios of 1, 2, ..., 100 plants were simulated and the optimal sample size was defined via maximum curvature points. The increase in sampled plants per experimental unit favors Bartlett test's precision. Also, the sampling of 17 to 20 plants per experimental unit is enough to maintain the accuracy of the test.
Os objetivos deste estudo foram analisar a resposta do teste de Bartlett em função do tamanho de amostra e definir o tamanho amostral ótimo para o teste com dados de produtividade de grãos de soja. Foram conduzidos seis experimentos em delineamento de blocos ao acaso com 20 ou 30 cultivares e três repetições. A produtividade de grãos foi definida por planta, totalizando 9.000 plantas amostradas. Logo, foram simulados cenários amostrais de 1, 2, ..., 100 plantas e definido o tamanho amostral ótimo via pontos de máxima curvatura. O aumento de plantas amostradas por unidade experimental favorece a precisão do teste de Bartlett. Além disso, a amostragem de 17 a 20 plantas por unidade experimental é suficiente para manter a acurácia do teste.
Assuntos
Glycine max/crescimento & desenvolvimento , 24444 , Análise de VariânciaResumo
The objective of this study was to apply multivariate techniques, canonical discriminant analysis, and multivariate contrasts, indicating the most favorable inferences in the evaluation of pure lines of beans. The study was conducted at the experimental field of the Institute for Breeding and Molecular Genetics, in Lages, SC, Brazil. The experiment was composed of 24 pure lines of beans from the Santa Catarina test of cultivars. Plant height, numbers of pods and grains per plant, and stem diameter were the variables measured. The complete randomized block design was used with four replications. The data were subjected to multivariate analysis of variance, canonical discriminant analysis, multivariate contrasts and univariate contrasts. The first canonical discriminant function has captured 81% of the total variation in the data. The Scott-Knott test showed two groups of inbred lines at the average -of scores of the first canonical discriminant function. It was considered that testing hypotheses with the canonical scores may result in loss of information obtained from the original data. Multivariate contrasts indicated differences within the group formed by the Scott-Knott test. The canonical discriminant analysis and multivariate contrasts are excellent techniques to be combined in the multivariate assessment, being used to explore and test hypotheses, respectively.(AU)
O objetivo deste estudo foi aplicar técnicas multivariadas (análise discriminante canônica e contrastes multivariados) indicando as inferências mais vantajosas na avaliação de linhas puras de feijão. O estudo foi conduzido na área experimental do Instituto de Melhoramento e Genética Molecular em Lages, SC. O experimento foi composto por 24 linhas puras de feijão provenientes do ensaio catarinense de cultivares. Os caracteres mensurados foram: estatura da planta, números de legumes e grãos por planta e diâmetro do caule. Foi usado o delineamento experimental em blocos casualizados, com quatro repetições. Os dados foram submetidos à análise de variância multivariada, análise discriminante canônica, contrastes multivariados e univariados. A primeira função linear discriminante canônica captou 81% da variação total contida nos dados. O teste de Scott-Knott formou dois grupos de linhas puras na média dos escores da primeira função linear discriminante canônica. Considera-se que testar as hipóteses com os escores canônicos pode causar perda de informações valiosas obtidas pelos dados originais. Os contrastes multivariados evidenciaram diferenças dentro do grupo formado pelo teste de Scott-Knott. A análise discriminante canônica e os contrastes multivariados são técnicas excelentes para serem combinadas na avaliação multivariada, sendo efetuadas para explorar e testar hipóteses, respectivamente.(AU)
Assuntos
Fabaceae , Análise de VariânciaResumo
This study aims to discuss and explain how to deal with the analysis of experiments conducted in completely randomized design (CRD) and subdivided into double factorial with additional treatment in the plot. In addition it was illustrate the discussion by analyzing data from an experiment on post-harvest of Niagara grapes. The sums of squares for each source of variation are presented, while discussing how the additional treatment affects the whole variation. Niagara grapes were treated in the pre-harvest with three preservatives (calcium chloride, calcium nitrate and calcium lactate) at 0%, 0.5%, 1% and 2% and stored for 0, 10, 20 and 30 days.All the preservatives evaluated at 0% represented the control (additional) treatment.(AU)
Este trabalho tem como objetivos discutir e explicitar como se dá a análise de experimentos conduzidos em delineamento inteiramente casualizado (DIC) e esquema fatorial duplo subdividido com tratamento adicional na parcela, além de ilustrar a discussão com um experimento de pós-colheita de uvas Niágara. São apresentadas as somas de quadrados de cada fonte de variação, enquanto se discute como o tratamento adicional afeta a variação total. Uvas Niágara foram tratadas napré-colheita com os seguintes conservantes: cloreto de cálcio, nitrato de cálcio e lactato de cálcio, nas doses 0%, 0,5%, 1% e 2%; e armazenadas nos tempos 0, 10, 20 e 30 dias, em que a dose 0% todos os conservantes caracteriza o tratamento controle (adicional).(AU)
Assuntos
Vitis , Análise de Variância , 24444 , Conservação de Alimentos , Armazenamento de AlimentosResumo
O aplicativo computacional para a análise de dados de experimentos executados no delineamento blocos ao acaso, por meio do método usual e de Papadakis, foi desenvolvido em sua primeira versão (não publicada), na linguagem de programação Pascal. Considerando que o método de Papadakis foi eficiente para as principais culturas agrícolas (milho, soja, feijão e trigo) e, para tornar o aplicativo mais amigável, a versão em Pascal foi reprogramada em Java, cuja denominação é DelPapa. Este aplicativo
The software tool for data analysis from experiments performed in a randomized block design, by the usual manner and by the Papadakis method, was developed in its first version (unpublished), in the Pascal programming language. Whereas the Papadakis method was efficient for the major crops (corn, soybeans, beans and wheat) and because of its friendly software tools, the Pascal version was reprogrammed in Java, whose name is DelPapa. This software tools
Assuntos
Aplicativos Móveis , Análise de Dados , Interpretação Estatística de DadosResumo
Esse trabalho buscou por meio da análise de fatores, a redução da dimensionalidade de um banco de dados de características quantitativas de suínos e avaliar por meio das variáveis latentes obtidas, as progênies de suínos provenientes de três diferentes grupos genéticos submetidos a três planos nutricionais, por meio da análise de variância. Foram utilizadas 29 variáveis quantitativas de suínos machos castrados e fêmeas provenientes de experimento realizado na Unidade de Ensino, Pesquisa e Extensão em Melhoramento de Suínos, do Departamento de Zootecnia da Universidade Federal de Viçosa (UFV), Viçosa - MG. Os dados foram coletados a partir de 102 animais, sendo 50 fêmeas e 52 machos castrados, de três grupos genéticos formados por suínos cruzados Piau, Duroc e Pietrain, submetidos a três planos nutricionais (baixo, médio e alto nível de lisina). A análise de fatores foi capaz de extrair 5 fatores com sentido biológico relacionados ao Desempenho (6 variáveis), Qualidade de carcaça (7 variáveis), Rendimento de carcaça (2 variáveis), Qualidade da carne (3 variáveis) e pH inicial (2 variáveis). Esses fatores foram considerados como novas variáveis quantitativas e utilizados na avaliação dos efeitos de grupos genéticos, plano nutricional e sexo, por meio da análise de variância, a qual considerou os referidos efeitos e suas interações. Foi verificada interação (p=0,036) entre grupo genético e sexo para Desempenho, em que os machos cruzados Duroc apresentaram os melhores escores se comparados aos Piau e os suínos cruzados Duroc se destacaram entre as fêmeas avaliadas. O grupo genético Pietrain apresentou melhores médias em Qualidade de carcaça (p<0,001), por outro lado, suínos cruzados Piau obtiveram melhores médias para Qualidade da carne (p=0,005) se comparados as Pietrain. Os suínos cruzados Pietrain foram superiores em relação aos Duroc para Rendimento de carcaça (p=0,001). O plano nutricional com baixo nível de lisina obteve pior Desempenho (p=0,020). Rendimento de carcaça foi afetado pelos planos nutricionais (p=0,010), em que o médio nível de lisina obteve melhor resultado se comparado ao baixo nível de fornecimento deste aminoácido. Para Qualidade da carne, o plano nutricional com alto nível de lisina foi melhor se comparado ao baixo (p=0,001). O pH inicial (p=0,002) expressou melhores médias ao se utilizar os planos nutricionais com baixo e médio níveis de lisina na composição da dieta. O sexo dos suínos apresentou efeito significativo para Qualidade de carcaça (p=0,001), sendo que as fêmeas apresentaram média maior que os machos. A redução da dimensionalidade dos dados permitiu a avaliação conjunta de grupo genético, plano nutricional e sexo por meio de novas variáveis latentes que representaram o conjunto de dados originais.
The aim of the present work was to reduce the dimensionality of a quantitative traits dataset from pigs using multivariate factor analysis, as well as take the latent traits obtained to evaluate the pig progenies from three different genetic groups, submitted to three different nutritional plans, using the analysis of variance. Twenty nine quantitative traits from borrows and gilts were used, in which pigs were from an experiment performed in the Teaching, Research and Extension Unit in Pig Breeding, from the Departamento de Zootecnia da Universidade Federal de Viçosa (acronym UFV), Viçosa MG, Brazil. Data were taken from 102 animals (52 borrows and 50 gilts) of three genetic groups, Piau, Duroc and Pietrain crossbreeds, submitted to three different nutritional plans (low, medium and high lysine levels). The multivariate factor analysis extracted 5 factors with biological significance related to Performance (6 traits), Carcass quality (7 traits), Carcass yield (2 traits), Meat quality (3 traits) and Initial pH (2 traits). The factors were taken as new quantitative traits and used to evaluate the effects of the genetic group, nutritional plan and sex through the analysis of variance, considering these effects and its interactions. Regarding the Performance, interaction between genetic group and sex was statistically significant (p=0.036), in which borrows of Duroc crossbreed showed higher scores than those of Piau crossbreed and gilts exhibited better results with Duroc crossbreed. The Pietrain genetic group showed the best means for Carcass quality (p<0.001); however, Piau crossbreeds had better means for Meat quality (p=0.005) when compared to Pietrain crossbreed. Pietrain crossbreed was better than Duroc crossbreed in Carcass yield (p=0.001). The nutritional plan with low lysine level (p=0.020) represented the lowest Performace. Carcass yield was affected by nutricional plans (p=0.010), in wich the medium lysine level obtained a better result when compared to the low lysine level. The high lysine level showed a better result in Meat quality (p=0.001) than low lysine level. Inicial pH expressed better means for nutricional plans with low and medium lysine levels (p=0.002) The sex had significant effect for Carcass quality (p=0.001), where females showed higher means than those of males. The reduction in the data dimensionality, allowed an integrative evaluation of genetic group, nutritional plan and sex based on new latent traits that represented the original dataset.
Resumo
O objetivo deste trabalho foi avaliar geneticamente as características de peso e reprodução de aves de postura, qualidade do ovo e taxas de produção de ovos da 19ª a 70ª semana de idade de linhagens de poedeiras das raças Rhode Island Red (GG e MM) e Plymouth Rock White (SS). Os registros foram provenientes do Centro Nacional de Pesquisa em Aves e Suínos da Empresa Brasileira de Pesquisa Agropecuária (CNPSA/EMBRAPA). Os valores genéticos e as estimativas de herdabilidades para cada característica dentro de cada linhagem foram obtidos através de um modelo animal univariado. As características que explicam a maior parte da variação genética deste banco de dados foram identificadas utilizando análise de Componentes Principais, correlação de posição de Spearman e, posteriormente, foram criadas Funções Discriminantes de Fisher. Através da análise de componentes principais, as características de qualidade que explicaram a maior parte da variação genética dos dados foram a densidade (D36), peso (PO36) e relação comprimento x largura (R36) do ovo medidas na 36ª semana de produção. As características produtivas que melhor representaram a taxa de produção total foram: as taxas de produções acumuladas nas 50ª (TA50) e 60ª (TA60) semanas e a taxa de produção parcial da 23ª a 40ª semana (TP23a40). Através da obtenção das funções discriminantes de Fisher (FDFs) para ambos os sexos nas três linhagens estudadas, foi possível observar que as características produtivas (taxas de postura) foram as mais importantes na composição da Função. Observou-se maiores correlações entre a FDF1 e FDF3 (variando de 0,97 a 0,99); seguida da FDF1 e FDF2 (variando de 0,86 a 0,94). Foi realizada seleção de 20% dos animais geneticamente superiores da última geração, e a coincidência de animais selecionados nas diferentes FDFs com a FDF1 foi apresentada em forma de porcentagem. Pode-se observar que a função FDF3 selecionou 100% de machos em comum com os selecionados pela FDF1, nas linhagens MM e SS. A FDF3 apresentou maior coincidência em todas as linhagens e sexos com a FDF1. Dessa forma, as variáveis identificadas como mais representativas são a D36, PO36 e R36 juntamente com a TA60, e a função discriminante de Fisher que considera o conjunto dessas características é eficiente para antecipar a seleção dos animais.
The objective of this work was to evaluate genetically the individual performance characteristics of laying hens, egg quality and rates of egg production from the 19th to the 70th week of age of lines of hens of the Rhode Island Red (GG and MM) and Plymouth Rock White (SS). The data set used came from the Centro Nacional de Pesquisa de Suínos e Aves of the Empresa Brasileira de Pesquisa Agropecuária (CNPSA/EMBRAPA). The genetic values and estimates of heritabilities for each trait within each lineage were obtained through a univariate animal model. The characteristics that explain most of the genetic variation of this database were identified using Principal Component analysis, Spearman's position correlation, and later Fisher's Discriminant Functions were created. Through the principal components analysis, the quality characteristics that explained most of the genetic variation of the data were the density (D36), weight (PO36) and length x width ratio (R36) of the egg measured at the 36th week of production. The production characteristics that best represented the total production rate were: the production rates accumulated at the 50th (TA50) and 60th (TA60) weeks and the partial production rate from the 23rd to the 40th week (TP23a40). By obtaining the Fisher's discriminant functions (FDFs) for both sexes in the three lines studied, it was possible to observe that the productive characteristics (posture rates) were the most important in the composition of the Function. Higher correlations were observed between FDF1 and FDF3 (ranging from 0.97 to 0.99); followed by FDF1 and FDF2 (ranging from 0.86 to 0.94). A selection of 20% of the genetically superior animals of the last generation was performed, and the coincidence of selected animals in the different FDFs with FDF1 was presented as a percentage. It can be observed that the FDF3 function selected 100% of males in common with those selected by FDF1, in the MM and SS lines. The FDF3 presented greater coincidence in all lineages and sexes with FDF1. Thus, the variables identified as most representative are D36, PO36 and R36 along with TA60, and the Fisher discriminant function that considers all these characteristics is efficient to anticipate the selection of the animals.
Resumo
Este estudo foi realizado com o objetivo de determinar o poder do teste F em Análise de Variância (ANOVA) para experimentos com bovinos de corte, determinar o tamanho ideal de amostra e classificar o coeficiente de variação. Os dados foram utilizados de dissertações e teses publicadas do Programa de Pós-Graduação em Zootecnia da Universidade Federal de Santa Maria (PPGZ-UFSM) nos anos de 1991 à 2012, na área de bovinocultura de corte empregando ANOVA. O poder do teste foi determinado assumindo distribuição F de Fisher não central sob hipótese alternativa para a estatística de teste F na ANOVA. O número de repetições por tratamentos foi estimado com base no poder do teste de 80% e o intervalo [0,4 ; 2,0] para o tamanho do efeito. A classificação do coeficiente de variação foi baseada nas metodologias propostas por Garcia (1989) usando média e desvio padrão, e Costa et al. (2002) utilizando mediana e pseudo-sigma. As estimações de poder do teste apresentaram picos de frequências de alto e baixo poder. O número médio recomendado de repetições por tratamentos oscilou entre 7 e 10 repetições. Foi proposta a classificação do coeficiente de variação em baixo, médio e alto, diferindo da classificação da literatura que considera os intervalos baixo, médio, alto e muito alto.
This study was conducted to estimate power of tests in Analysis of Variance (ANOVA) in beef cattle experiments, determine sample size and classify the coefficient of variation. Data was collected from thesis and dissertations of the Program of Post-Graduation in Animal Science of Federal University of Santa Maria (PPGZ-UFSM) among the years of 1991 to 2012, in beef cattle production area using ANOVA. Power was estimated by assumption of non central F distribution to the alternative hypothesis in ANOVA. The number of replications for treatments was estimated by power of 80% and interval of [0,4 ; 2,0] to effect size. Classification of coefficient of variation was based on proposed by Garcia (1989) using mean and standard deviation, and Costa et al. (2002) using median and pseudo-sigma. Power of tests shows two frequency peaks of experiments with low and high power. The recommended average number of replication per treatments was among 7 and 10 replications. Classification of coefficient of variation was proposed by low, medium and high, differently from literature that considers the intervals low, medium, high and very high.
Resumo
When experimental data are submitted to analysis of variance, the assumption of data homoscedasticity (variance homogeneity among treatments), associated to the adopted mathematical model must be satisfied. This verification is necessary to ensure the correct test for the analysis. In some cases, when data homoscedascity is not observed, errors may invalidate the analysis. An alternative to overcome this difficulty is the application of the specific residue analysis, which consists of the decomposition of the residual sum of squares in its components, in order to adequately test the correspondent orthogonal contrasts of interest between treatment means. Although the decomposition of the residual sum of squares is a seldom used procedure, it is useful for a better understanding of the residual mean square nature and to validate the tests to be applied. The objective of this review is to illustrate the specific residue application as a valid and adequate alternative to analyze data from experiments following completely randomized and randomized complete block designs in the presence of heteroscedasticity.
Ao realizar-se a análise da variância de um conjunto de dados, pressupõe-se que o critério de homocedasticidade (homogeneidade de variâncias entre tratamentos), associada ao modelo matemático adotado, seja satisfeito. Esta verificação se faz necessária para a correta aplicação dos testes de significância. Quando não é satisfeita, em certos casos, compromete a normalidade dos erros. Uma alternativa para contornar essa deficiência é a aplicação do resíduo específico, que consiste em decompor a soma de quadrados do resíduo em componentes, correspondentes aos contrastes ortogonais de interesse, apropriados para testar cada contraste ortogonal entre médias de tratamentos. A decomposição da soma de quadrados do resíduo é um procedimento pouco utilizado, mas é útil para melhor compreensão da natureza do quadrado médio residual e garantir a validade dos testes aplicados. Nessa revisão avaliou-se a aplicação dos resíduos específicos como alternativa válida e adequada, na análise de dados obtidos de experimentos que seguem a estrutura dos delineamentos inteiramente casualizados e em blocos casualizados, na presença da heterocedasticidade.
Resumo
When experimental data are submitted to analysis of variance, the assumption of data homoscedasticity (variance homogeneity among treatments), associated to the adopted mathematical model must be satisfied. This verification is necessary to ensure the correct test for the analysis. In some cases, when data homoscedascity is not observed, errors may invalidate the analysis. An alternative to overcome this difficulty is the application of the specific residue analysis, which consists of the decomposition of the residual sum of squares in its components, in order to adequately test the correspondent orthogonal contrasts of interest between treatment means. Although the decomposition of the residual sum of squares is a seldom used procedure, it is useful for a better understanding of the residual mean square nature and to validate the tests to be applied. The objective of this review is to illustrate the specific residue application as a valid and adequate alternative to analyze data from experiments following completely randomized and randomized complete block designs in the presence of heteroscedasticity.
Ao realizar-se a análise da variância de um conjunto de dados, pressupõe-se que o critério de homocedasticidade (homogeneidade de variâncias entre tratamentos), associada ao modelo matemático adotado, seja satisfeito. Esta verificação se faz necessária para a correta aplicação dos testes de significância. Quando não é satisfeita, em certos casos, compromete a normalidade dos erros. Uma alternativa para contornar essa deficiência é a aplicação do resíduo específico, que consiste em decompor a soma de quadrados do resíduo em componentes, correspondentes aos contrastes ortogonais de interesse, apropriados para testar cada contraste ortogonal entre médias de tratamentos. A decomposição da soma de quadrados do resíduo é um procedimento pouco utilizado, mas é útil para melhor compreensão da natureza do quadrado médio residual e garantir a validade dos testes aplicados. Nessa revisão avaliou-se a aplicação dos resíduos específicos como alternativa válida e adequada, na análise de dados obtidos de experimentos que seguem a estrutura dos delineamentos inteiramente casualizados e em blocos casualizados, na presença da heterocedasticidade.
Resumo
Statistics may be intricate. In practical data analysis many researchers stick to the most common methods, not even trying to find out whether these methods are appropriate for their data and whether other methods might be more useful. In this paper I attempt to show that when analyzing even simple one-way factorial experiments, a lot of issues need to be considered. A classical method to analyze such data is the analysis of variance, quite likely the most often used statistical method in agricultural, biological, ecological and environmental studies. I suspect this is why this method is quite often applied inappropriately: since the method is that common, it does not require too much consideration-this is how some may think. An incorrect analysis may provide false interpretation and conclusions, so one should pay careful attention to which approach to use in the analysis. I do not mean that one should apply difficult or complex statistics; I rather mean that one should apply a correct method that offers what one needs. So, various problems concerned with the analysis of variance and other approaches to analyze such data are discussed in the paper, including checking within-group normality and homocedasticity, analyzing experiments when any of these assumptions is violated, outliers presence, multiple comparison procedures, and other issues.
Realizar análises estatísticas pode ser complicado. Em situações práticas muitos pesquisadores utilizam os procedimentos de análise mais comuns, sem investigar se os mesmos são apropriados para os seus resultados, ou mesmo se há outros métodos que poderiam ser mais adequados. Nesse artigo buscarei mostrar que mesmo na análise de experimentos de classificação simples (com um único fator) vários aspectos precisam ser considerados. A forma clássica de análise desse tipo de dados é a análise de variância, que é provavelmente o método estatístico mais usado na agricultura, biologia, ecologia e estudos de meio ambiente. Suspeito que essa é a razão pela qual tal método é frequentemente usado de forma inapropriada: uma vez que ele é muito usado, não suscita maiores considerações. Imagino que seja esse raciocínio que muitos pesquisadores devam empregar. Análises incorretas podem fornecer falsas interpretações e conclusões, e dessa forma é importante prestar atenção na escolha do procedimento a ser usado na análise. Não estou sugerindo que algum método difícil ou complexo deva ser usado, mas sim que um método correto seja adotado, de forma a fornecer os resultados adequados. Dessa forma, vários problemas relacionados à análise de variância e outras abordagens para analisar esse tipo de dados são discutidas nesse artigo, incluindo verificações de normalidade e homogeneidade de variâncias, análise de experimentos com violação dessas pressuposições, presença de dados discrepantes, testes de comparações múltiplas, além de alguns outros problemas.
Resumo
Statistics may be intricate. In practical data analysis many researchers stick to the most common methods, not even trying to find out whether these methods are appropriate for their data and whether other methods might be more useful. In this paper I attempt to show that when analyzing even simple one-way factorial experiments, a lot of issues need to be considered. A classical method to analyze such data is the analysis of variance, quite likely the most often used statistical method in agricultural, biological, ecological and environmental studies. I suspect this is why this method is quite often applied inappropriately: since the method is that common, it does not require too much consideration-this is how some may think. An incorrect analysis may provide false interpretation and conclusions, so one should pay careful attention to which approach to use in the analysis. I do not mean that one should apply difficult or complex statistics; I rather mean that one should apply a correct method that offers what one needs. So, various problems concerned with the analysis of variance and other approaches to analyze such data are discussed in the paper, including checking within-group normality and homocedasticity, analyzing experiments when any of these assumptions is violated, outliers presence, multiple comparison procedures, and other issues.
Realizar análises estatísticas pode ser complicado. Em situações práticas muitos pesquisadores utilizam os procedimentos de análise mais comuns, sem investigar se os mesmos são apropriados para os seus resultados, ou mesmo se há outros métodos que poderiam ser mais adequados. Nesse artigo buscarei mostrar que mesmo na análise de experimentos de classificação simples (com um único fator) vários aspectos precisam ser considerados. A forma clássica de análise desse tipo de dados é a análise de variância, que é provavelmente o método estatístico mais usado na agricultura, biologia, ecologia e estudos de meio ambiente. Suspeito que essa é a razão pela qual tal método é frequentemente usado de forma inapropriada: uma vez que ele é muito usado, não suscita maiores considerações. Imagino que seja esse raciocínio que muitos pesquisadores devam empregar. Análises incorretas podem fornecer falsas interpretações e conclusões, e dessa forma é importante prestar atenção na escolha do procedimento a ser usado na análise. Não estou sugerindo que algum método difícil ou complexo deva ser usado, mas sim que um método correto seja adotado, de forma a fornecer os resultados adequados. Dessa forma, vários problemas relacionados à análise de variância e outras abordagens para analisar esse tipo de dados são discutidas nesse artigo, incluindo verificações de normalidade e homogeneidade de variâncias, análise de experimentos com violação dessas pressuposições, presença de dados discrepantes, testes de comparações múltiplas, além de alguns outros problemas.
Resumo
This research was aimed at evaluating and identifing which type of sum of squares can be more appropriate to test hypotheses and also presenting appropriate alternatives to solution of problems through the analysis of mean square expected values used in the methodology of mixed linear models. The analysis of mean square expected values can be a tool of great importance in analysis of data as incomplete (empty casela) as unbalanced experiment. Therefore, four examples were used each one with its pecualiarity concerning the complete or incomplete experiment with balanced or unbalanced data and in the presence of empty casela. The SAS statistical package, version Learning Edition, was used to analyze the experiments. The result of the analysis of mean square expected values indicated that the sum of squares of the type I can be used only at of condition of completely balanced data. These results indicated on the other hand, that the sum of squares of the type III is the most appropriate type for unbalanced data. The sum of squares of the type II and IV are the most important in the case of empty caselas; fact that supports the idea of a necessity of always evaluating the mean square expected values.
Este trabalho teve como objetivo avaliar e identificar qual o tipo de soma de quadrados mais apropriada para testar hipóteses de interesse, assim como discutir alternativas mais adequadas para a solução de inconvenientes expressos por meio da análise da esperança matemática dos quadrados médios utilizados em modelos lineares mistos. A análise das esperanças matemáticas dos quadrados médios pode ser uma ferramenta de grande importância nas inferências a partir de dados experimentais, tanto incompletos (casela vazia) quanto não-balanceados. Desta forma, foram utilizados quatro exemplos, cada qual com sua peculiaridade em função do experimento ser completo ou incompleto com dados balanceados ou não-balanceados e na presença de casela vazia. O pacote estatístico SAS, versão Learning Edition, foi empregado para analisar os experimentos. O resultado da análise das esperanças matemáticas dos quadrados médios indicou que a soma de quadrados do tipo I somente apresentou condições de ser utilizada em presença de dados completamente balanceados. De modo contrário, os resultados apontam que a soma de quadrados tipo III é a soma de quadrados mais apropriada no caso de dados não-balanceados. As somas de quadrados tipo II e IV são as mais importantes no caso de caselas vazias, fato que corrobora a necessidade de avaliar sempre as esperanças matemáticas dos quadrados médios.
Resumo
This research was aimed at evaluating and identifing which type of sum of squares can be more appropriate to test hypotheses and also presenting appropriate alternatives to solution of problems through the analysis of mean square expected values used in the methodology of mixed linear models. The analysis of mean square expected values can be a tool of great importance in analysis of data as incomplete (empty casela) as unbalanced experiment. Therefore, four examples were used each one with its pecualiarity concerning the complete or incomplete experiment with balanced or unbalanced data and in the presence of empty casela. The SAS statistical package, version Learning Edition, was used to analyze the experiments. The result of the analysis of mean square expected values indicated that the sum of squares of the type I can be used only at of condition of completely balanced data. These results indicated on the other hand, that the sum of squares of the type III is the most appropriate type for unbalanced data. The sum of squares of the type II and IV are the most important in the case of empty caselas; fact that supports the idea of a necessity of always evaluating the mean square expected values.
Este trabalho teve como objetivo avaliar e identificar qual o tipo de soma de quadrados mais apropriada para testar hipóteses de interesse, assim como discutir alternativas mais adequadas para a solução de inconvenientes expressos por meio da análise da esperança matemática dos quadrados médios utilizados em modelos lineares mistos. A análise das esperanças matemáticas dos quadrados médios pode ser uma ferramenta de grande importância nas inferências a partir de dados experimentais, tanto incompletos (casela vazia) quanto não-balanceados. Desta forma, foram utilizados quatro exemplos, cada qual com sua peculiaridade em função do experimento ser completo ou incompleto com dados balanceados ou não-balanceados e na presença de casela vazia. O pacote estatístico SAS, versão Learning Edition, foi empregado para analisar os experimentos. O resultado da análise das esperanças matemáticas dos quadrados médios indicou que a soma de quadrados do tipo I somente apresentou condições de ser utilizada em presença de dados completamente balanceados. De modo contrário, os resultados apontam que a soma de quadrados tipo III é a soma de quadrados mais apropriada no caso de dados não-balanceados. As somas de quadrados tipo II e IV são as mais importantes no caso de caselas vazias, fato que corrobora a necessidade de avaliar sempre as esperanças matemáticas dos quadrados médios.
Resumo
The single degree of freedom of orthogonal contrasts is a useful technique for the analysis of experimental data and helpful in obtaining estimates of main, nested and interaction effects, for mean comparisons between groups of data and in obtaining specific residuals. Furthermore, the application of orthogonal contrasts is an alternative way of doing statistical analysis on data from non-conventional experiments, whithout a definite structure. To justify its application, an extensive review is made on the definitions and concepts involving contrasts.
A técnica de contrastes ortogonais com um grau de liberdade é simples e bastante eficiente na análise de dados experimentais, como por exemplo, na obtenção de efeitos principais, de efeito de interação e de efeitos aninhados, nas comparações entre grupos de médias e na obtenção dos resíduos específicos. Além disso, sua aplicação tem revelado ser uma forma alternativa para análise de dados obtidos de um experimento que não segue uma estrutura definida. Com o objetivo de justificar a sua aplicação, foi realizada uma revisão sobre as definições e os conceitos envolvendo contrastes.
Resumo
The single degree of freedom of orthogonal contrasts is a useful technique for the analysis of experimental data and helpful in obtaining estimates of main, nested and interaction effects, for mean comparisons between groups of data and in obtaining specific residuals. Furthermore, the application of orthogonal contrasts is an alternative way of doing statistical analysis on data from non-conventional experiments, whithout a definite structure. To justify its application, an extensive review is made on the definitions and concepts involving contrasts.
A técnica de contrastes ortogonais com um grau de liberdade é simples e bastante eficiente na análise de dados experimentais, como por exemplo, na obtenção de efeitos principais, de efeito de interação e de efeitos aninhados, nas comparações entre grupos de médias e na obtenção dos resíduos específicos. Além disso, sua aplicação tem revelado ser uma forma alternativa para análise de dados obtidos de um experimento que não segue uma estrutura definida. Com o objetivo de justificar a sua aplicação, foi realizada uma revisão sobre as definições e os conceitos envolvendo contrastes.
Resumo
The General Linear Models Procedure (PROC GLM) of the Statistical Analysis Sistem (SAS), presents four types of sums of squares for testing hypothesis on unbalanced data. These sums of squares are obtained from estimated functions built by SAS. The used mechanisms for the building up of these four types of estimated functions are illustred and discussed with numerical examples, step by step.
o procedimento GLM do sistema estatístico SAS apresenta quatro tipos de somas de quadrados para testar hipóteses sobre dados desbalanceados. Essas somas de quadrados são obtidas a partir de funções estimáveis construídas pelo SAS. Os mecanismos usados para a construção desses quatro tipos de funções estimáveis são aqui discutidas e ilustradas, passo a passo, em exemplos numéricos.