Your browser doesn't support javascript.
loading
PREDICTION OF GENOMIC-ENABLED BREEDING VALUES AND GENOME-WIDE ASSOCIATION STUDY FOR FEEDLOT AVERAGE DAILY WEIGHT GAIN IN NELORE CATTLE
Thesis em En | VETTESES | ID: vtt-205039
Biblioteca responsável: BR68.1
RESUMO
Selection for fast growth rates using number of days to achieve specific weights or average weight gain would result in shorter production periods. Maintaining the rate of productivity increasing will demand, among other factors, genetically improved animals in both pasture and feedlot systems. Besides, genomic information could be used to predict genomic-enabled breeding values (GEBVs) earlier in animals' life, which would reduce generation intervals and increase productivity gains. Numerous studies have been conducted in order to identify appropriate methodologies to specific breeds and traits, which will result in more accurate GEBVs. The aim of this study was to compare the prediction accuracy of GEBVs and the ability to identify genomic regions and genes related to average weight daily gain in Nelore cattle, by applying different regression models and genotypes densities datasets. Genomic and phenotypic information of 804 steers born in three season, offspring of 34 bulls, were used to predict GEBVs through three models (Bayesian GBLUP, BayesA and BayesC ), four genotypic densities (Illumina BovineHD BeadChip, TagSNPs, GeneSeek Genomic Profiler High (HDi) and Low (LDi) density indicus) and two adjusted phenotypes. Family structure was accounted by using principal component analysis. Animals were assigned either to training (seasons 1 and 2) or testing (season 3) subsets to perform the cross-validation analysis. Estimates of Pearson correlation, regression coefficients and mean squared errors were used to access accuracy, inflation and bias of the estimated GEBVs, respectively. Genome-wide association study (GWAS) was also performed on above datasets, however, results were compared based on model complexity (pD) and deviance information criterion (DIC). SNP effects greater that upper limit of the 99.9% highest posterior interval were considered significant and genes located 25kb up or downstream were assigned to them. These genes were then, submitted to functional annotation clustering using DAVID database. Overall, accounting for family structure did not affect accuracy, but it seems having an effect on bias and inflation of predictions. Regarding to prediction of GEBVs, BayesC models produced the less biased and inflated results for the considered adjusted phenotypes. Furthermore, results from Bos taurus indicus-based chips were as informative as those from Illumina BovineHD, which could be an alternative in implementing genomic selection at lower costs. In relation to GWAS, BayesC model fitted better to the data, except for TagSNPs. A total of 11, 32 and 236 genes were found for LDi, HDi and 770k datasets, respectively, and the functional annotation assigned 3 genes to 1 cluster (LDi), 4 genes to 1 cluster and 35 genes to 3 (770k) enriched clusters. Five genes in common were found through all datasets SYT1 (BTA 5), EYA2 (BTA 13), ZFHX4, MATN2 and CPQ (BTA 14). In general, the phenotype is a complex trait controlled by many genes and the model BayesC , which accounts for this performs better. Further investigations should account for the influence of the relationship between training and testing dataset.
ABSTRACT
A seleção para taxa de crescimento utilizando o número de dias para atingir determinado peso ou ganho de peso médio resultaria em menores ciclos de produção. Manter o aumento da produtividade exige, entre outros fatores, a utilização de animais melhorados, tanto nos sistemas de pastagem quanto de confinamento. Além disso, as informações genômicas podem ser usadas para predizer os valores genéticos genômicos (GEBVs) mais cedo na vida dos animais, o que reduziria os intervalos de geração e aumentaria os ganhos de produtividade. Inúmeros trabalhos tem sido conduzidos para identificar metodologias apropriadas à determinadas raças e características, o que irá resultar em GEBVs mais acurados. Os objetivos deste estudo foram comparar a acurácia de predição dos GEBVs e a habilidade de identificar regiões genômicas e genes relacionados ao ganho de peso médio diário em bovinos da raça Nelore, pela aplicação de diferentes modelos de regressão e densidades genotípicas. Informações genômica e fenotípica de 804 novilhos nascidos em três safras, filhos de 34 touros, foram utilizadas para predizer GEBVs por meio de três modelos (Bayesian GBLUP, BayesA e BayesC ), quatro densidades genotípicas (Illumina BovineHD BeadChip, TagSNPs, GeneSeek indicus de alta (HDi) e baixa (LDi) densidades) e dois fenótipos ajustados. A estrutura de família foi considerada por meio da análise de componentes principais. Os animais foram distribuídos em subconjunto de treinamento (safras 1 e 2) ou validação (safra 3) para realização da análise de validação cruzada. Estimativas de correlação de Pearson, coeficientes de regressão e erro quadrado médio foram usados para avaliar acurácia, inflação e viés dos GEBVs estimados, respectivamente. O estudo de associação ampla do genoma (GWAS) também foi realizado nos mesmos conjuntos de dados, entretanto, os resultados foram comparados com base na complexidade do modelo (pD) e no critério de informação do desvio (DIC). Os SNPs com efeitos maiores que o limite superior do intervalo de maior densidade a posteriori, com 99,9% de probabilidade, foram considerados significativos e, genes distantes 25kb de ambos os lados do SNP, foram relacionados. Esses genes foram submetidos ao agrupamento de anotação funcional no banco de dados DAVID. Em geral, a inclusão de informação de estrutura de família no modelo não afetou a acurácia, mas parece ter tido efeitos no viés e inflação das predições. Em relação a predição dos GEBVs, o modelo BayesC produziu os resultados menos viesados e inflacionados para os fenótipos ajustados. Além disso, os resultados obtidos com painéis baseados em Bos taurus indicus foram tão informativos quanto aqueles provenientes do painel Illumina BovineHD, o que pode ser uma alternativa para implementar a seleção genômica com menores custos de genotipagem. Em relação a GWAS, o modelo BayesC foi o que se ajustou melhor aos dados, com exceção do conjunto de TagSNPs. O total de 11, 32 e 236 genes foram identificados usando os conjuntos de dados LDi, HDi e 770k, respectivamente, e a anotação funcional resultou em 1 grupo com 3 genes (LDi), 1 grupo com 4 genes (HDi) e 35 genes distribuídos em 3 grupos (770k). Foram observados cinco genes em comum entre os três conjuntos de dados SYT1 (BTA 5), EYA2 (BTA 13), ZFHX4, MATN2 e CPQ (BTA 14). De maneira geral, o fenótipo é uma característica complexa controlada por muitos genes e o modelo BayesC que leva isso em consideração, teve melhores resultados. Estudos futuros poderiam considerar a influência do grau de relacionamento entre os animais das populações de treinamento e teste.
Palavras-chave
Texto completo: 1 Base de dados: VETTESES Idioma: En Ano de publicação: 2015 Tipo de documento: Thesis
Texto completo: 1 Base de dados: VETTESES Idioma: En Ano de publicação: 2015 Tipo de documento: Thesis