Resumo
ABSTRACT: The use of molecular information in breeding programs contributed to important advances in the improvement of traits of economic interest in livestock production. The advent of single nucleotide polymorphism (SNP) panels applied to genome-wide selection (GWS) and genome-wide association studies (GWAS), along with computational advances (e.g., use of powerful software and robust analyses) allowed a better understanding of the genetic architecture of farm animals and increased the selection efficiency. In this context, the statistic method single-step GBLUP has been frequently used to perform GWS, and more recently GWAS analyses, providing accurate predictions and QTL detection, respectively. Nevertheless, in developing countries, species such as sheep and goats, whose genomic data are more difficult to be obtained, the use of data simulation has been efficient in the study of the major factors involved in the selection process, such as size of training population, density of SNP chips, and genotyping strategies. The effects of these factors are directly associated with the prediction accuracy of genomic breeding values. In this review we showed important aspects of the use of genomics in the genetic improvement of production traits of animals, the main methods currently used for prediction and estimation of molecular marker effects, the importance of data simulation for validation of those methods, as well as the advantages, challenges and limitations of the use of GWS and GWAS in the current scenario of livestock production.
RESUMO: Em programas de melhoramento genético, o uso de informações moleculares garantiu importantes avanços para a melhoria de características de interesse econômico, no âmbito da produção animal. O advento da tecnologia de painéis de SNPs aplicados à seleção genômica ampla (GWS) e associação genômica ampla (GWAS), aliado ao avanço computacional, com o uso de softwares e análises robustas, permitiram melhor compreensão sobre a arquitetura genética dos animais de produção e, consequentemente, maior eficiência na seleção. Nesse contexto, o método estatístico single-step GBLUP tem sido utilizado, frequentemente, na execução da GWS e, mais recentemente, em GWAS, possibilitando predições acuradas e detecção de QTLs, respectivamente. No entanto, em países em desenvolvimento e, em espécies como os ovinos e caprinos, que existe maior dificuldade para a aquisição de dados genômicos, o uso da simulação de dados tem se mostrado eficiente para estudar os principais fatores envolvidos no processo de seleção, como o tamanho da população de treinamento, densidade de chipde SNPs e estratégias de genotipagem, cujos efeitos estão diretamente associados à acurácia da predição de valores genéticos genômicos. Nesta revisão, serão abordados pontos importantes sobre o uso da genômica no melhoramento genético de características produtivas em animais, principais métodos de predição e estimação de efeitos de marcadores moleculares na atualidade, a importância da simulação de dados para a validação desses métodos, bem como as vantagens, os desafios e as limitações no cenário atual da produção animal com o uso da seleção e associação genômica ampla.
Resumo
The use of molecular information in breeding programs contributed to important advances in the improvement of traits of economic interest in livestock production. The advent of single nucleotide polymorphism (SNP) panels applied to genome-wide selection (GWS) and genome-wide association studies (GWAS), along with computational advances (e.g., use of powerful software and robust analyses) allowed a better understanding of the genetic architecture of farm animals and increased the selection efficiency. In this context, the statistic method single-step GBLUP has been frequently used to perform GWS, and more recently GWAS analyses, providing accurate predictions and QTL detection, respectively. Nevertheless, in developing countries, species such as sheep and goats, whose genomic data are more difficult to be obtained, the use of data simulation has been efficient in the study of the major factors involved in the selection process, such as size of training population, density of SNP chips, and genotyping strategies. The effects of these factors are directly associated with the prediction accuracy of genomic breeding values. In this review we showed important aspects of the use of genomics in the genetic improvement of production traits of animals, the main methods currently used for prediction and estimation of molecular marker effects, the importance of data simulation for validation of those methods, as well as the advantages, challenges and limitations of the use of GWS and GWAS in the current scenario of livestock production.
Em programas de melhoramento genético, o uso de informações moleculares garantiu importantes avanços para a melhoria de características de interesse econômico, no âmbito da produção animal. O advento da tecnologia de painéis de SNPs aplicados à seleção genômica ampla (GWS) e associação genômica ampla (GWAS), aliado ao avanço computacional, com o uso de softwares e análises robustas, permitiram melhor compreensão sobre a arquitetura genética dos animais de produção e, consequentemente, maior eficiência na seleção. Nesse contexto, o método estatístico single-step GBLUP tem sido utilizado, frequentemente, na execução da GWS e, mais recentemente, em GWAS, possibilitando predições acuradas e detecção de QTLs, respectivamente. No entanto, em países em desenvolvimento e, em espécies como os ovinos e caprinos, que existe maior dificuldade para a aquisição de dados genômicos, o uso da simulação de dados tem se mostrado eficiente para estudar os principais fatores envolvidos no processo de seleção, como o tamanho da população de treinamento, densidade de chipde SNPs e estratégias de genotipagem, cujos efeitos estão diretamente associados à acurácia da predição de valores genéticos genômicos. Nesta revisão, serão abordados pontos importantes sobre o uso da genômica no melhoramento genético de características produtivas em animais, principais métodos de predição e estimação de efeitos de marcadores moleculares na atualidade, a importância da simulação de dados para a validação desses métodos, bem como as vantagens, os desafios e as limitações no cenário atual da produção animal com o uso da seleção e associação genômica ampla.
Assuntos
Animais , Seleção Genética , Genoma , Polimorfismo de Nucleotídeo Único , Melhoramento GenéticoResumo
The objective of this study was to determine the genome association between markers of bovine LD BeadChip with dairy important traits. Information of breeding program of the Universidad Nacional de Colombia was used. BLUP-EBVs were used for dairy yield (DY), fat percentage (FP), proteinpercentage (PP) and somatic cell score (SCS). 150 animals were selected for blood or semen DNA extraction and genotyping with BovineLD BeadChip (Illumina). Autosomal information was retained and the editing information was performed using Plink v1.07 software. The effects of SNPs were determined by Bayes C with GS3 software. The minor allele frequency for most of the markers on the bead chip was high, which increases the probability of finding important loci segregating in the population. Estimations of fraction markers with an effect were close to zero in almost all cases. The most important markers were mapped by trait using ENSEMBL. A total of 6,510 autosomal SNPs were retained, out of which only a proportion with effect was taken from the mixed function of Bayes C. Important genes as ANKS1B, CLCN1, NMBR and CTSD, were found for each trait for AL, FP, PP and SCS respectively. Finally, Bayes C estimation allowed to identify specific SNPs possibly associated with QTLs.(AU)
O Objetivo deste estudo foi determinar a associação genômica entre os marcadores do chip bovino LD (LD BeadChip) com características importantes na produção de leite. Foram utilizadas informações do programa de melhoramento genético da Universidade Nacional de Colômbia. BLUPEBVs foram utilizados para a produção de leite (DY), porcentagem de gordura (FP), porcentagem deproteína (PP) e escore de células somáticas (SCS). 150 animais foram selecionados para extração de DNAdo sangue ou sêmen e genotipados com o chip BovineLD (Illumina). A informação autossômica foi mantidae a edição da informação foi executada usando o programa Plink v1.07. Os efeitos dos SNPs foram determinados por Bayes C com o programa GS3. A frequência do alelo menor para a maioria dos marcadores no chip foi alta, o que aumenta a probabilidade de encontrar locos importantes segregando na população. As estimativas da fração de marcadores, com efeito, foram próximas de zero em quase todas as situações. Os marcadores mais importantes foram mapeados com ENSEMBL. Um total de 6510 SNPs autossômicos foram preservados, dos quais apenas uma proporção foi tomada com efeito a partir da função mista de Bayes C. Para cada característica foram encontrados genes importantes, como ANKS1B, CLCN1, NMBR e CTSD, para AL, FP, PP e SCS, respectivamente. Finalmente, a estimativa de Bayes-C permitiu aidentificação de SNPs com possível associação com QTLs.(AU)
Assuntos
Animais , Feminino , Bovinos , Bovinos/genética , Bovinos/fisiologia , Teorema de Bayes , Genômica/classificação , Polimorfismo de Nucleotídeo Único , Indústria de LaticíniosResumo
The objective of this study was to determine the genome association between markers of bovine LD BeadChip with dairy important traits. Information of breeding program of the Universidad Nacional de Colombia was used. BLUP-EBVs were used for dairy yield (DY), fat percentage (FP), proteinpercentage (PP) and somatic cell score (SCS). 150 animals were selected for blood or semen DNA extraction and genotyping with BovineLD BeadChip (Illumina). Autosomal information was retained and the editing information was performed using Plink v1.07 software. The effects of SNPs were determined by Bayes C with GS3 software. The minor allele frequency for most of the markers on the bead chip was high, which increases the probability of finding important loci segregating in the population. Estimations of fraction markers with an effect were close to zero in almost all cases. The most important markers were mapped by trait using ENSEMBL. A total of 6,510 autosomal SNPs were retained, out of which only a proportion with effect was taken from the mixed function of Bayes C. Important genes as ANKS1B, CLCN1, NMBR and CTSD, were found for each trait for AL, FP, PP and SCS respectively. Finally, Bayes C estimation allowed to identify specific SNPs possibly associated with QTLs.
O Objetivo deste estudo foi determinar a associação genômica entre os marcadores do chip bovino LD (LD BeadChip) com características importantes na produção de leite. Foram utilizadas informações do programa de melhoramento genético da Universidade Nacional de Colômbia. BLUPEBVs foram utilizados para a produção de leite (DY), porcentagem de gordura (FP), porcentagem deproteína (PP) e escore de células somáticas (SCS). 150 animais foram selecionados para extração de DNAdo sangue ou sêmen e genotipados com o chip BovineLD (Illumina). A informação autossômica foi mantidae a edição da informação foi executada usando o programa Plink v1.07. Os efeitos dos SNPs foram determinados por Bayes C com o programa GS3. A frequência do alelo menor para a maioria dos marcadores no chip foi alta, o que aumenta a probabilidade de encontrar locos importantes segregando na população. As estimativas da fração de marcadores, com efeito, foram próximas de zero em quase todas as situações. Os marcadores mais importantes foram mapeados com ENSEMBL. Um total de 6510 SNPs autossômicos foram preservados, dos quais apenas uma proporção foi tomada com efeito a partir da função mista de Bayes C. Para cada característica foram encontrados genes importantes, como ANKS1B, CLCN1, NMBR e CTSD, para AL, FP, PP e SCS, respectivamente. Finalmente, a estimativa de Bayes-C permitiu aidentificação de SNPs com possível associação com QTLs.
Assuntos
Feminino , Animais , Bovinos , Bovinos/fisiologia , Bovinos/genética , Genômica/classificação , Teorema de Bayes , Indústria de Laticínios , Polimorfismo de Nucleotídeo ÚnicoResumo
Dada à importância de bovinos zebuínos (Bos taurus indicus) para a produção de carne em regiõestropicais e sub tropicais, que produzem cerca de 50% da carne bovina do planeta, bem como o fato das fêmeasdessa subespécie serem consideradas sexualmente mais tardias que as da subespécie Bos taurus taurus, faz-senecessário um profundo estudo da associação genômica ampla de características ligadas à prenhez precocedessas fêmeas. Este texto traz uma rápida revisão sobre o estado da arte desse assunto, bem como sobre a seleçãogenômica e seu emprego na reprodução de bovinos.(AU)
Beef cattle of the subspecies Bos taurus indicus (Zebu) are very important for the global beefproduction, mainly in tropical and subtropical areas, where they produce aroun 50% of the total beef in theplanet. Zebu Females are known to start reproduction later that the Bos taurus taurus and its crucial to deeplyconduct genome wide association studies related to puberty and early pregnancy to females of Zebu cattle. Thistext brings a short review of the state of the art of those studies and, also, genomic selection and its applicationto bovine reproduction.(AU)
Assuntos
Animais , Bovinos , Bovinos/genética , Puberdade Precoce/diagnóstico , Puberdade Precoce/genética , Comportamento ReprodutivoResumo
Dada à importância de bovinos zebuínos (Bos taurus indicus) para a produção de carne em regiõestropicais e sub tropicais, que produzem cerca de 50% da carne bovina do planeta, bem como o fato das fêmeasdessa subespécie serem consideradas sexualmente mais tardias que as da subespécie Bos taurus taurus, faz-senecessário um profundo estudo da associação genômica ampla de características ligadas à prenhez precocedessas fêmeas. Este texto traz uma rápida revisão sobre o estado da arte desse assunto, bem como sobre a seleçãogenômica e seu emprego na reprodução de bovinos.
Beef cattle of the subspecies Bos taurus indicus (Zebu) are very important for the global beefproduction, mainly in tropical and subtropical areas, where they produce aroun 50% of the total beef in theplanet. Zebu Females are known to start reproduction later that the Bos taurus taurus and its crucial to deeplyconduct genome wide association studies related to puberty and early pregnancy to females of Zebu cattle. Thistext brings a short review of the state of the art of those studies and, also, genomic selection and its applicationto bovine reproduction.
Assuntos
Animais , Bovinos , Bovinos/genética , Puberdade Precoce/diagnóstico , Puberdade Precoce/genética , Comportamento ReprodutivoResumo
O Brasil está entre os principais produtores de carne. Animais taurinos são utilizados puros ou em cruzamentos em busca de maior produtividade e qualidade da carne e da carcaça. Entretanto, animais taurinos são mais suscetíveis à infestação por carrapatos. O Rhipicephalus microplus transmite os agentes patogênicos Anaplasma marginale, Babesia bigemina e Babesia bovis, que constituem a Tristeza Parasitária Bovina (TPB). Animais taurinos também são mais vulneráveis às infecções. Assim, além dos prejuízos causados, carrapato e babesiose bovina representam um entrave na intensificação da bovinocultura de corte. O presente estudo avaliou as características de níveis de infestação por R. microplus (Icar), por meio da contagem de carrapatos, infecção por B. bigemina (Ibig) e infecção B. bovis (Ibov), determinados por meio da técnica de Reação em Cadeia da Polimerase em Tempo Real (qPCR). Essas características são economicamente importantes e complexas e há dificuldade em selecionar animais resistentes pelo método BLUP tradicional. Foram estimados parâmetros genéticos e foi conduzido um estudo de associação genômica ampla (GWAS) para proporcionar maior entendimento da base genética dessas características, com o objetivo de auxiliar a seleção de animais resistentes. Foram realizadas análises para Icar (624 animais, n= 1246), Ibig (786 animais, n=1312) e Ibov (677 animais, n=980) utilizando 770 fêmeas genotipadas com painel de aproximadamente 150.000 marcadores do tipo SNP. Os componentes de variância foram obtidos por inferência bayesiana em um modelo tri-característica. A estimativa de herdabilidade para Icar foi de baixa magnitude (0,17), sugerindo que a seleção pelo fenótipo de contagem dos carrapatos trará respostas a longo prazo. Para Ibig e Ibov as estimativas foram próximas de zero, indicando maior influência ambiental. As repetibilidades de Icar (0,24), Ibig (0,12) e Ibov (0,12) também foram de baixa magnitude, evidenciando que as variações nos níveis de infestação e infecção podem ser atribuídas principalmente a fatores ambientais. As estimativas de correlações genética e fenotípica entre o Icar e níveis de infecção sugerem que não há relação entre níveis de infestação e infecção e a seleção para uma característica não afetaria significativamente a seleção para a outra, visto que, todas foram próximas de zero. A correlação genética entre Ibig e Ibov foi alta e negativa (-0,69). A correlação fenotípica também foi negativa (-0,10) e embora tenha apresentado valor de baixa magnitude, fortaleceu a associação inversa entre as características. Para o estudo de GWAS, foi empregado o método WssGBLUP, utilizando análises univariadas e realizando três iterações, as variâncias das soluções dos SNPs foram usadas como ponderadores. As 15 janelas com maior variação explicaram 30,84%, 54,30% e 47,63% da variância genética de Icar, Ibig e Ibov, respectivamente. Após análise funcional, diversos genes candidatos foram identificados nas 15 janelas de cada característica, contribuindo para a detecção de regiões promissoras para futuros estudos visando identificar genes diretamente envolvidos na resistência dos animais.
Brazil is among the main beef producers. Taurine animals are used pure or in crossbreeding in search of greater productivity and quality of meat and carcass. However, Bos taurus taurus animals are more susceptible to tick infestation. Rhipicephalus microplus transmits the pathogens Anaplasma marginale, Babesia bigemina, and Babesia bovis, which constitute Bovine Parasiti Sadness (BPS). Taurine animals are also more vulnerable to infections. Thus, in addition to the damage caused, ticks and bovine babesiosis represent an obstacle in the intensification of beef cattle breeding. The present study evaluated the characteristics of Rhipicephalus microplus infestation level (IT), determined by tick counts, and infection levels by B. bigemina (Ibig) and Babesia bovis (Ibov), determined using the Real-Time Polymerase Chain Reaction (qPCR) technique. These traits are economically important and complex, and there is difficulty in selecting more resistant animals by the traditional method. Genetic parameters were estimated and a genome-wide association study (GWAS) was conducted to provide a further understanding of the genetic basis of these traits to aid in the selection of resistant animals. Analyses were performed for IT (624 animals, n= 1246), Ibig (786 animals, n=1312), and Ibov (677 animals, n=980) using 770 females genotyped with a panel of approximately 150,000 SNP markers. Variance components were obtained by Bayesian inference in a tri-characteristic model. The heritability estimate for IT was of low magnitude (0.17), suggesting that selection by phenotype will bring long-term responses. For Ibig and Ibov the estimates were close to zero, indicating greater environmental influence. The repeatabilities for IT (0.24), Ibig (0.12), and Ibov (0.12) were also of low magnitude, showing that the variations in the levels of infestation and infection can be attributed mainly to environmental factors. The correlation estimates between infestation and infection levels suggest that there is no relationship between them, and selection for one trait would not significantly affect selection for the other, since they were all close to zero. The genetic correlation between Ibig and Ibov was high and negative (-0.69), the phenotypic correlation was also negative (-0.10) and although it presented a low magnitude value, it strengthened the inverse association between the characteristics. For the GWAS, the WssGBLUP method was employed, using univariate analysis and performing three iterations, the variances of the SNP solutions were used as weights. The 15 windows with the highest variance explained 30.84%, 54.30%, and 47.63% of the genetic variance of IT, Ibig, and Ibov, respectively. After functional analysis, several candidate genes were identified in the 15 windows of each trait. Thus, contributing to the detection of promising regions for future studies aiming to identify genes directly involved in the resistance of animals.
Resumo
.
In beef cattle breeding programs, the study of reproductive traits in females is of great importance to meet the growing demand for meat in the world. Currently, strategies are being created that contribute to increasing the genetic gain of productive and reproductive traits, which may lead to the use of a small group of reproducers, which may increase inbreeding levels in populations. The aim of this study was (i) to identify genomic regions and biological factors that affect the heifer early calving (HC) at 24 (HC24), 26 (HC26), 28 (HC28), and 30 (HC30) months of age in Nelore cattle and (ii) to estimate inbreeding coefficients based on pedigree and genomic data on traits of economic interest. A total of 66,496 phenotypic records and 8,652 heifer genotypes for the HC24 - HC30 study were used. For the inbreeding study, 22,680 genotypes were used, the traits studied were adjusted scrotal circumference at 365 days (SC365), HC30; adjusted body weight at 210 (BW210) and 450 (BW450) days of age, ribeye area (REA); backfat thickness (BFT) and rump fat thickness (RFT). The w-ssGWAS results pointedout shared and specific window regions for HC at different ages, which varied according to their genetic correlation. These regions house key genes in the biological process of hormonal, lipid, and metabolic regulation, essential for developing bones, muscles, and reproductive organs. A total of four regions of shared windows between HC24, HC26, HC28, and HC30 were identified in BTA 5, 6, 14, and 16 harboring candidate genes with a direct effect on processes related to the control of functions associated with metabolism, endocrinology, reproduction, and aspects of growth (IGF1, UBA6, GNRHR, LYN, MOS, PLAG1, ETNK2, KISS1, and REN). The average inbreeding depression was -0.241% and -1.102% per 1% of inbreeding for linear regression coefficients scaled on the percentage of mean (m) and standard deviation (sd), respectively. The means for m (and sd) were -0.18% (-1.271%) for sexual precocity traits(SC365 and HC30); -0.37% (-0.985%) for carcass traits (REA; BFT and RFT) and -0.17% (-1.051%) for weight traits (BW120 maternal and animal and BW455). Findings showed differences in physiological processes linked to HC at different ages and metabolic processes that help the genetic control of sexually precocious Nelore heifers. Hence, inbreeding depression is more pronounced in carcass traits than in sexual precocity and weight traits. These findings highlight the need for the management of inbreeding in the breeding programmes. For all traits, long and short ROH contributed to inbreeding depression. The results obtained from inbreeding depression will allow establishing that they allow monitoring and maintaining genetic diversity, which will improve the traits that are part of the genetic improvement program of the Nelore breed.
Resumo
O uso e descobertas de novas metodologias no melhoramento têm favorecido o progresso genético. No entanto, não há relatos científicos sobre a associação de variação do número de cópias (CNVs) com características influenciadas pelo estresse térmico (sob clima tropical), principalmente com enfoque genômico, o que torna indispensável o desenvolvimento de trabalhos neste segmento. Diante disso, foram utilizadas informações genotípicas de 389 vacas genotipadas com chip de média densidade (50k SNP). Os fenótipos foram ajustados aos efeitos fixos e aleatórios por meio de um modelo linear, e posteriormente foram calculados os valores genéticos genômicos. A detecção foi realizada utilizando o algoritmo PennCNV, desenvolvido com base nos modelos ocultos de Markov (HMM). Um total de 1.231 CNVs foram identificados no genoma das vacas leiteiras, posteriormente foram identificadas 219 regiões de variação do número de cópias (CNVRs), utilizadas na associação com as características de produção de leite, ácidos graxos e gordura, na população. A detecção de CNVs foi realizada por meio do algoritmo PennCNV, e as CNVRs pelo pacote do R, denominado de CNVRanger. Foram encontrados 2 CNVs significamente associados à produção de leite. Adicionalmente, o desdobramento deste projeto continuará contribuindo para o progresso científico no estudo genômico em bovinos leiteiros.
The use and discoveries of new methodologies in breeding have favored genetic progress. However, there are no scientific reports on the association of copy number variation (CNVs) with characteristics influenced by heat stress (under tropical climate), especially with a genomic focus, which makes the development of work in this segment indispensable. Therefore, genotypic information from 389 cows genotyped with medium density chip (50k SNP) were used. Detection was performed using the PennCNV algorithm, developed based on the hidden Markov models (HMM). The phenotypes were adjusted to fixed and random effects using a linear model, and then the genomic breeding values were calculated. A total of 1,231 CNVs were identified in the genome of dairy cows, later 219 copy number variation regions (CNVRs) were identified, used in association with the characteristics of milk production, fatty acids, fat, in the population. The detection of CNVs was performed using the PennCNV algorithm, and the CNVRs using the R package, called CNVRanger. The phenotypes were adjusted to fixed and random effects using a general linear model, and then the genomic breeding values were calculated. 2 CNVs were found significantly associated with milk production. Additionally, the development of this project will continue to contribute to scientific progress in the genomic study of dairy cattle.
Resumo
O Tambaqui (Colossoma macropomum) é a principal espécie nativa produzida na América latina, contudo sua produção é afetada pela infestação do parasita Ichthyophthirius multifiliis, o que causa surtos de mortalidade resultando em importantes perdas econômicas. Os tratamentos atuais têm sido ineficazes para o controle desta doença e muitas vezes resultam poluentes para o meio ambiente. Diante desta perspectiva, a seleção genética para resistência ao I. multifiliis é uma proposta sustentável, pois resultaria numa prática com menor contaminação ao meio ambiente e muito mais eficiente a longo prazo na produção do tambaqui. O objetivo do presente trabalho foi estimar parâmetros genéticos da resistência ao I. multifiliis, além da integração de análises genômicas para a genotipagem de polimorfismos de nucleotídeo único (SNPs) correlacionados com esta característica. Para isto, foram formadas 8 famílias de tambaqui, as quais foram desafiadas por um experimento de coabitação com o parasita I. multifiliis. As variáveis analisadas foram a sobrevivência (SS), o tempo de morte (TD) e a carga parasitária (PL). Obteve-se variação fenotípica significativa entre as famílias para o SS (16 a 100%) e o TD (217 a 254 horas pós coabitação). Além do mais, foram estimados altos valores de herdabilidade para SS e TD (0,46 ± 0,09 e 0,60 ± 0,18, respectivamente). No entanto, não tivemos valores significativos para PL. Após várias etapas de filtragem, a genotipagem do SNP por dupla digestão do DNA associado ao sítio de restrição (ddRAD-seq) revelou um total de 7.717 SNPs em 119 indivíduos, que foram usados para GWAS pelo GBLUP de etapa única (ssGBLUP) e método de Bonferroni. As análises genômicas resultaram em quatro SNPs sugestivos detectados (três para TD e um para PL) em quatro grupos de ligação (2, 9, 11 e 20) que cruzaram o limiar de Bonferroni em todo o cromossomo. Esses SNPs foram aplicados para mapear QTLs, encontrando 11 genes candidatos (abcf3, znf830, ccr9, gli3, ackr4, tbata, ndr2, tgfbr3, nhej1, znf644b, cldn10a) que provavelmente estão envolvidos na resistência à infestação por I. multifiliis. Os resultados apresentados neste estudo sugerem que a resistência a I. multifiliis em tambaqui pode ser melhorada através de programas de melhoramento genético e esta característica é considerada poligênica com várias regiões genômicas de menor efeito afetando a variância genética total.
Tambaqui (Colossoma macropomum) is the principal native species produced in Latin America, however, its production is affected by the infestation of the parasite Ichthyophthirius multifiliis, which causes outbreaks of mortality that result in significant economic losses. Current treatments have been ineffective in controlling this disease and often result in pollutants for the environment. Due to this perspective, genetic selection for resistance to I. multifiliis is a sustainable approach and efficient in long term to the production of tambaqui, as it results in less damage to the environment. The aim of this investigation was: 1) to estimate the genetic parameters of resistance to I. multifiliis in tambaqui, by a controlled experimental challenge; 2) to analyze the genetic architecture of the resistance to I. multifiliis in tambaqui, by genome wide association study (GWAS) using single nucleotide polymorphisms (SNPs). Eight full-sib families of tambaqui were experimentally analyzed by a cohabitation challenge with the parasite I. multifiliis. The resistant traits analyzed were survival status (SS), time of death (TD) and parasite load (PL). A significant phenotypic variation was obtained between the families for SS (16 to 100%) and TD (217 to 254 hours after cohabitation). High heritability values were estimated for SS and TD (0.46 ± 0.09 and 0.60 ± 0.18, respectively). However, we did not have significant heritability values for PL. After several filtering steps, the SNP genotyping by double-digest restriction-site associated DNA (ddRAD-seq) revealed a total of 7.717 SNPs in 119 individuals, which were used for GWAS by the single-step GBLUP (ssGBLUP) and Bonferroni method. The genomics analyzes resulted in four suggestive SNPs detected (three for TD and one for PL) in four linkage groups (2, 9, 11 and 20) that crossed the chromosome-wide Bonferroni threshold. These SNPs were applied to map QTLs, finding 11 candidate genes (abcf3, znf830, ccr9, gli3, ackr4, tbata, ndr2, tgfbr3, nhej1, znf644b, cldn10a) that are likely to be involved in resistance to infestation by I. multifiliis. The results presented in this study suggest that resistance to I. multifiliis in tambaqui can be improved through genetic improvement programs and this trait is considered polygenic with several genomic regions of minor effect affecting the total genetic variance.
Resumo
A eficiência alimentar (EA) em sistemas de produção de proteína animal é uma característica de grande importância, já que animais mais eficientes refletem diretamente em melhores índices de produtividade e sustentabilidade das cadeias produtivas. No entanto, a avaliação desta característica é complexa, lenta e onerosa, o que justifica a busca de abordagens mais eficazes para identificar animais quanto à EA. Uma possível estratégia é a identificação de marcadores moleculares que permitam a seleção de animais com melhor ou pior EA. Abordagens baseadas em estudos de associação ampla do genoma (GWAS) tem gerado bastante informações, porém na maioria das vezes os marcadores encontrados não são os responsáveis pelos efeitos fenotípicos (causais), o que faz com que a análise dos resultados seja especulativa utilizando-se genes presentes em grandes janelas cromossomais. Outro problema destes estudos é que as análises são realizadas a partir do DNA de qualquer célula, se perdendo a possibilidade de compreender a importância funcional e tecido-específica das variantes causais em determinado fenótipo. Assim este trabalho se organiza em capítulos, onde no primeiro foi analisado dados gerados a partir de RNA-seq de amostras de biópsia de fígado de animais de alta e baixa EA, com o objetivo de identificar variantes funcionais que regulem genes e vias biológicas relacionadas com o fenótipo estudado. Foi possível identificar 256 variantes (247 SNPs e 9 INDELs (inserções e deleções)) distribuído em 190 genes que regulam vias importantes da imunidade inata, o que leva a concluir que o sistema imune é uma das principais vias que regulam a eficiência animal, seja direta ou indiretamente. Dentre os principais achados está 4 variantes homozigóticas para animais de alta eficiência alimentar (AEA) nos genes CFH e CFH5, que são responsáveis pela fagocitose de micróbios e células danificadas que induzem à infecção, alterações nessas variantes podem levar a alterações das vias biológicas relacionadas a imunidades, causando perdas econômicas. No segundo capítulo, realizou-se análises de dados a partir de RNA-seq de diversos orgãos (adrenal, hipotálamo, pituitária, fígado, musculo), para identificação de variantes9 funcionais que podem ser reguladores centrais, suas interações biológicas com a característica de eficiência alimentar e por fim validar os resultados em uma população independente. Com esta pesquisa foi possível identificar 169 variantes expressos em comum nos cinco tecidos, sendo que essas variantes estão relacionadas principalmente com o MHC classe I. Também foram identificados um total de 144, 252, 413, 416 e 340 potenciais variantes funcionais (PVFs) apresentados no fígado, músculo, hipotálamo, hipófise e adrenal, que foram adjacentes a 223, 422, 694, 697 e 554 marcadores SNP apresentados no BovineHD (Illumina), respectivamente. Para realizar a validação e as previsões genômicas para o conjunto de validação, os marcadores SNP adjacentes ao PFV foram diferencialmente ponderados com base nos resultados obtidos com ssGWAS usando o conjunto de treinamento. Através dos dados obtidos e da metodologia aplicada, foi possível constatar que a precisão da predição aumentou de 31,03% para 40%, quando adicionados os dados das PVFs ponderados diferencialmente na matriz de predição. Através dos dados genômicos obtidos e utilizando a metodologia de identificação de PVFs e validação por ssGWAS, foi possível desenvolver um pipeline consistente que pode ser utilizada para a aprimorar os programas de melhoramento genético.
Feed efficiency (FE) in animal protein production systems is a feature of great importance, since more efficient animals reflect directly on better productivity and sustainability indexes of the production chains. However, the evaluation of this characteristic is complex, slow and costly, which justifies the search for more effective approaches to identify animals regarding FE. A possible strategy is the identification of molecular markers that allow the selection of animals with better or worse FE. Approaches based on studies of broad genome association (GWAS) have generated a lot of information, however in most cases the markers found are not responsible for the phenotypic (causal) effects, which makes the analysis of the results speculative using genes present in large chromosomal windows. Another problem of these studies is that the analyzes are performed from the DNA of any cell, losing the possibility of understanding the functional and tissue-specific importance of the causal variants in a given phenotype. Thus, this work is organized in chapters, where the first one analyzed data generated from RNA-seq from liver biopsy samples from animals of high and low FE, with the objective of identifying functional variants that regulate genes and biological pathways related to the studied phenotype. It was possible to identify 256 variants (247 SNPs and 9 INDELs (insertions and deletions)) distributed in 190 genes that regulate important pathways of innate immunity, which leads to the conclusion that the immune system is one of the main pathways that regulate animal efficiency, be it directly or indirectly. Among the main findings are 4 homozygous variants for highly efficient animals (HFE) in the CFH and CFH5 genes, which are responsible for the phagocytosis of microbes and damaged cells that induce infection, changes in these variants can lead to changes in biological pathways related to immunities, causing economic losses. In the second chapter, data analysis was performed using RNA-seq from several organs (adrenal, hypothalamus, pituitary, liver, muscle), to identify functional variants that can be central regulators, their biological interactions with the efficiency characteristic and finally to validate the results in an independent population. With this research it was possible to identify 169 variants expressed in common in the five tissues, and these variants are mainly related to MHC class I. A total of 144, 252, 413, 416 and 340 potential functional variants (PFVs) were also identified. in the liver, muscle, hypothalamus, pituitary and adrenal, which were adjacent to 223, 422, 694, 697 and 554 SNP markers presented in BovineHD (Illumina), respectively. To perform the validation and genomic predictions for the validation set, the SNP markers adjacent to the PFV were differentially weighted based on the results obtained with ssGWAS using the training set. Through the obtained data and the applied methodology, it was possible to verify that the precision of the prediction increased from 31.03% to 40%, when adding the data of the differently weighted PFVs in the prediction matrix. Through the genomic data obtained and using the methodology of identification of PFVs and validation by ssGWAS, it was possible to develop a consistent pipeline that can be used to improve the breeding programs.
Resumo
Objetivou-se, com este estudo, estimar os parâmetros genéticos para características de eficiência alimentar, crescimento, reprodução e carcaça em rebanhos comerciais de bovinos Nelore, além da resposta correlacionada entre elas. Também objetivou-se realizar um estudo de seleção genômica avaliando métodos de predição, esquemas de validação e pseudo-fenótipos e conduzir um estudo de associação genômica ampla ponderado em passo único e análises de enriquecimento para características relacionadas à eficiência alimentar. Foram avaliados o consumo alimentar residual (CAR), consumo de matéria seca (CMS), conversão alimentar (CA), eficiência alimentar (EA), ganho em peso residual (GPR), consumo e ganho em peso residual (CGR), peso ao nascer (PN), peso aos 120 (P120), 240 (P240), 365 (P365) e 450 (450) dias de idade, perímetro escrotal aos 365 (PE365) e 450 (PE450) dias de idade, área de olho de lombo (AOL), espessura de gordura (EG) e espessura de gordura na garupa (P8). Foram utilizadas informações de crescimento, reprodução e carcaça de 15.639 bovinos Nelore. Foram utilizados dados de testes de eficiência alimentar realizados entre 2011 e 2018, com informações fenotípicas e genotípicas de 4.329 e 3.594 animais, respectivamente. Os parâmetros genéticos foram estimados utilizando método single-step (ssGBLUP). Seis métodos de predição dos valores genômicos (GEBVs) foram utilizados: ssGBLUP, Bayes A, Bayes B, Bayes C, BLASSO e Bayes R. Três esquemas de validação foram utilizados: 1) aleatório: a base de dados foi aleatoriamente dividida em dez subconjuntos e a validação foi realizada em cada subconjunto por vez; 2) idade: a população foi dividida em treinamento e validação com base no ano de nascimento, sendo o primeiro grupo composto por animais nascidos entre 2010 a 2016 e o segundo nascido em 2017; 3) acurácia de predição do valor genético (EBV): foram divididos em dois grupos, sendo os animais com acurácia acima de 0,45 considerados como a população de treinamento; e abaixo de 0,45 a de validação. Foram avaliadas a acurácia e o viés de predição dos GEBVs. A porcentagem da variância explicada por janelas de 10 SNPs consecutivos foram usados para identificar regiões que explicam mais que 0,5% da variância genética aditiva de cada característica. As características relacionadas à eficiência alimentar apresentaram herdabilidades baixas a moderadas, variando de 0,07 a 0,20. As características relacionadas à eficiência alimentar apresentaram correlação genética baixa com crescimento (-0,19 a 0,24), reprodução (-0,24 a 0,27) e carcaça (-0,17 a 0,27), exceto para crescimento com CMS (0,32 a 0,56) e EA (-0,40). Os resultados demonstram que a habilidade de predição foi similares entre os métodos de predição. A baixa herdabilidade obtida, principalmente para EA (0,07±0,03) e CA (0,09±0,03), limitaram as acurácias dos GEBVs que variaram de baixa a moderada. Os coeficientes de regressão das estimativas foram próximos de 1, e similar entre os métodos de predição, esquemas de validação e pseudo-fenótipos. Em média e apesar da baixa variação (0,0331), a validação cruzada aleatória apresentou maior habilidade de predição, variando de 0,07 a 0,037, comparado a acurácia do EBV e idade. A habilidade de predição foi maior para o fenótipo ajustado para efeitos fixos do que para EBV e EBV desregredido (30,0 e 34,3%, respectivamente). As análises de enriquecimento com a ferramenta The Database for Annotation, Visualization and Integrated Discovery (DAVID) revelaram várias vias funcionais como via de sinalização de neuropeptídios (GO: 0007218), regulação negativa da via de sinalização Wnt canônica (GO: 0090090), detecção de estímulos químicos envolvidos na percepção sensorial do sabor amargo (GO: 0001580), atividade do receptor de sabor amargo (GO: 0033038), neuropeptídio atividade hormonal (GO: 0005184), secreção biliar (bta04976), transdução do paladar (bta0742) e via de sinalização de glucagon (bta04922). A seleção para melhorar características de crescimento, reprodução e carcaça pode não alterar CAR, GPR e CGR. Por outro lado, o CMS, EA e CA podem levar a um aumento do peso corporal, além da seleção para CA levar a uma redução no rendimento de carcaça. A natureza genética das características relacionadas à eficiência alimentar pode levar a diferentes respostas genéticas. A escolha do critério de seleção mais adequado depende do sistema e dos objetivos de produção. Os métodos de predição genômica podem fornecer estimativas confiáveis dos valores genômicos para CAR, CMS, GPR e CGR, características que podem ter maior ganho genético e viabilidade de seleção comparada a EA e CA. As análises de enriquecimento mostraram genes associados ao metabolismo de insulina, leptina, glucose, proteína e lipídeo, balanço de energia, estresse oxidativo, sistemas zinc fingers, secreção biliar, saciedade, comportamento alimentar, salivação, digestão e absorção de nutrientes. A identificação das regiões genômicas e seus respectivos genes fornecem informações sobre bases genéticas e regulação biológica da eficiência alimentar em bovinos Nelore.
The aim of this study was to estimate genetic parameters for feed efficiency, growth, reproductive and carcass traits in commercial Nelore cattle herds, and the correlated response between them. It was also aimed perform a study of genomic selection evaluating prediction methods, validation approaches and pseudo-phenotypes, and conduct a weighted single-step genome-wide association study and an enrichment analysis for feed efficiency of feed efficiency related traits. Residual feed intake (RFI), dry matter intake (DMI), feed conversion ratio (FCR), feed efficiency (FE), residual live weight gain (RG), residual intake and live weight gain (RIG), birth weight (BW), weight at 120 (W120), 240 (W240), 365 (W365), and 450 (W450) days of age, scrotal circumference at 365 (SC365) and 450 (SC450) days of age, rib eye area (REA), backfat thickness (BF) and rump fat thickness (RF) were evaluated. The growth, reproductive and carcass traits records from 15,639 Nelore cattle were used. Data from feed efficiency tests carried out between 2011 and 2018, with phenotypic and genotypic information of 4,329 and 3,594 animals, respectively, were considered. The genetic parameters were estimated in a single step approach (ssGBLUP). Six prediction methods of genomic breeding values (GEBVs) were used: ssGBLUP, Bayes A, Bayes B, Bayes C, BLASSO, and Bayes R. Three validation approaches were used: 1) random: the data set was randomly divided into ten subsets and the validation was done in each subset at a time; 2) age: the population was divided into training and validation set based on the year of birth, with the first group consisting of animals born between 2010 and 2016 and the second group born in 2017; 3) genetic breeding value (EBV) accuracy: were divided into two groups, with animals with accuracy above 0.45 considered as the training population, and below 0.45 the validation set. We checked the accuracy and bias of GEBV. The percentage of variance explained by windows of 10 adjacent SNPs was used to identify regions that explained more than 0.5% of the additive genetic variance on each trait. The feed efficiency related traits showed low to moderate heritabilities, ranging from 0.07 to 0.20. Feed efficiency related traits showed low genetic correlations with growth (-0.19 to 0.24), reproductive (-0.24 to 0.27) and carcass (-0.17 to 0.27) traits, except for growth with DMI (0.32 to 0.56) and FE (-0.40). The results showed that the prediction ability were similar between the prediction methods. The low heritability obtained, mainly for FE (0.07±0.03) and FCR (0.09±0.03), limited the GEBVs accuracy, which ranged from low to moderate. The regression coefficient estimates were close to 1, and similar between the prediction methods, validation approaches, and pseudo-phenotypes. On average and despite low variation (0.0331), the random cross-validation presented the most accurate predictions, ranging from 0.07 to 0.037, than EBV accuracy and age. The prediction ability was higher for phenotype adjusted for fixed effects than for EBV and EBV deregressed (30.0 and 34.3%, respectively). Enrichment analysis by The Database for Annotation, Visualization and Integrated Discovery (DAVID) revealed several functional vias such as neuropeptide signaling pathway (GO:0007218), negative regulation of canonical Wnt signaling pathway (GO:0090090), detection of chemical stimulus involved in sensory perception of bitter taste (GO:0001580), bitter taste receptor activity (GO:0033038), neuropeptide hormone activity (GO:0005184), bile secretion (bta04976), taste transduction (bta0742), and glucagon signaling pathway (bta04922). The selection to improve growth, reproductive and carcass traits would not change RFI, RG, and RIG. On the other hand, DMI, FE and FCR may lead to an increase in body weight, in addition to the selection for FCR may lead to a reduction in carcass yield. The genetic background of feed efficiency related traits are different, which would lead to different genetic responses. The choice of the most adequate selection criterion depends on the production system and goals. Genomic prediction methods can provide a reliable estimate of genomic breeding values for RFI, DMI, RG and RGI, traits that may have higher genetic gain and selection viability than FE and FCR. Enrichment analyzes showed genes associated with in insulin, leptin, glucose, protein and lipid metabolism, energy balance, heat and oxidative stress, zinc finger system, bile secretion, satiety, feed behavior, salivation, digestion and absorption of nutrients. The identification of these genomic regions and their respective genes provide information about genetic basis and biologic regulation for Nelore feed efficiency related traits.
Resumo
A crescente busca por produção alimentar sustentável tem incentivado uma reestruturação no setor de produção de carne visando obter produtos de melhor qualidade sem aumentar os custos de produção. Deste modo, o melhoramento genético animal tende a melhorar a produtividade econômica das futuras gerações de espécies de interesse econômico por meio da seleção. A maioria das características de interesse econômico na pecuária é de expressão quantitativa e complexa, ou seja, são influenciadas por vários genes e afetadas por fatores ambientais. No entanto, ainda não há consenso entre os pesquisadores sobre a melhor metodologia para a obtenção da predição genômica para cada característica. Existem diferentes métodos e pseudofenótipos utilizados em predições genômicas, sendo necessário determinar o ideal para a característica de interesse. No Capítulo 2, o objetivo deste estudo foi estimar parâmetros genéticos e identificar regiões genômicas associadas a características de carcaça obtidas por ultrassonografia e escores visuais em bovinos Nelore. Foram utilizados dados de aproximadamente 66.000 animais provenientes da Associação Nacional de Criadores e Pesquisadores (ANCP). Os componentes de variância para espessura de gordura subcutânea (EG), espessura de gordura subcutânea da garupa (EGP8) e área de olho de lombo (AOL) foram estimados considerando um modelo linear, e um modelo de limiar para as características, como estrutura corporal (E), precocidade (P) e musculosidade (M). As soluções dos SNPs foram estimadas por meio da metodologia ssGBLUP considerando janelas de 10 SNPs adjacentes. Regiões que representaram mais de 1.0% da variância genética aditiva foram utilizadas. A análise de enriquecimento funcional revelou processos biológicos que podem influenciar diretamente o crescimento e desenvolvimento animal. No Capítulo 3, objetivou-se com este estudo comparar a habilidade de predição genômica de características indicadoras de composição de carcaça em bovinos Neloreusando os métodos BLUP, GBLUP, ssGBLUP, métodos Bayesianos (BayesA, BayesB, BayesC e BayesianLASSO) e uma metodologia combinando a matriz de parentesco dos animais genotipados com a matriz genômica e métodos Bayesianos. Foram obtidas informações fenotípicas e genotípicas de aproximadamente 66.000 e 21.000 animais, respectivamente, avaliados pela ANCP para BF, RF, LMA, BS, FP e MS. Para obter a habilidade de predição, o conjunto de dados foi dividido em subconjuntos de treinamento (touros genotipados e mães com progênies) e validação (animais jovens genotipados sem registros de progênies e sem fenótipos). Em relação a habilidade de predição e o viés, os métodos bayesianos foram superiores para as características de escores visuais e o ssGBLUP para as características de carcaça obtidas por ultrassonografia, entretanto, resultados mais tendenciosos foram obtidos para BF e RF quando utilizado o ssGBLUP. O modelo ssGBLUP apresentou predição menos viesada para as características de baixa herdabilidade, como LMA, e também apresentou menor demanda computacional, caracterizado por ser um método que não necesita de cálculo de pseudofenótipos para a implementação da seleção genômica em bovinos de corte. No Capítulo 4, o objetivo deste estudo foi estimar parâmetros genéticos e identificar regiões genômicas associadas à facilidade de parto (CE) em novilhas Nelore precoces. Um total de 1.277 fenótipos para CE foram coletados e classificados em duas categorias: i- parto não assistido, categorizado como sucesso (1) e ii- parto assistido, no qual as novilhas necessitaram de qualquer forma de assistência ou intervenção para parir, categorizado como falha (2). As estimativas de herdabilidade direta e materna para CE foram baixas (0,18) e moderadas (0,39), respectivamente, indicando que o progresso genético para essa característica é viável e, portanto, responderia favoravelmente à seleção direta. A análise de enriquecimento funcional revelou processos que podem influenciar diretamente os processos fetais envolvidos na gestação e na resposta ao estresse.
The growing global demand for safe and sustainable food production has motived a restructuring in the beef production sector aiming the production of better quality products without increasing the productive cost. Thus, animal breeding aims to improve economic productivity of future generations of domestic species through selection. Most of the economic important traits in livestock has a complex and quantitative expression, that is, they are influenced by a large number of genes and affected by environmental factors. However, there is no consensus among researches about the best methodology to obtain genomic prediction for each trait. There are different methods and pseudophenotypes used in genomic predictions, being necessary to determine the ideal for each trait of interest. In Chapter 2, the aim of this study was to estimate genetic parameters and identify genomic regions associated with carcass traits obtained by ultrasound and visual scores in Nellore cattle. Data from ~66,000 animals from the National Association of Breeders and Researchers (ANCP) were used. The variance components for back fat thickness (BF), rump fat thickness (RF) and Longissimus muscle area (LMA) were estimated considering a linear model whereas a threshold model were fitted for body structure (BS), finishing precocity (FP) and musculature (MS) traits were used. The SNP solutions were estimated using the ssGBLUP approach by considering windows of 10 consecutive SNPs. Regions that explained for more than 1.0% of the additive genetic variance were used. Gene enrichment analysis revealed GO biological processes that might be directly influenced the organism growth and development. In Chapter 3, the aim of this study was to compare the genomic prediction ability for carcass composition indicator traits in Nellore cattle using the Best Linear Unbiased Prediction (BLUP), Genomic BLUP (GBLUP), singlestep GBLUP (ssGBLUP), Bayesian methods (BayesA, BayesB, BayesC and BayesianLASSO) and an approach combining the pedigree matrix of genotypedanimals and the genomic matrix using a Bayesian analysis. Phenotypic and genotypic information on about 66, and 21,000 animals, respectively, evaluated by ANCP were available for BF, RF, LMA, BS, FP and MS. To obtain the prediction ability, the dataset was split into training (genotyped sires and dams with progenies) and validation (genotyped young animals without progeny records and without phenotypes) subsets. In terms of prediction ability and bias, Bayesian approaches were superior for visual scores traits and the ssGBLUP for carcass traits obtained by ultrasonography, however, more biased results were obtained for BF and RF using the ssGBLUP. The ssGBLUP model showed less biased prediction for low heritability traits, such as LMA, and also it has lower computational demand and it is a straightforward method for implementing genomic selection in beef cattle. In Chapter 4, the aim of this study was to estimate genetic parameters and to identify genomic regions associated with the calving ease (CE) in precocious Nellore heifers. A total of 1,277 CE phenotypes were collected and scored into two categories: i- nonassisted calving, categorized as success (1) and ii- assisted calving where heifers required any form of assistance or intervention to give birth, categorized as failure (2). The direct and maternal heritability estimates for CE were low (0.18) and moderate (0.39) respectively, indicating that genetic progress for this trait is feasible, and so, it would respond favorably to direct selection. Gene enrichment analysis revealed processes that might directly influence fetal processes involved in female pregnancy and stress response.
Resumo
A busca por animais com maior potencial de produção e maior eficiência reprodutiva tem contribuído para a implementação de diferentes tipos de programas de seleção. Com a genômica, torna-se possível a seleção dos animais sem a necessidade de mensuração de seus próprios fenótipos e/ou de seus parentes, e temse, também, a possibilidade de realizar a busca de genes ou regiões cromossômicas envolvidas com a expressão das características, por meio do estudo de associação genômica ampla (GWAS). A GWAS tem como objetivo associar regiões do genoma com fenótipos de interesse, identificar possíveis regiões de maior efeito sobre a característica e, posteriormente, investigar as funções biológicas dos genes que foram encontrados nestas regiões, visando assim, aumentar a compreensão da influência genética sobre a expressão fenotípica. O objetivo desse trabalho foi identificar regiões genômicas associadas com as características de produção de leite (PL), produção de gordura (PG), produção de proteína (PP), e produção de mozzarella (PMZ), mediante análise de duas diferentes abordagens: regressão single-SNP e Bayes C, Em adição diferenciar os genes encontrados nessas regiões que podem auxiliar na interpretação da expressão e fisiologia da característica. Foram utilizados dados fenotípicos e genotípicos provenientes da primeira lactação de 4068, 372, 488, 482 búfalas da raça Murrah pertencentes ao programa de controle leiteiro de bubalinos mantidos pelo Departamento de Zootecnia da UNESPJaboticabal, SP. No estudo de associação genômica ampla, foram identificadas algumas regiões cromossômicas polimórficas, sendo identificados 53 marcadores SNPs em comuns em ambas abordagens (Bayes C, regressão single-SNP), 30 SNPs para gordura, 18 para proteína e 5 para mozzarella. 9, 5 e 3 SNPs significativos para produção de gordura, proteína e mozzarella respetivamente pela abordagem Bayes C. 4 e 1 SNPs significativo para produção de gordura e proteína pela abordagem regressão single-SNP. Assim, os resultados têm permitido identificar diferentes regiões que continham genes importantes em diferentes processos biológicos e funções moleculares associadas pelo menos com um QTL, principalmente nos BBU6, BBU9, BBU3, BBU5 encontrassem os genes CRTC2, ILF2, RPS27, RHOBTB3, S100A1, S100A13, TRNAG-CCC, com efeito sob as diferentes características de qualidade do leite em búfalas avaliadas nessa pesquisa.
The search for animals with greater production potential and greater reproductive efficiency has contributed to the implementation of different types of selection programs. With genomics, it is possible to select animals without the need to measure their own phenotypes and / or their relatives, and there is also the possibility to search for genes or chromosomal regions involved with the expression characteristics, through the study of broad genomic association (GWAS). The objective of GWAS is to associate regions of the genome with phenotypes of interest, to identify possible regions of greatest effect on the trait and, subsequently, to investigate the biological functions of the genes that were found in these regions, thus seeking to increase the understanding of the genetic influence on phenotypic expression. The objective of this work was to identify genomic regions associated with the characteristics of milk production (PL), fat production (PG), protein production (PP), and mozzarella production (PMZ), by analyzing two different approaches: regression single-SNP and Bayes C, In addition to differentiate the genes found in these regions that can assist in the interpretation of the expression and physiology of the characteristic. Phenotypic and genotypic data from the first lactation of 4068, 372, 488, 482 Murrah buffaloes belonging to the buffalo milk control program maintained by the Department of Zootechnics at UNESP Jaboticabal, SP, were used. In the study of broad genomic association, some polymorphic chromosomal regions were identified, with 53 SNPs markers in common in both approaches (Bayes C, regression singleSNP), 30 SNPs for fat, 18 for protein and 5 for mozzarella. 9, 5 and 3 significant SNPs for fat, protein and mozzarella production respectively by the Bayes C approach. 4 and 1 significant SNPs for fat and protein production by the regression single-SNP approach. Thus, the results have allowed to identify different regions that contained important genes in different biological processes and molecular functions associated with at least one QTL, mainly in BBU6, BBU9, BBU3, BBU5 to find the CRTC2, ILF2, RPS27, RHOBTB3, S100A1, S100A13, TRNAG-CCC, with effect on the different quality characteristics of milk in buffaloes evaluated in this research.
Resumo
A galinha (Gallus Gallus) é uma importante fonte de proteína animal e é considerada um modelo biológico de pesquisa principalmente na área da genética. É notável que a produção de carne de frango tem extensa relevância na economia brasileira e mundial, consequência sobretudo da constante melhoria das características de desempenho. Neste sentido, a seleção de animais que apresentam tais características fenotípicas de interesse é fundamental. Nesta perspectiva, a identificação de variações genéticas e sua associação com características de importância zootécnica se apresentam como etapas cruciais para melhor compreensão dos mecanismos biológicos que controlam estas características complexas. Uma importante fonte de variação conhecida no DNA são as variações no número de cópias (CNVs), que podem contribuir significativamente com a variação fenotípica em diversas espécies. Neste contexto, foram utilizados os dados genotípicos de aproximadamente 1.500 animais de uma linha paterna de frangos de corte (TT), obtidos utilizando um chip de SNPs de alta densidade (600k, Affymetrix) para identificar regiões genômicas e genes candidatos associados à características de desempenho. Realizamos análises de associação genômica ampla (GWAS) baseadas em CNV usando o programa CNVRanger, ajustando um modelo linear misto, para identificar regiões no genoma associadas à: peso ao nascimento, peso aos 21 dias, peso aos 35 dias, peso aos 41 dias, peso aos 42 dias, consumo de ração, conversão alimentar e ganho de peso. Segmentos CNV significativamente associados ao peso ao nascimento, peso aos 35, 41 e 42 dias e ganho de peso foram identificados. Após as análises de associação, foi feita a validação destes segmentos CNV signifcativos associados por meio da técnica de qPCR (PCR quantitativa). A busca por genes candidatos foi feita dentro de cada região genômica associada, considerando termos de Gene Ontology (GO) e também a informação da literatura. Foram identificadas novas regiões no genoma associadas a estas características e importantes genes candidatos para crescimento e desenvolvimento muscular, tais como KCNJ11, MyoD1 e SOX6, fornecendo novas informações para melhor compreensão acerca da regulação do controle genético para desempenho em frangos.
Chicken (Gallus Gallus) is an important source of animal protein, considered a biological research model in the genetics field and a species of considerable economic relevance worldwide, mainly as a consequence of constant improvement of performance traits. In this sense, selection of animals that present phenotypic traits of interest is fundamental. Therefore, the identification of genetic variations and their association with production traits of economic importance are crucial steps for a better understanding of the biological mechanisms that control these complex characteristics. An important source of known variation in the DNA are copy number variations (CNVs), which can contribute significantly to phenotypic variation in several species. In this context, genotypic data from approximately 1,500 animals from a paternal broiler line (TT), obtained using a high-density SNP array (600k, Affymetrix), were used to identify genomic regions and candidate genes associated with performance traits. We performed a CNV-based genome-wide association study (GWAS) using the CNVRanger software, adjusting a linear mixed model, to identify regions in the genome associated with birth weight, body weight at 21 days, body weight at 35 days, body weight at 41 days, body weight at 42 days, feed intake, feed conversion ratio and body weight gain. CNV segments significantly associated with birth weight, body weight at 35, 41 and 42 days and body weight gain were identified. After the association analyses, validation of these significantly associated CNV segments was performed by qPCR. The search for candidate genes was made within each associated genomic region, considering Gene Ontology (GO) terms and also the literature information. We identified novel genomic regions associated with these traits and important candidate genes for muscle growth and development, such as KCNJ11, MyoD1 and SOX6, with known role on chicken growth and muscle development, providing new information for a better understanding of the regulation of genetic control for performance in broilers.
Resumo
A hérnia umbilical (HU) é uma condição que afeta a produção de suínos, reduzindo o bemestar e o desempenho dos animais. As potenciais causas que podem levar à HU são os distúrbios associados ao metabolismo do colágeno, estrutura muscular e reparo do tecido conjuntivo, levando à uma maior fragilidade e flacidez da região umbilical, fazendo com que a abertura umbilical não feche corretamente e que os intestinos projetem-se pela parede abdominal formando o saco herniário. Contudo, os componentes genéticos envolvidos com a UH são pouco compreendidos. Portanto, o objetivo deste estudo foi identificar genes e polimorfismos associados com a manifestação de hérnia umbilical em suínos utilizando sequenciamento de nova geração. Para isso, 10 leitoas com 90 dias de idade, 5 herniadas e 5 não-herniadas foram selecionadas. A extração de DNA foi realizada com o Purelink Genomic Mini Kit (Invitrogen), as bibliotecas exômicas foram preparadas usando o kit SeqCap EZ Library SR (1.0) (NimbleGen / Roche) e o sequenciamento foi realizado no equipamento Illumina HiSeq 2500 (2x100pb). Além disso, também foram utilizados dados de transcriptoma do anel umbilical disponíveis no banco de dados SRA para identificação de variantes. As leituras exômicas e transcriptômicas foram submetidas ao controle de qualidade utilizando a ferramenta Trimmomatic e mapeadas contra o genoma suíno de referência (Sscrofa11.1) utilizando o software BWA-MEM para o sequenciamento exômico e o STAR para o transcriptômico. A identificação dos polimorfismos foi realizada usando o Genome Analysis Toolkit (GATK) e o Variant Effect Predictor (VEP) do Ensembl foi usado para anotar e predizer o efeito das variantes. Essas variantes foram também comparadas com resultados de um estudo de associação genômica (GWAS). No exoma foram identificadas 209 variantes, 5 localizadas em regiões intergênicas e 204 localizadas em 72 genes. No transcriptoma foram identificadas 81 variantes localizadas em 42 genes. Dessas, 29 variantes do tipo SNP (Polimorfismo de Nucleotídeo Único) foram classificadas através do VEP como variantes missense. Comparando as três metodologias, obtivemos 79 variantes concordantes entre o exoma e o transcriptoma, localizadas em 23 genes. Além disso, 8 genes também foram identificados pela análise de GWAS. Portanto, destacamos as variantes nos genes FYN, SPN, ITGB2, MYLPF, MYH13, MYH8, MYH2, MYH3, MYO19, VIM, ROCK2, RABGEF1 e UBASH3B como fortes candidatas no desenvolvimento de UH em suínos. Destaca-se também a importância da combinação das três abordagens para identificar genes e polimorfismos potencialmente envolvidos no desencadeamento da UH.
Umbilical hernia (UH) is a condition that affects pig production, which reduces welfare and performance. The potential causes that can lead to UH are disorders associated with collagen metabolism, muscle structure and connective tissue repair, leading to a weakness and flabbiness in the umbilical region. In consequence, umbilical opening do not close properly and the intestines project through the abdominal wall, forming the herniary sac. However, the genetic components involved with UH are poorly understood. Therefore, the aim of this study was to identify genes and polymorphisms associated with the manifestation of umbilical hernia in pigs using next generation sequencing. Therefore, 10 gilts with 90 days of age, 5 herniated and 5 non-herniated were selected. DNA extraction was performed with the Purelink Genomic Mini Kit (Invitrogen), the exomic libraries were prepared using the SeqCap EZ Library SR (1.0) kit (NimbleGen / Roche) and the sequencing was performed in the Illumina HiSeq 2500 (2x100pb) equipment. Moreover, transcriptome data available in the SRA database were also used to identify variants. The exomic and transcriptomic sequencies were subjected to quality control using the Trimmomatic tool and mapped against the swine reference genome (Sscrofa11.1) using the BWA-MEM software for the exomic and the STAR for the transcriptomic sequencing. Polymorphisms were identified using the Genome Analysis Toolkit (GATK). The Ensembl's Variant Effect Predictor (VEP) was used to annotate and predict the effect of the variants. These variants were also compared with results from a genome-wide association study (GWAS). In the exome, 209 variants were found, 5 located in intergenic regions and 204 located in 72 genes. In the transcriptome, 81 variants were identified, which were located in 42 genes. From those, 29 single nucleotide polymorphisms (SNP) were classified with the VEP tool as missense variants. Comparing the three methodologies, we obtained 79 concordant variants between the exome and the transcriptome, located in 23 genes. Moreover, 8 genes were also identified by GWAS analysis. Therefore, we highlight the variants in the FYN, SPN, ITGB2, MYLPF, MYH13, MYH8, MYH2, MYH3, MYO19, VIM, ROCK2, RABGEF1 and UBASH3B genes as strong candidates in the development of UH in pigs. We also highlight the importance of combining the three approaches to identify genes and polymorphisms potentially involved with the onset of UH.
Resumo
A utilização de dados simulados é essencial para o desenvolvimento de métodos genômicos e avaliação de cenários que seriam inviáveis com o uso de dados reais. Neste estudo, objetivou-se avaliar a detecção de QTLs associados a um fenótipo semelhante à área de olho de lombo (AOL), assim como a eficiência da seleção genômica em ovinos (Ovis aries) para AOL, com uso o uso com diferentes estruturas genéticas, tamanhos populacionais e números de animais genotipados. No Capítulo 1, os QTLs foram detectados por estudo de associação genômica ampla com uso do método single-step GWAS e abordagem do p-valor exato, com informações geradas por meio de simulações baseadas em parâmetros de dados reais de AOL. Painéis simulados de SNPs de três densidades diferentes foram utilizados com base na estrutura do genoma ovino. Animais das três últimas gerações constituíram 48 cenários propostos de acordo com o painel de SNPs, quantidade de QTLs e número de animais genotipados. A significância de efeitos de SNPs foi obtida pela correção de Bonferroni e taxa de falsa descoberta. Verificou-se que quanto maior a quantidade de animais genotipados e SNPs no painel, maior a possibilidade de detecção de associações verdadeiras entre os SNPs significativos e os QTLs simulados. Com 2.014 QTLs, os cenários com o painel de alta densidade proporcionaram maior quantidade de detecções verdadeiras. Com 114 QTLs, geralmente, observou-se pelo menos uma associação verdadeira, com picos maiores nos cenários com maior quantidade de animais. Portanto, a abordagem do p-valor exato possibilitou a detecção de pelo menos uma associação verdadeira entre SNPs e QTLs simulados. No Capítulo 2, dois painéis de SNPs (12k e 50k) foram utilizados. Diferentes tamanhos de populações de referência e validação compuseram seis cenários diferentes para cada painel. O método single-step GBLUP foi utilizado para a estimação dos efeitos dos SNPs sobre AOL. A acurácia preditiva foi obtida pela correlação de Pearson entre os valores genéticos genômicos estimados (GEBVs) e verdadeiros (TBVs), bem como pelos coeficientes de regressão e viés de predição. As estimativas de herdabilidade variaram de 0,17 a 0,38. Os cenários com uso do painel de maior densidade resultaram em maiores estimativas de herdabilidade. As acurácias foram superestimadas e subestimadas, apresentaram baixa magnitude e foram maiores nos cenários com estruturas populacionais compostas por maior número de animais genotipados na população de treinamento. Os cenários com maiores estimativas de herdabilidade e menores acurácias tiveram maiores vieses de predição. As estimativas de acurácia menos viesadas foram obtidas em cenários com maior número de animais genotipados na população de referência.
A utilização de dados simulados é essencial para o desenvolvimento de métodos genômicos e avaliação de cenários que seriam inviáveis com o uso de dados reais. Neste estudo, objetivou-se avaliar a detecção de QTLs associados a um fenótipo semelhante à área de olho de lombo (AOL), assim como a eficiência da seleção genômica em ovinos (Ovis aries) para AOL, com uso o uso com diferentes estruturas genéticas, tamanhos populacionais e números de animais genotipados. No Capítulo 1, os QTLs foram detectados por estudo de associação genômica ampla com uso do método single-step GWAS e abordagem do p-valor exato, com informações geradas por meio de simulações baseadas em parâmetros de dados reais de AOL. Painéis simulados de SNPs de três densidades diferentes foram utilizados com base na estrutura do genoma ovino. Animais das três últimas gerações constituíram 48 cenários propostos de acordo com o painel de SNPs, quantidade de QTLs e número de animais genotipados. A significância de efeitos de SNPs foi obtida pela correção de Bonferroni e taxa de falsa descoberta. Verificou-se que quanto maior a quantidade de animais genotipados e SNPs no painel, maior a possibilidade de detecção de associações verdadeiras entre os SNPs significativos e os QTLs simulados. Com 2.014 QTLs, os cenários com o painel de alta densidade proporcionaram maior quantidade de detecções verdadeiras. Com 114 QTLs, geralmente, observou-se pelo menos uma associação verdadeira, com picos maiores nos cenários com maior quantidade de animais. Portanto, a abordagem do p-valor exato possibilitou a detecção de pelo menos uma associação verdadeira entre SNPs e QTLs simulados. No Capítulo 2, dois painéis de SNPs (12k e 50k) foram utilizados. Diferentes tamanhos de populações de referência e validação compuseram seis cenários diferentes para cada painel. O método single-step GBLUP foi utilizado para a estimação dos efeitos dos SNPs sobre AOL. A acurácia preditiva foi obtida pela correlação de Pearson entre os valores genéticos genômicos estimados (GEBVs) e verdadeiros (TBVs), bem como pelos coeficientes de regressão e viés de predição. As estimativas de herdabilidade variaram de 0,17 a 0,38. Os cenários com uso do painel de maior densidade resultaram em maiores estimativas de herdabilidade. As acurácias foram superestimadas e subestimadas, apresentaram baixa magnitude e foram maiores nos cenários com estruturas populacionais compostas por maior número de animais genotipados na população de treinamento. Os cenários com maiores estimativas de herdabilidade e menores acurácias tiveram maiores vieses de predição. As estimativas de acurácia menos viesadas foram obtidas em cenários com maior número de animais genotipados na população de referência.
Resumo
A hérnia escrotal é um dos defeitos mais observados na suinocultura e acarreta perdas produtivas no campo e na indústria, além de comprometer o pleno bem-estar animal. Também é um dos problemas mais frequentes em humanos, o que torna o suíno um excelente modelo animal para estudos. Sendo assim, o objetivo deste estudo foi prospectar regiões do genoma suíno, relacionadas a manifestação de hérnia escrotal, a fim de encontrar possíveis genes candidatos à doença por meio do estudo de associação global do genoma (GWAS). As análises foram realizadas utilizando-se duas metodologias: marcadores únicos e marcadores múltiplos. Para tal, utilizaram-se os softwares computacionais Plink 1.9 e Blossoc, respectivamente. O estudo foi organizado em delineamento caso-controle, e para isso foram usadas amostras de 296 suínos comerciais machos, de linhagem híbrida (Agroceres PIC®). O DNA genômico foi extraído das amostras com kits específicos e posteriormente enviado para genotipagem com o painel de polimorfismos de nucleotídeo único (SNP) GGP porcine BeadChip (Neogen, Lincon, NE, EUA), que contém 51.558 SNPs distribuídos pelo genoma suíno. Ao final do controle de qualidade das amostras restaram 294 animais, sendo 101 casos e 193 controles. O controle de qualidade dos SNPs começou com 50.697 SNPs e terminou com 39.450 SNPs (metodologia de marcadores únicos) e 39.371 SNPs (metodologia de marcadores múltiplos). Foram gerados os gráficos Manhattan Plot, QQ-Plot e o gráfico de escores. Os dados foram enriquecidos através das bases de dados DAVID, REVIGO e STRING. Ao total, 27 SNPs distribuídos nos cromossomos SSC3, SSC8, SSC9, SSC14, SSC15, SSC16 e cromossomo sexual, foram significativos nas análises do Plink, 57 genes foram prospectados, sendo 38 caracterizados e 19 não caracterizados. Nas análises do Blossoc, 395 SNPs ultrapassaram o nível sugestivo de significância, 381 genes foram prospectados, sendo 235 caracterizados e 146 não caracterizados. Os SNPs com maior significância foram observados nos cromossomos 8 e 15, para ambas as metodologias, sendo que os SNPs presentes no cromossomo 15 foram mapeados em regiões muito semelhantes. No total, 19 genes foram prospectados nas análises de ambas as metodologias, sendo assim considerados fortes candidatos. Entretanto, também foram considerados os genes singulares a cada metodologia, com o intuito de encontrar genes de menor efeito, principalmente por meio das análises de múltiplos marcadores. Diversos SNPs foram observados próximos aos genes SLIT2, RAB28, WDR1, CLNK, COL4A4, KCNIP4, FRYL, DRD2, GPER1, CANB4 e STIM2. Os genes prospectados enriqueceram processos biológicos de contratilidade muscular, estimulação do fator de crescimento, resposta inflamatória, metabolismo de colágeno, entre outras, os tornando fortes candidatos à manifestação de hérnia escrotal em suínos. Os genes prospectados nestas análises não foram relacionados a manifestação de hérnia escrotal em suínos até o momento. Pesquisas futuras poderão ser realizados a partir deste estudo, com o intuito de validar os genes prospectados.
Scrotal hernia is one of the most common defects in swine and results in productive losses in the field and in the industry, also compromising the animal welfare. It is also one of the most frequent problems in humans, which makes the pig an excellent animal model for studies. Thus, the objective of this study was to search for regions of the swine genome, related to the manifestation of scrotal hernia, to find possible candidate genes for this disorder using a genome-wide association study (GWAS) approach. The analyses were performed using two methodologies: single marker and multiple marker association, which were performed with Plink 1.9 and Blossoc software, respectively. The study followed a case-control design with 296 samples of males from a commercial hybrid line of pigs (Agroceres PIC®). The genomic DNA was extracted from the samples with specific kits and sent for genotyping with the single nucleotide polymorphism (SNP) panel GGP porcine BeadChip (Neogen, Lincon, NE, USA), which contains 51.558 SNPs distributed across the porcine genome. After the the data quality control, 294 animals remained, 101 cases and 193 controls. The quality control of SNPs started with 50.697 SNPs and ended with 39.450 SNPs (single marker) and 39.371 SNPs (multiple markers). Manhattan Plots, QQ-Plots and score graphs were generated. The genes found were enriched in the DAVID, REVIGO and STRING databases. In total, 27 SNPs distributed on chromosomes SSC3, SSC8, SSC9, SSC14, SSC15, SSC16 and sex chromosome, were significant in the single marker analysis, 57 genes were prospected, of which 38 were characterized and 19 were not characterized. In the multiple marker analysis, 395 have passed the suggestive level of significance, 381 genes were prospected, of which 235 were characterized and 146 were not characterized. The most significant SNPs were observed on chromosomes 8 and 15, for both methodologies, and the SNPs located on SSC15 were mapped in very similar regions. In total, 19 genes were found with the analysis using both methodologies which were considered strong candidates for SH onset. However, genes unique to each methodology were also prospected mainly through the analysis of multiple markers. Several SNPs were observed in regions near the SLIT2, RAB28, WDR1, CLNK, COL4A4, KCNIP4, FRYL, DRD2, GPER1, CANB4 and STIM2 genes. The prospected genes enriched biological processes of muscle contractility, growth factor stimulation, inflammatory response, collagen metabolism, among others, making them strong candidates for the manifestation of scrotal hernia in pigs. The genes prospected in these analyses have not yet been related to the manifestation of scrotal hernia in pigs so far. Future research may be carried out to validate the prospected genes from this association study.
Resumo
Selecionar animais que possuem alelos favoráveis em genes que participam do controle genético de características de interesse econômico pode aumentar a eficiência dos programas de melhoramento de bovinos de corte. Neste sentido, dois artigos foram desenvolvidos com o objetivo principal de identificar genes candidatos funcionais (GCF) para características importantes em bovinos da raça Nelore. No primeiro artigo, Genes underlying genetic correlations between growth, reproduction and parasite burden traits in beef cattle, estimamos a correlação genética entre características de crescimento, reprodução e carga parasitária e identificamos GCF que influenciam mais de uma dessas características. Avaliamos seis características, incluindo duas de crescimento (peso corporal - PC e ganho médio diário - GMD), uma de reprodução (circunferência escrotal - CE) e três de carga parasitária (contagem de carrapatos - CAR, ovos de nematóides gastrointestinais por grama de características - ONG e Eimeria spp. oocistos por grama de fezes - EIM). As correlações genéticas foram obtidas por meio de um modelo de multi característico. Um total de 21.667 marcadores SNP foram utilizados para realizar o GWAS e identificar janelas genômicas que explicavam pelo menos 1% da variação genética para as características avaliadas. As correlações genéticas foram positivas e de magnitude moderada para os pares de características PC-GMD (0,64), PC-CE (0,38), PC-CAR (0,39), GMD-CE (0,27) e CAR-EIM (0,33). Somente o par GMD-EIM apresentou correlação negativa (-0,22). Para todos os outros pares, as correlações genéticas foram próximas de zero. Além disso, análises funcionais foram realizadas e os GCFs foram selecionados com base no controle genético destes sobre processos biológicos para cada uma das características. Os efeitos dos SNPs foram calculados como desvio padrão genético e mostraram que existem SNPs mapeados próximo a GCF que promovem o melhoramento genético de ambas as características em sentido favorável. As análises funcionais apontaram sete genes, SLC16A4, KCNA2, LAMTOR5, DUSP10, MAP3K1, TPMT e KIF13A como GCFs com efeitos sobre mais de uma característica. Independentemente dos valores de correlação genética (baixo a moderado), existem GCF que podem influencia ras características de produção, reprodução ou resistência, em conjunto. No segundo artigo, Candidate genes for longitudinal traits under selection in beef cattle, identificamos GCF que participam do controle genético do peso corporal em cinco idades diferentes idades (330, 385, 440, 495 e 550 dias), em arquivos de dados com ou sem simulação de seleção sequencial. Os parâmetros genéticos para o peso corporal foram estimados por meio de dois modelos, um modelo unicaracterístico (UNI) e um modelo de regressão aleatória com polinômios spline (REG) para dois bancos de dados, um com todos os registros de peso corporal (AD100) e outro com um seleção sequencial simulada de 70% dos animais mais pesados (AD70). Os pesos corporais foram padronizados para 330, 385, 440, 495 e 550 dias de idade para UNI. Para o REG, os nós de splines lineares foram ajustados para as idades 274, 330, 385, 440, 495, 550 e 594 dias de idade. Os estudos de associação ampla do genoma (GWAS) foram realizados com os resultados dos modelos UNI e REG. O GWAS e o enriquecimento funcional foram realizados conforme descrito anteriormente para o primeiro artigo. Identificamos sete GCF (DUSP10, LAMTOR5, PAFAH2, SLC30A2, TRIM63, NCAM1 e SCL16A4) para peso corporal em diferentes idades. O gene DUSP10 foi associado ao peso corporal em todas as cinco idades avaliadas, sugerindo a importância desse gene para os diferentes estágios do crescimento animal. Por outro lado, a maioria dos GCF associados ao peso corporal foram diferentes para diferentes idades, sugerindo que a importância de cada gene para o crescimento animal também pode mudar em diferentes estágios de desenvolvimento e diferentes genes podem ser mais relevantes para o peso corporal em cada estágio de crescimento. Quando a seleção sequencial foi simulada, diferentes GCF foram associadas ao peso corporal no AD100 e AD70 para cada idade, mesmo quando o REG foi utilizado. Portanto, mesmo que os valores dos parâmetros genéticos para AD100 e AD70 não sejam, em geral, diferentes entre si, quando o GWAS é realizado, a seleção sequencial pode influenciar os resultados e esse pode ser mais um motivo para inconsistências frequentes nos resultados do GWAS realizados para características de crescimento medidas em bovinos de corte. Sugerimos que, é necessário validar nossas descobertas para o primeiro e o segundo artigos para cada gene em cada característica em populações maiores e outras raças, a fim de melhorar a compreensão sobre o controle genético das características de crescimento, reprodução e carga parasitária, especialmente para os genes candidatos funcionais identificados neste trabalho. Por fim, concluímos que, os genes aqui identificados como candidatos funcionais para cada uma das caraterísticas de crescimento, reprodução e contagem de parasitos podem ser considerados pelos programas de avaliação genética de bovinos de corte, uma vez que, possibilitam a identificação e seleção de animais portadores de alelos que conferem maior potencial produtivo, reprodutivo e de resistência a parasitos.
Selecting animals which have favorable alleles in genes that participate in the genetic control of economic interest traits may increase the efficiency of beef cattle breeding programs. In this way, two papers were developed with the main aim of identified functional candidate genes (FCG) for important traits in Nellore cattle. In the first paper, Genes underlying genetic correlations between growth, reproduction and parasite burden traits in beef cattle, we aim estimate the genetic correlation between growth, reproduction and parasite burden traits and identified FCG that influence more than one of these traits. We evaluated six traits, comprising two of growth (body weight - BW and average daily gain - ADG), one of reproduction (scrotal circumference - SC) and three parasite burden (counts of tick - TICK, gastrointestinal nematode eggs per gram of feaces - GIN, and Eimeria spp. oocysts per gram of faeces - EIM). The genetic correlations were obtained through a multiple trait model. A total of 21,667 SNP markers were used to perform a single-step GWAS, and to identify genomic windows that explained at least 1% of the genetic variance for the evaluated traits. The genetic correlations were positive and of a moderate magnitude for the pairs of traits BW-ADG (0.64), BW-PE (0.38), BW-TICK (0.39), ADG-PE (0.27), and TICK-EIM (0.33). Only the pair ADG-EIM presented a negative correlation (-0.22). For all the other pairs, the genetic correlations were close to zero. Additionally, functional analyses were performed and FCGs were selected based on their roles in biological processes for each of the traits. The effects of the SNPs were calculated as genetic standard deviation and showed that, there were SNPs mapped in FCG that promoted genetic improvement to both traits. The functional analyses selected seven genes, SLC16A4, KCNA2, LAMTOR5, DUSP10, MAP3K1, TPMT, and KIF13A as FCGs with effects over more than one trait. Independently of the genetic correlation values (low-moderate) there are FCG that can influence both production, reproduction or resistance traits in beef cattle. In the second paper, Candidate genes for longitudinal traits under selection in beef cattle, we aim to identify functional candidate genes which take part in genetic control of body weight in five different days of age (330, 385, 440, 495 and 550) for a beef cattle population with and without simulation of sequential selection. The genetic parameters for body weight were estimated by a single trait (STM) and a random regression model with spline polynomials (RRM) for two databases which one with all of body weight records (DB100) and another one which a sequential selection of 70% of heaviest animals were performed (DB70). Body weights were standardized at 330, 385, 440, 495 and 550 days of age for STM. In RRM, the knots of linear splines were fitted at 274, 330, 385, 440, 495, 550 and 594 days of age. The genome wide association studies (GWAS) were performed with both STM and RRM. The GWAS and the functional enrichment were perform as previous described from the first paper. We identified seven FCG (DUSP10, LAMTOR5, PAFAH2, SLC30A2, TRIM63, NCAM1 and SCL16A4) to body weight in different ages. The DUSP10 gene was associated with body weight in all the five ages here evaluated, appointing for the relevance of this gene for different stages of the animal growth. On the other hand, the majority of the FCG associated with body weight were different for different ages suggesting that the importance of the each gene for animal growth can change in different development stages and different genes can be more relevant to body weight in each growth stage. When the sequential selection was simulated different FCG were associated with body weight in DB100 and DB70 for each age, even when the RRM was performed. Therefore, even the genetic parameters values for DB100 and DB70 were, in general, no different between them, when GWAS and post GWAS are performed, the sequential selection can influence the results and this may be one more reason for frequent inconsistences in GWAS results performed for growth traits measured in beef cattle. We suggest that, it is necessary to validate our findings for both, first and second papers, to each gene in each trait in larger populations and other breeds to improve the understanding about the genetic control of growth, reproduction and parasite burden traits, especially for the functional candidate genes here appointed. Finally, we conclude that the genes identified here as functional candidates for each traits of growth, reproduction and parasite burden may be considered by the beef cattle breeding programs, since they allow the identification of animals with alleles that confer greater productive, reproductive and health potential.
Resumo
A raça Gir (Bos indicus) é importante recurso genético para produção de carne e leite no Brasil e em países tropicais. Estudos genômicos entre populações são de interesse para identificar regiões genômicas importantes e aplicar na seleção de caraterísticas de produção. As corridas de homozigose (ROH) são regiões homozigotas contíguas do genoma, utilizadas na identificação de genes associados a características de interesse econômico, bem como na obtenção dos coeficientes de endogamia. A interação genótipo ambiente (IGA), também representa papel importante no estudo de populações de bovinos e na seleção dos melhores reprodutores para os diferentes ambientes. Com isto, os objetivos do presente estudo foram analisar o comprimento e a distribuição das ilhas ROH do genoma, com identificação dos gene presentes, além de avaliar a acurácia da imputação utilizando diferentes painéis comerciais e a interação genótipo ambiente da produção de leite em bovinos da raça Gir do Brasil e Colômbia. Na avaliação das ilhas ROH foram utilizados dados genotípicos de 173 animais selecionados para produção de carne e 291 animais selecionados para produção leiteira e obtidos os resultados via programa Plink. Análise da acurácia utilizando diferentes painéis de SNPs (GGP Bovine 30K, GGP indicus 35K e HD 777K) de 464 animais do Brasil e da Colômbia foram avaliados e os resultados comparados via correlação simples (CS) e taxa de concordância (CR). Na análise da IGA foi utilizado modelo de norma de reação bi-característica para produção de leite até 305 dias no Brasil (PL305BR) e Colômbia (PL305COL) usando os programas GIBBS3F90 e POSTGSf90, e incluía dados genotípicos (27.505 SNPs) de 464 animais. A análise ROH apresentou diferenças no número de ROH curto (ROH1-2 Mb) entre as duas populações, enquanto o número de ROH longo (ROH> 16 Mb) foi semelhante. As ilhas ROH com frequência maior que 0,5 sobrepuseram vários segmentos do genoma das duas populações. Os genes identificados foram associados à produção de leite, crescimento, reprodução, resposta imune e características de resistência. A maior porcentagem de acurácia dos quatro cenários estudados, demonstrou o painel de 30K com maiores valores de CS (94%) e2 CR (96%), portanto, a densidade de 30K foi indicada para ser utilizada na imputação dos dados das análises posteriores que incluía dados do Brasil e Colômbia. No modelo de norma de reação, os resultados das caraterísticas PL305BR e PL305COL evidenciaram IGA pela reclassificação dos touros entre os dois países, demonstrando diferenças ambientais e a importância da aplicação desta metodologia na avaliação e seleção dos touros. Além disto, foram identificadas regiões genômicas afetando o intercepto e inclinação da norma de reação e influenciando a expressão de genes relacionados à produção de leite, imunidade e fertilidade. Os resultados contribuem no entendimento da seleção para diferentes fins (leite e carne) moldando segmentos do genoma e aumentando a frequência de regiões em homozigose. Quanto a imputação, se verificou a importância da escolha do painel para posterior imputação dos dados genotípicos de animais da raça Gir. O uso de metodologia adequada considerando a IGA se faz necessário em análise incluindo dados de PL305 do Brasil e Colômbia, e evita reclassificação dos touros nos diferentes ambientes. Conclui-se, aplicação de programa de melhoramento em animais da raça Gir com informações genômicas permite controlar os coeficientes de endogamia e identificar alterações de frequência e tamanho de regiões relacionadas as características de interesse econômico, devido ao direcionamento da seleção, além da importância da escolha de painéis de forma a obter a maior acurácia da imputação e da aplicação de modelos considerando a IGA, possibilitando maior precisão na escolha dos reprodutores.
The Gir breed (Bos indicus) is an important genetic resource for meat and milk production in Brazil and in tropical countries. Genomic studies between populations are of interest to identify important genomic regions and apply in the selection of production traits. Runs of Homozygosity (ROH) are contiguous homozygous regions of the genome, used to identify genes associated with characteristics of economic interest, as well as to obtain inbreeding coefficients. The environment genotype (IGA) interaction also plays an important role in the study of bovine populations and in the selection of the best breeders for different environments. Thus, the objectives of the present study were to analyze the length and distribution of the ROH islands of the genome, with identification of the present genes, in addition to assessing the accuracy of imputation using different commercial panels and the environment genotype interaction of milk production in cattle of the Gir breed from Brazil and Colombia. In the evaluation of the ROH islands, genotypic data from 173 animals selected for beef production and 291 animals selected for milk production were used and the results were obtained through the Plink program. Accuracy analysis using different SNP panels (GGP Bovine 30K, GGP indicus 35K and HD 777K) from 464 animals from Brazil and Colombia were evaluated and the results were compared using simple correlation (CS) and concordance rate (CR). The IGA analysis used a bi-traits reaction standard model for milk production up to 305 days in Brazil (PL305BR) and Colombia (PL305COL) using the GIBBS3F90 and POSTGSf90 programs, and included genotypic data (27,505 SNPs) from 464 animals. The ROH analysis showed differences in the number of short ROH (ROH1-2 Mb) between the two populations, while the number of long ROH (ROH> 16 Mb) was similar. ROH islands with a frequency greater than 0.5 overlapped several segments of the genome of the two populations. The identified genes were associated with milk production, growth, reproduction, immune response and resistance characteristics. The highest percentage of accuracy of the four scenarios studied, demonstrated the panel of 30K with higher values of CS (94%) and CR (96%), therefore, the density of 30K was indicated to be used in the imputation of the data of4 the later analyzes that included data from Brazil and Colombia. In the reaction norm model, the results of the traits PL305BR and PL305COL showed IGA by the reclassification of sires between the two countries, demonstrating environmental differences and the importance of applying this methodology in the evaluation and selection of sires. In addition, genomic regions were identified, affecting the intercept and slope of the reaction norm and influencing the expression of genes related to milk production, immunity and fertility. The results contribute to the understanding of the selection for different purposes (milk and meet) shaping segments of the genome and increasing the frequency of homozygous regions. As for the imputation, it was verified the importance of choosing the panel for later imputation of the genotypic data of Gir animals. The use of appropriate methodology considering the IGA is necessary in analysis including data from PL305 from Brazil and Colombia, and avoids reclassification of bulls in different environments. In conclusion, application of a breeding program in Gir animals with genomic information allows controlling the inbreeding coefficients and identifying changes in frequency and size of regions related to the traits of economic interest, due to the direction of selection, in addition to the importance of choice of panels in order to obtain the highest accuracy of imputation and application of models considering the IGA, enabling greater precision in the choice of sires.