Resumo
ABSTRACT: Quantile Random Forest (QRF) is a non-parametric methodology that combines the advantages of Random Forest (RF) and Quantile Regression (QR). Specifically, this approach can explore non-linear functions, determining the probability distribution of a response variable and extracting information from different quantiles instead of just predicting the mean. This evaluated the performance of the QRF in the genomic prediction for complex traits (epistasis and dominance). In addition, compare the accuracies obtained with those derived from the G-BLUP. The simulation created an F2 population with 1,000 individuals and genotyped for 4,010 SNP markers. Besides, twelve traits were simulated from a model considering additive and non-additive effects, QTL (Quantitative trait loci) numbers ranging from eight to 120, and heritability of 0.3, 0.5, or 0.8. For training and validation, the 5-fold cross-validation approach was used. For each fold, the accuracies of all the proposed models were calculated: QRF in five different quantiles and three G-BLUP models (additive effect, additive and epistatic effects, additive and dominant effects). Finally, the predictive performance of these methodologies was compared. In all scenarios, the QRF accuracies were equal to or greater than the methodologies evaluated and proved to be an alternative tool to predict genetic values in complex traits.
RESUMO: Quantile Random Forest (QRF) é uma metodologia não paramétrica, que combina as vantagens do Random Forest (RF) e da Regressão Quantílica (QR). Especificamente, essa abordagem pode explorar funções não lineares, determinando a distribuição de probabilidade de uma variável resposta e extraindo informações de diferentes quantis em vez de apenas prever a média. O objetivo deste trabalho foi avaliar o desempenho do QRF em predizer o valor genético genômico para características com arquitetura genética não aditiva (epistasia e dominância). Adicionalmente, as acurácias obtidas foram comparadas com aquelas advindas do G-BLUP. A simulação criou uma população F2 com 1.000 indivíduos genotipados para 4.010 marcadores SNP. Além disso, doze características foram simuladas a partir de um modelo considerando efeitos aditivos e não aditivos, com número de QTL (Quantitative trait loci) variando de oito a 120 e herdabilidade de 0,3, 0,5 ou 0,8. Para treinamento e validação foi usada a abordagem da validação cruzada 5-fold. Para cada um dos folds foram calculadas as acurácias de todos os modelos propostos: QRF em cinco quantis diferentes e três modelos do G-BLUP (com efeito aditivo, aditivo e epistático, aditivo e dominante). Por fim, o desempenho preditivo dessas metodologias foi comparado. Em todos os cenários, as acurácias do QRF foram iguais ou superiores às metodologias avaliadas e mostrou ser uma ferramenta alternativa para predizer valores genéticos em características complexas.
Resumo
Quantile Random Forest (QRF) is a non-parametric methodology that combines the advantages of Random Forest (RF) and Quantile Regression (QR). Specifically, this approach can explore non-linear functions, determining the probability distribution of a response variable and extracting information from different quantiles instead of just predicting the mean. This evaluated the performance of the QRF in the genomic prediction for complex traits (epistasis and dominance). In addition, compare the accuracies obtained with those derived from the G-BLUP. The simulation created an F2 population with 1,000 individuals and genotyped for 4,010 SNP markers. Besides, twelve traits were simulated from a model considering additive and non-additive effects, QTL (Quantitative trait loci) numbers ranging from eight to 120, and heritability of 0.3, 0.5, or 0.8. For training and validation, the 5-fold cross-validation approach was used. For each fold, the accuracies of all the proposed models were calculated: QRF in five different quantiles and three G-BLUP models (additive effect, additive and epistatic effects, additive and dominant effects). Finally, the predictive performance of these methodologies was compared. In all scenarios, the QRF accuracies were equal to or greater than the methodologies evaluated and proved to be an alternative tool to predict genetic values in complex traits.
Quantile Random Forest (QRF) é uma metodologia não paramétrica, que combina as vantagens do Random Forest (RF) e da Regressão Quantílica (QR). Especificamente, essa abordagem pode explorar funções não lineares, determinando a distribuição de probabilidade de uma variável resposta e extraindo informações de diferentes quantis em vez de apenas prever a média. O objetivo deste trabalho foi avaliar o desempenho do QRF em predizer o valor genético genômico para características com arquitetura genética não aditiva (epistasia e dominância). Adicionalmente, as acurácias obtidas foram comparadas com aquelas advindas do G-BLUP. A simulação criou uma população F2 com 1.000 indivíduos genotipados para 4.010 marcadores SNP. Além disso, doze características foram simuladas a partir de um modelo considerando efeitos aditivos e não aditivos, com número de QTL (Quantitative trait loci) variando de oito a 120 e herdabilidade de 0,3, 0,5 ou 0,8. Para treinamento e validação foi usada a abordagem da validação cruzada 5-fold. Para cada um dos folds foram calculadas as acurácias de todos os modelos propostos: QRF em cinco quantis diferentes e três modelos do G-BLUP (com efeito aditivo, aditivo e epistático, aditivo e dominante). Por fim, o desempenho preditivo dessas metodologias foi comparado. Em todos os cenários, as acurácias do QRF foram iguais ou superiores às metodologias avaliadas e mostrou ser uma ferramenta alternativa para predizer valores genéticos em características complexas.
Assuntos
Seleção Genética , Genoma , Genômica , Epistasia Genética , Algoritmo Florestas AleatóriasResumo
Neste texto são abordados dados sobre o rebanho pecuário brasileiro, sobre conceitos básicos de genômica, resultados da aplicação da genômica na área e novos projetos em andamento ligados à fertilidade de machos, com auxílio da genômica.(AU)
This text discusses data on the Brazilian results of the application of genomics in the area and new projects in progress related to male fertility, with the help of genomics.(AU)
Assuntos
Animais , Masculino , Bovinos/genética , Genômica/métodos , Fertilidade/genética , Criação de Animais Domésticos/métodos , AndrologiaResumo
Despite several difficulties in chromosomal analyses of small-sized fishes, the cytogenetics of the Lebiasinidae was largely improved in the last years, showing differential patterns in the chromosomal evolution inside the family. In this context, it has been shown that genus Lebiasina preserves its karyotypic macrostructure, composed of 2n = 36 chromosomes, whereas the other genera generally present higher 2n. This study focused on the comparative cytogenetics of three Lebiasina species, one of them analyzed here for the first time, using conventional and molecular procedures. The results reinforced the differentiated evolutionary path of the genus Lebiasina while, at the same time, highlighted the genomic particularities that have accompanied the evolution of each species. In this sense, the repetitive components of the genome played a significant role in the differentiation of each species. It is also notable that L. minuta and L. melanoguttata, the two species that occur exclusively in the Brazilian territory, show greater chromosomal similarities to each other than to the trans-Andean sister species, L. bimaculata.(AU)
Apesar das dificuldades encontradas em se realizar análises cromossômicas em peixes de pequeno porte, os estudos citogenéticos em Lebiasinidae vêm crescendo nos últimos anos e demonstrando padrões diferenciados na evolução cromossômica entre os membros da família. Nesse contexto, o gênero Lebiasina tem mostrado preservar sua macroestrutura cariotípica, composta por 2n = 36 cromossomos, enquanto os demais gêneros geralmente apresentam 2n maiores. Este estudo tem como foco a citogenética comparativa de três espécies de Lebiasina, sendo uma delas analisada pela primeira vez aqui, através do emprego de técnicas convencionais e moleculares. Os resultados obtidos reforçam a trajetória evolutiva diferenciada do gênero Lebiasina, ao mesmo tempo em que evidenciam as particularidades genômicas que acompanham a evolução de cada uma das espécies. Neste contexto, os componentes repetitivos do genoma tiveram um papel importante na caracterização particular de cada uma das espécies. Também, é notável que L. minuta e L. melanoguttata, duas espécies que ocorrem exclusivamente no território brasileiro, apresentam maior proximidade citogenética entre elas do que com a espécie irmã transandina, L. bimaculata.(AU)
Assuntos
Animais , Cromossomos , Genoma , Citogenética , Caraciformes/genética , Hibridização GenéticaResumo
Bay snook (Petenia splendida) is a carnivorous cichlid species with excellent economic value in Southeast Mexico. Although this species presents an excellent potential for commercial aquaculture, the information about its nutritional, physiological, and reproductive metabolic pathways is meager. The current study focuses on the expression of glucose transporter 2 (glut2) in embryos and larvae at 5, 10, 15-, 20-, 25-, and 30-days post-hatch (dph) and in the liver, intestine, kidney, muscle, heart, testicle, gill, stomach, pancreas, and brain of adult fish. The partial sequence of glut2 was obtained, and specific qPCR primers were designed. In embryos, the expression was lower compared to larvae at 5, 15, and 20 dph. The highest expression in larvae occurred at 20 dph and the lowest at 25 and 30 dph. Maximum expression levels in adults occurred in the liver and intestine. Our results show that glut2 is expressed differentially across tissues of adult bay snook, and it fluctuates during larval development.(AU)
La mojarra tenguayaca (Petenia splendida) es una especie de cíclido carnívoro con excelente valor comercial en el sureste de México. A pesar de su potencial para la acuicultura, existe muy poca información sobre sus rutas metabólicas relacionadas con su nutrición, fisiología y reproducción. El presente estudio se enfoca en la expresión del transportador de glucosa (glut2) en embriones y larvas de 5, 10, 15, 20, 25 y 30 días post eclosión (dph) y en el hígado, intestino, riñón, músculo, corazón, testículo, branquias, estómago, páncreas y cerebro en peces adultos. Se diseñaron cebadores de qPCR específicos para glut2. La expresión en los embriones fue menor que en larvas a los 5, 15 y 20 dph. La expresión máxima en larvas se observó a los 20 dph y la mínima a los 25 y 30 dph. La expresión más alta en los adultos ocurrió en el hígado y el intestino. Nuestros resultados muestran que el gen glut2 se expresa de manera diferencial en los tejidos de adultos de la mojarra tenguayaca y su expresión fluctúa durante el desarrollo larvario.(AU)
Assuntos
Animais , Perciformes/crescimento & desenvolvimento , Expressão Gênica , Transportador de Glucose Tipo 2/genéticaResumo
Because Canine circovirus (CanineCV) is a new species of the genus Circovirus, several issues related to its epidemiology, pathogenesis and clinical disease remain unknown. Thus, this study aimed to perform the characterization of the first complete genome sequence of CanineCV detected in a dog with diarrhea in Brazil. A stool sample was collected of a ten-month-old female German Shepherd dog which had signs of intermittent hemorrhagic gastroenteritis, vomiting, and a history of eating raw pork. The complete CanineCV genome was sequenced by Next-Generation Sequencing. The sequence had 2,063 nucleotides, showed a typical genomic organization for circovirus, and was grouped with strain 214 described in the United States by phylogenetic analysis. One amino acid change was found in the replicase protein, and because of that it was considered unique to CanineCV. Therefore, the characterization of the complete genome of Brazilian CanineCV can be used in future studies of molecular epidemiology, pathogenesis and development of diagnostic tools for the prevention and control of this disease.(AU)
Como o Canine circovirus (CanineCV) é uma nova espécie do Gênero Circovirus, várias questões relacionadas com a sua epidemiologia, patogenia e doença clínica permanecem desconhecidas. Assim, este estudo objetivou realizar a caracterização da primeira sequência do genoma completo do CanineCV detectado em um cão com diarreia, no Brasil. Uma amostra de fezes foi coletada de um cão da raça Pastor Alemão, fêmea, 10 meses de idade, o qual tinha sinais de gastroenterite hemorrágica intermitente, vômito e uma história de ingestão de carne crua de porco. O genoma completo do CanineCV foi sequenciado pelo Sequenciamento de Nova Geração. A sequência tinha 2.063 nucleotídeos, apresentou uma organização genômica típica para um circovírus e foi agrupado com a cepa 214, descrita nos Estados Unidos pela análise filogenética. Uma mudança de aminoácido foi encontrada na proteína de replicação e por causa disso ela foi considerada única para o CanineCV. Portanto, a caracterização do genoma completo do CanineCV brasileiro pode ser utilizada em futuros estudos de epidemiologia molecular, patogenia e no desenvolvimento de ferramentas de diagnóstico para prevenção e controle desta doença.(AU)
Assuntos
Animais , Cães , Circovirus/genética , Circovirus/isolamento & purificação , Infecções por Circoviridae/epidemiologia , Infecções por Circoviridae/veterinária , Genoma , Gastroenterite/veterináriaResumo
Traditional selection programs for dairy cattle, based on quantitative principles, have worked well and allowed strong selection processes in the world over many decades. The objectives of this work were to estimate linkage disequilibrium (LD) levels at varying SNPs densities, to evaluate the effective population size of Holstein cattle, to characterize runs of homozygosity (ROH) distribution through Holstein cattle from Nariño and, to estimate and compare inbreeding coefficient (F) based on genomic markers information, runs of homozygosity (FROH), genomic relationship matrix (FGRM), and excess of homozygous (FSNP). After quality control, the dataset used was composed of 606 Holstein animals and 22200 SNP markers. PLINK program was used to identify LD, Ne, ROH segment and FROH and FSNP, FGRM was calculated with BLUPF90 family of programs. The average of r2 in all chromosomes was 0.011, the highest r2 was found in BTA3 (0.0323), and the lowest in BTA12 (0.0039). 533 ROH segments were identified in 319 animals; findings obtained in this study suggest that on average 0,28% of Holstein genome is autozygous. Total length of ROH was composed mostly of small segments (ROH1-4Mb and ROH4-8Mb). These segments accounted for approximately 96%, while larger ROH (ROH>8Mb) were 3.37% of all ROH detected. Inbreeding averages FROH, FSNP and FGRM methodologies were 0.28%, 3.11% and 3.36% respectively. The Pearson's correlation among these different F values was: 0.49 (FROH-FSNP), 0.25 (FROH-FGRM), 0.22 (FSNP-FGRM). The distribution of ROH shared regions identified on 19 autosome chromosomes, cover a relevant number of genes inside these ROH. Our result evidenced lowest LD extension levels compared with other [...].
Los programas de selección tradicionales para ganado lechero, basados en principios cuantitativos, han funcionado bien y han permitido grandes procesos de selección en el mundo durante muchas décadas. Los objetivos de este trabajo fueron estimar los niveles de desequilibrio de ligamiento (LD) en diferentes densidades de SNPs, evaluar el tamaño efectivo de la población de ganado Holstein, caracterizar tramos de homocigosidad (ROH) distribuidas a través de ganado Holstein de Nariño y, estimar y comparar coeficiente de consanguinidad (F) basado en información de marcadores genómicos, tramos de homocigosidad (FROH), matriz de relación genómica (FGRM) y exceso de SNP homocigotos (FSNP). Después del control de calidad, el conjunto de datos utilizado estaba compuesto por 606 animales Holstein y 22200 marcadores SNP. Se utilizó el programa PLINK para identificar LD, Ne, segmentos de ROH, FROH y FSNP, FGRM se calculó con la familia de programas BLUPF90. El promedio de r2 en todos los cromosomas fue de 0.011, el r2 más alto se encontró en BTA3 (0.0323) y el más bajo en BTA12 (0.0039). Se identificaron 533 segmentos de ROH en 319 animales; los hallazgos obtenidos en este estudio sugieren que, en promedio, el 0,28% del genoma de Holstein es autocigoto. La longitud total de ROH se compuso principalmente de pequeños segmentos (ROH1-4Mb y ROH4-8Mb). Estos segmentos representaron aproximadamente el 96%, mientras que los ROH más grandes (ROH > 8Mb) representaron el 3.37% de todos los ROH detectados. Los promedios de consanguinidad de las metodologías FROH, FSNP y FGRM fueron 0.28%, 3.11% y 3.36% respectivamente. La correlación de Pearson entre estos diferentes valores de F fue: 0.49 (FROH-FSNP), 0.25 (FROH-FGRM), 0.22 (FSNP-FGRM). La distribución de las regiones compartidas de ROH identificadas en 19 cromosomas autosómicos cubre un número importante de genes dentro de estos ROH. Nuestro resultado evidenció niveles más bajos de extensión de LD [...].
Assuntos
Animais , Bovinos , Análise de Sequência de DNA/veterinária , Bovinos/genética , Bovinos/sangue , Desequilíbrio de Ligação/genética , ZigotoResumo
Traditional selection programs for dairy cattle, based on quantitative principles, have worked well and allowed strong selection processes in the world over many decades. The objectives of this work were to estimate linkage disequilibrium (LD) levels at varying SNPs densities, to evaluate the effective population size of Holstein cattle, to characterize runs of homozygosity (ROH) distribution through Holstein cattle from Nariño and, to estimate and compare inbreeding coefficient (F) based on genomic markers information, runs of homozygosity (FROH), genomic relationship matrix (FGRM), and excess of homozygous (FSNP). After quality control, the dataset used was composed of 606 Holstein animals and 22200 SNP markers. PLINK program was used to identify LD, Ne, ROH segment and FROH and FSNP, FGRM was calculated with BLUPF90 family of programs. The average of r2 in all chromosomes was 0.011, the highest r2 was found in BTA3 (0.0323), and the lowest in BTA12 (0.0039). 533 ROH segments were identified in 319 animals; findings obtained in this study suggest that on average 0,28% of Holstein genome is autozygous. Total length of ROH was composed mostly of small segments (ROH1-4Mb and ROH4-8Mb). These segments accounted for approximately 96%, while larger ROH (ROH>8Mb) were 3.37% of all ROH detected. Inbreeding averages FROH, FSNP and FGRM methodologies were 0.28%, 3.11% and 3.36% respectively. The Pearson's correlation among these different F values was: 0.49 (FROH-FSNP), 0.25 (FROH-FGRM), 0.22 (FSNP-FGRM). The distribution of ROH shared regions identified on 19 autosome chromosomes, cover a relevant number of genes inside these ROH. Our result evidenced lowest LD extension levels compared with other [...].(AU)
Los programas de selección tradicionales para ganado lechero, basados en principios cuantitativos, han funcionado bien y han permitido grandes procesos de selección en el mundo durante muchas décadas. Los objetivos de este trabajo fueron estimar los niveles de desequilibrio de ligamiento (LD) en diferentes densidades de SNPs, evaluar el tamaño efectivo de la población de ganado Holstein, caracterizar tramos de homocigosidad (ROH) distribuidas a través de ganado Holstein de Nariño y, estimar y comparar coeficiente de consanguinidad (F) basado en información de marcadores genómicos, tramos de homocigosidad (FROH), matriz de relación genómica (FGRM) y exceso de SNP homocigotos (FSNP). Después del control de calidad, el conjunto de datos utilizado estaba compuesto por 606 animales Holstein y 22200 marcadores SNP. Se utilizó el programa PLINK para identificar LD, Ne, segmentos de ROH, FROH y FSNP, FGRM se calculó con la familia de programas BLUPF90. El promedio de r2 en todos los cromosomas fue de 0.011, el r2 más alto se encontró en BTA3 (0.0323) y el más bajo en BTA12 (0.0039). Se identificaron 533 segmentos de ROH en 319 animales; los hallazgos obtenidos en este estudio sugieren que, en promedio, el 0,28% del genoma de Holstein es autocigoto. La longitud total de ROH se compuso principalmente de pequeños segmentos (ROH1-4Mb y ROH4-8Mb). Estos segmentos representaron aproximadamente el 96%, mientras que los ROH más grandes (ROH > 8Mb) representaron el 3.37% de todos los ROH detectados. Los promedios de consanguinidad de las metodologías FROH, FSNP y FGRM fueron 0.28%, 3.11% y 3.36% respectivamente. La correlación de Pearson entre estos diferentes valores de F fue: 0.49 (FROH-FSNP), 0.25 (FROH-FGRM), 0.22 (FSNP-FGRM). La distribución de las regiones compartidas de ROH identificadas en 19 cromosomas autosómicos cubre un número importante de genes dentro de estos ROH. Nuestro resultado evidenció niveles más bajos de extensión de LD [...].(AU)
Assuntos
Animais , Bovinos , Bovinos/sangue , Bovinos/genética , Desequilíbrio de Ligação/genética , Zigoto , Análise de Sequência de DNA/veterináriaResumo
A biópsia embrionária associada à genotipagem permite a obtenção de informações genômicas antes mesmo da transferência dos embriões. Neste estudo, foram avaliadas amostras biopsiadas de blastocistos bovinos transferidos para receptoras (n=47), sob a hipótese de que a raça (Gir ou Girolando), o estádio embrionário (blastocisto ou blastocisto expandido) e a competência para estabelecimento de prenhez (positiva ou negativa) afetariam a quantidade e a qualidade do DNA da amostra obtida. O DNA foi extraído, amplificado, quantificado por eletroferograma e genotipado. O parâmetro call rate (CR) foi adotado para mensurar a qualidade da genotipagem. Obteve-se concentração de DNA de 86,07±171,66ng/µL e CR 0,73±0,17. O CR não variou em função da quantidade de DNA nas amostras. As variáveis raça e estádio embrionário não influenciaram a concentração de DNA, nem o CR. Houve efeito da prenhez sobre o CR (P=0,0187), mas, como houve maior CR nas amostras provenientes do grupo prenhez negativa, não foi possível associar esse parâmetro à qualidade embrionária. Concluiu-se que a raça e a qualidade embrionária não afetam os parâmetros aqui estudados em amostras embrionárias, ou seja, embriões com maiores chances de implantação não refletem alta qualidade nas amostras de biópsia genotipadas.(AU)
Embryo biopsy associated with genotyping allows genomic information before embryo transfer. In this study, blastocyst biopsy samples from embryos transferred to recipients (n= 47) were evaluated, under the hypothesis that breed (Gyr or Girolando), embryonic stage (blastocyst or expanded blastocyst) and competence to establish pregnancy (positive or negative) would affect the quantity and DNA quality of samples. DNA was extracted, amplified, quantified by electropherogram and genotyped. The parameter call rate (CR) was used to measure the quality of genotyping. DNA concentration of 86.07±171.66ng/µl, and CR 0.73±0.17 was obtained. CR did not vary according to the amount of DNA in the samples. The variables breed and embryonic stage had no influence on DNA concentration or CR. There was pregnancy effect on the CR (P= 0.0187), but since there was a higher CR in the samples from the negative pregnancy group, it was not possible to associate this parameter with the embryonic quality. We conclude that the breed and embryo quality do not affect the evaluated parameters in embryonic samples. Embryos with higher chances of implantation do not reflect high quality in embryo biopsy genotyped samples.(AU)
Assuntos
Animais , Bovinos , Seleção Genética , Biópsia/veterinária , Análise de Sequência de DNA/veterinária , Embrião de Mamíferos , Técnicas de Genotipagem/veterinária , Técnicas In Vitro/veterináriaResumo
A biópsia embrionária associada à genotipagem permite a obtenção de informações genômicas antes mesmo da transferência dos embriões. Neste estudo, foram avaliadas amostras biopsiadas de blastocistos bovinos transferidos para receptoras (n=47), sob a hipótese de que a raça (Gir ou Girolando), o estádio embrionário (blastocisto ou blastocisto expandido) e a competência para estabelecimento de prenhez (positiva ou negativa) afetariam a quantidade e a qualidade do DNA da amostra obtida. O DNA foi extraído, amplificado, quantificado por eletroferograma e genotipado. O parâmetro call rate (CR) foi adotado para mensurar a qualidade da genotipagem. Obteve-se concentração de DNA de 86,07±171,66ng/µL e CR 0,73±0,17. O CR não variou em função da quantidade de DNA nas amostras. As variáveis raça e estádio embrionário não influenciaram a concentração de DNA, nem o CR. Houve efeito da prenhez sobre o CR (P=0,0187), mas, como houve maior CR nas amostras provenientes do grupo prenhez negativa, não foi possível associar esse parâmetro à qualidade embrionária. Concluiu-se que a raça e a qualidade embrionária não afetam os parâmetros aqui estudados em amostras embrionárias, ou seja, embriões com maiores chances de implantação não refletem alta qualidade nas amostras de biópsia genotipadas.(AU)
Embryo biopsy associated with genotyping allows genomic information before embryo transfer. In this study, blastocyst biopsy samples from embryos transferred to recipients (n= 47) were evaluated, under the hypothesis that breed (Gyr or Girolando), embryonic stage (blastocyst or expanded blastocyst) and competence to establish pregnancy (positive or negative) would affect the quantity and DNA quality of samples. DNA was extracted, amplified, quantified by electropherogram and genotyped. The parameter call rate (CR) was used to measure the quality of genotyping. DNA concentration of 86.07±171.66ng/µl, and CR 0.73±0.17 was obtained. CR did not vary according to the amount of DNA in the samples. The variables breed and embryonic stage had no influence on DNA concentration or CR. There was pregnancy effect on the CR (P= 0.0187), but since there was a higher CR in the samples from the negative pregnancy group, it was not possible to associate this parameter with the embryonic quality. We conclude that the breed and embryo quality do not affect the evaluated parameters in embryonic samples. Embryos with higher chances of implantation do not reflect high quality in embryo biopsy genotyped samples.(AU)
Assuntos
Animais , Bovinos , Seleção Genética , Biópsia/veterinária , Análise de Sequência de DNA/veterinária , Embrião de Mamíferos , Técnicas de Genotipagem/veterinária , Técnicas In Vitro/veterináriaResumo
Rice cultivation has great national and global importance, being one of the most produced and consumed cereals in the world and the primary food for more than half of the worlds population. Because of its importance as food, developing efficient methods to select and predict genetically superior individuals in reference to plant traits is of extreme importance for breeding programs. The objective of this research was to evaluate and compare the efficiency of the Delta-p, G-BLUP (Genomic Best Linear Unbiased Predictor), BayesCpi, BLASSO (Bayesian Least Absolute Shrinkage and Selection Operator), Delta-p/G-BLUP index, Delta-p/BayesCpi index, and Delta-p/BLASSO index in the estimation of genomic values and the effects of single nucleotide polymorphisms on phenotypic data associated with rice traits. Use of molecular markers allowed high selective efficiency and increased genetic gain per unit time. The Delta-p method uses the concept of change in allelic frequency caused by selection and the theoretical concept of genetic gain. The Index is based on the principle of combined selection, using the information regarding the additive genomic values predicted via G-BLUP, BayesCpi, BLASSO, or Delta-p. These methods were applied and compared for genomic prediction using nine rice traits: flag leaf length, flag leaf width, panicles number per plant, primary panicle branch number, seed length, seed width, amylose content, protein content, and blast resistance. Delta-p/G-BLUP index had higher predictive abilities for the traits studied, except for amylose content trait in which the method with the highest predictive ability was BayesCpi, being approximately 3% greater than that of the Delta-p/G-BLUP index.(AU)
A cultura do arroz tem grande importância nacional e mundial por ser um dos cereais mais produzidos e consumidos no mundo, caracterizando-se como o principal alimento de mais da metade da população mundial. Em função de sua importância alimentar, desenvolver métodos eficientes que visam a predição e a seleção de indivíduos geneticamente superiores, quanto a características da planta, é de extrema importância para os programas de melhoramento. Diante disso, o objetivo deste trabalho foi avaliar e comparar a eficiência do método Delta-p, G-BLUP, BayesCpi, BLASSO e o índice Delta-p/G-BLUP, índice Delta-p/BayesCpi e índice Delta-p/BLASSO, na estimação de valores genômicos e dos efeitos de marcadores SNPs (Single Nucleotide Polymorphisms) em dados fenotípicos associados a características de arroz. A utilização de marcadores moleculares permite alta eficiência seletiva e o aumento do ganho genético por unidade de tempo. O método Delta-p utiliza o conceito de mudança na frequência alélica devido à seleção e o conceito teórico de ganho genético. O Índice é baseado no princípio da seleção combinada, utiliza conjuntamente as informações dos valores genômicos aditivos preditos via G-BLUP, BayesCpi ou BLASSO e via Delta-p. Estes métodos foram aplicados e comparados quanto à predição genômica utilizando nove características de arroz (Oryza sativa), sendo elas: comprimento da folha bandeira, largura da folha bandeira; número de panículas por planta; número de ramos da panícula primária; comprimento de semente; largura de semente; teor de amilose; teor de proteína; resistência a bruzone. O índice Delta-p/G-BLUP obteve maiores capacidades preditivas para as características estudadas, exceto para a característica Conteúdo de amilose, em que o método que obteve maior capacidade preditiva foi o BayesCpi, sendo aproximadamente 3% superior ao índice Delta-p/G-BLUP.(AU)
Assuntos
Oryza/genética , Oryza/crescimento & desenvolvimento , Melhoramento Genético/métodos , Componentes Genômicos , Polimorfismo de Nucleotídeo Único , Plantas Geneticamente ModificadasResumo
The objectives of this study were (1) to quantify imputation accuracy and to assess the factors affecting it; and (2) to evaluate the accuracy of threshold BayesA (TBA), Bayesian threshold LASSO (BTL) and random forest (RF) algorithms to analyze discrete traits. Genomic data were simulated to reflect variations in heritability (h2 = 0.30 and 0.10), number of QTL (QTL = 81 and 810), number of SNP (10 K and 50 K) and linkage disequilibrium (LD=low and high) for 27 chromosomes. For real condition simulating, we randomly masked markers with 90% missing rate for each scenario; afterwards, hidden markers were imputed using FImpute software. In imputed genotypes, a wide range of accuracy was observed for RF (0.164-0.512) compared to TBA (0.283-0.469) and BTL (0.272-0.504). Comparing to original genotypes, using imputed genotypes decreased the average accuracy of genomic prediction about 0.0273 (range of 0.024 to 0.036). Comparing to Bayesian threshold, using RF was improved rapidly accuracy of genomic prediction with increase in the marker density. Despite the higher accuracy of BTL and TBA at different levels of LD and heritability, the increase in accuracy was greater for RF. Furthermore, the best method for prediction of genomic accuracy depends on genomic architecture of population.(AU)
Os objetivos deste estudo foram (1) quantificar a precisão de imputação e acessar os fatores que as afetam; e (2) avaliar a precisão do princípio de BayesA (TBA), do modelo Bayesiano LASSO (BTL), e o algoritmo Random Forest para analisar as características distintas. Dados genômicos foram simulados para indicar variações na herdabilidade (h2 = 0.30 e 0.10), número de QTL (QTL = 81 e 810), número de SNP (10 k e 50 k) e desequilíbrio de ligação (LD = baixo e alto) para 27 cromossomos. Para uma simulação mais realista, nós cobrimos os marcadores aleatoriamente com 90% da taxa ausente para cada cenário, depois, os marcadores foram imputados usando o software FImpute. Nos genótipos imputados uma grande oscilação de precisão foi observada pelo modelo RF (0.164-0.512) comparado com TBA (0.283 - 0.469) e BTL (0.272 - 0.504). Comparando com os genótipos originais, os genótipos imputados decaíram a precisão média da predição genômica em cerca de 0.0273 (oscilação de 0.024 para 0.036). Comparando-se ao princípio Bayesiano, o uso de RF melhorou a precisão de predição com o aumento da densidade do marcador. Além disso, o melhor método para predição de precisão genômica depende da arquitetura genômica da sua população.(AU)
Assuntos
Teorema de Bayes , Estudo de Associação Genômica Ampla/métodos , Genótipo , Técnicas de Genotipagem/veterináriaResumo
The objectives of this study were (1) to quantify imputation accuracy and to assess the factors affecting it; and (2) to evaluate the accuracy of threshold BayesA (TBA), Bayesian threshold LASSO (BTL) and random forest (RF) algorithms to analyze discrete traits. Genomic data were simulated to reflect variations in heritability (h2 = 0.30 and 0.10), number of QTL (QTL = 81 and 810), number of SNP (10 K and 50 K) and linkage disequilibrium (LD=low and high) for 27 chromosomes. For real condition simulating, we randomly masked markers with 90% missing rate for each scenario; afterwards, hidden markers were imputed using FImpute software. In imputed genotypes, a wide range of accuracy was observed for RF (0.164-0.512) compared to TBA (0.283-0.469) and BTL (0.272-0.504). Comparing to original genotypes, using imputed genotypes decreased the average accuracy of genomic prediction about 0.0273 (range of 0.024 to 0.036). Comparing to Bayesian threshold, using RF was improved rapidly accuracy of genomic prediction with increase in the marker density. Despite the higher accuracy of BTL and TBA at different levels of LD and heritability, the increase in accuracy was greater for RF. Furthermore, the best method for prediction of genomic accuracy depends on genomic architecture of population.
Os objetivos deste estudo foram (1) quantificar a precisão de imputação e acessar os fatores que as afetam; e (2) avaliar a precisão do princípio de BayesA (TBA), do modelo Bayesiano LASSO (BTL), e o algoritmo Random Forest para analisar as características distintas. Dados genômicos foram simulados para indicar variações na herdabilidade (h2 = 0.30 e 0.10), número de QTL (QTL = 81 e 810), número de SNP (10 k e 50 k) e desequilíbrio de ligação (LD = baixo e alto) para 27 cromossomos. Para uma simulação mais realista, nós cobrimos os marcadores aleatoriamente com 90% da taxa ausente para cada cenário, depois, os marcadores foram imputados usando o software FImpute. Nos genótipos imputados uma grande oscilação de precisão foi observada pelo modelo RF (0.164-0.512) comparado com TBA (0.283 - 0.469) e BTL (0.272 - 0.504). Comparando com os genótipos originais, os genótipos imputados decaíram a precisão média da predição genômica em cerca de 0.0273 (oscilação de 0.024 para 0.036). Comparando-se ao princípio Bayesiano, o uso de RF melhorou a precisão de predição com o aumento da densidade do marcador. Além disso, o melhor método para predição de precisão genômica depende da arquitetura genômica da sua população.
Assuntos
Estudo de Associação Genômica Ampla/métodos , Genótipo , Teorema de Bayes , Técnicas de Genotipagem/veterináriaResumo
The main application of genomic selection (GS) is the early identification of genetically superior animals for traits difficult-to-measure or lately evaluated, such as meat pH (measured after slaughter). Because the number of markers in GS is generally larger than the number of genotyped animals and these markers are highly correlated owing to linkage disequilibrium, statistical methods based on dimensionality reduction have been proposed. Among them, the partial least squares (PLS) technique stands out, because of its simplicity and high predictive accuracy. However, choosing the optimal number of components remains a relevant issue for PLS applications. Thus, we applied PLS (and principal component and traditional multiple regression) techniques to GS for pork pH traits (with pH measured at 45min and 24h after slaughter) and also identified the optimal number of PLS components based on the degree-of-freedom (DoF) and cross-validation (CV) methods. The PLS method out performs the principal component and traditional multiple regression techniques, enabling satisfactory predictions for pork pH traits using only genotypic data (low-density SNP panel). Furthermore, the SNP marker estimates from PLS revealed a relevant region on chromosome 4, which may affect these traits. The DoF and CV methods showed similar results for determining the optimal number of components in PLS analysis; thus, from the statistical viewpoint, the DoF method should be preferred because of its theoretical background (based on the "statistical information theory"), whereas CV is an empirical method based on computational effort.
A principal contribuição da seleção genômica (SG) é a identificação de animais geneticamente superiores para características de difícil mensuração e/ou avaliadas tardiamente nos animais, tal como o pH da carne suína. Na SG, uma vez que o número de marcadores é geralmente maior que o número de animais genotipados, e tais marcadores são altamente correlacionados (devido ao desequilíbrio de ligação), métodos estatísticos baseados na redução de dimensionalidade têm sido propostos. Dentre estes, destaca-se o Quadrados Mínimos Parciais (PLS) pela simplicidade e alta acurácia de predição. Porém, a determinação do número ótimo de componentes a ser utilizado no PLS ainda se caracteriza como um desafio para a aplicação do método. Assim, objetivou-se aplicar o PLS (e também regressões em componentes principais e a múltipla tradicional) na SG para pH da carne suína (medido aos 45min e às 24 horas após o abate), bem como identificar o número ótimo de componentes por meio dos métodos do grau de liberdade (GL) e validação cruzada (VC). O primeiro é baseado na Teoria de Informação Estatística e VC é empírica e fundamentada em amostras independentes do arquivo original. O PLS superou os demais métodos de regressão, fornecendo predições satisfatórias quando utilizadas apenas informações genotípicas (painel de SNP de baixa densidade). Além disso, os efeitos dos SNPs estimados via PLS possibilitaram identificar uma região relevante no cromossomo 4 que pode influenciar as características estudadas. Os métodos GL e VC foram similares quanto à determinação do número ótimo de componentes na análise PLS, porém o método GL pode ser recomendado devido a sua maior fundamentação estatística.
Assuntos
Análise de Regressão , Análise dos Mínimos Quadrados , Carne/análise , Concentração de Íons de Hidrogênio , Estudo de Associação Genômica Ampla/veterinária , Polimorfismo de Nucleotídeo Único , Qualidade dos Alimentos , SuínosResumo
Uma primeira etapa básica e essencial para a aplicação de biotécnicas da reprodução é a coleta eavaliação do sêmen, seguida da sua criopreservação. Apresentamos aqui alguns protocolos, com base emresultados publicados e observações pessoais, para as diferentes espécies de felídeos selvagens. Para felídeosdomésticos e selvagens, a eletroejaculação é o método mais frequentemente utilizado para coleta de sêmen. Acoleta por vagina artificial, algumas vezes empregada em gatos domésticos e já descrita para guepardos, exige ocondicionamento do animal e a habituação ao coletor. A cateterização uretral, associada a fármacos quepromovem a ejaculação, surge também como uma outra opção para coleta de sêmen.(AU)
A basic and essential first step in the application of reproduction biotechniques is the semen collectionand evaluation, followed by its cryopreservation. We present here some protocols, based on published resultsand personal observations, for the different species of wild felids. For domestic and wild felids,electroejaculation is the most frequently used method for collecting semen. Collection by artificial vagina,sometimes used in domestic cats and already described for cheetahs, requires the conditioning of the animal andhabituation to the collector. Urethral catheterization, associated with drugs that promote ejaculation, alsoappears as another option for semen collection.(AU)
Assuntos
Animais , Masculino , Gatos , Andrologia/métodos , Criopreservação , Criopreservação/veterinária , Felidae/genética , BiodiversidadeResumo
The main application of genomic selection (GS) is the early identification of genetically superior animals for traits difficult-to-measure or lately evaluated, such as meat pH (measured after slaughter). Because the number of markers in GS is generally larger than the number of genotyped animals and these markers are highly correlated owing to linkage disequilibrium, statistical methods based on dimensionality reduction have been proposed. Among them, the partial least squares (PLS) technique stands out, because of its simplicity and high predictive accuracy. However, choosing the optimal number of components remains a relevant issue for PLS applications. Thus, we applied PLS (and principal component and traditional multiple regression) techniques to GS for pork pH traits (with pH measured at 45min and 24h after slaughter) and also identified the optimal number of PLS components based on the degree-of-freedom (DoF) and cross-validation (CV) methods. The PLS method out performs the principal component and traditional multiple regression techniques, enabling satisfactory predictions for pork pH traits using only genotypic data (low-density SNP panel). Furthermore, the SNP marker estimates from PLS revealed a relevant region on chromosome 4, which may affect these traits. The DoF and CV methods showed similar results for determining the optimal number of components in PLS analysis; thus, from the statistical viewpoint, the DoF method should be preferred because of its theoretical background (based on the "statistical information theory"), whereas CV is an empirical method based on computational effort.(AU)
A principal contribuição da seleção genômica (SG) é a identificação de animais geneticamente superiores para características de difícil mensuração e/ou avaliadas tardiamente nos animais, tal como o pH da carne suína. Na SG, uma vez que o número de marcadores é geralmente maior que o número de animais genotipados, e tais marcadores são altamente correlacionados (devido ao desequilíbrio de ligação), métodos estatísticos baseados na redução de dimensionalidade têm sido propostos. Dentre estes, destaca-se o Quadrados Mínimos Parciais (PLS) pela simplicidade e alta acurácia de predição. Porém, a determinação do número ótimo de componentes a ser utilizado no PLS ainda se caracteriza como um desafio para a aplicação do método. Assim, objetivou-se aplicar o PLS (e também regressões em componentes principais e a múltipla tradicional) na SG para pH da carne suína (medido aos 45min e às 24 horas após o abate), bem como identificar o número ótimo de componentes por meio dos métodos do grau de liberdade (GL) e validação cruzada (VC). O primeiro é baseado na Teoria de Informação Estatística e VC é empírica e fundamentada em amostras independentes do arquivo original. O PLS superou os demais métodos de regressão, fornecendo predições satisfatórias quando utilizadas apenas informações genotípicas (painel de SNP de baixa densidade). Além disso, os efeitos dos SNPs estimados via PLS possibilitaram identificar uma região relevante no cromossomo 4 que pode influenciar as características estudadas. Os métodos GL e VC foram similares quanto à determinação do número ótimo de componentes na análise PLS, porém o método GL pode ser recomendado devido a sua maior fundamentação estatística.(AU)
Assuntos
Carne/análise , Estudo de Associação Genômica Ampla/veterinária , Polimorfismo de Nucleotídeo Único , Concentração de Íons de Hidrogênio , Análise dos Mínimos Quadrados , Análise de Regressão , Qualidade dos Alimentos , SuínosResumo
Uma primeira etapa básica e essencial para a aplicação de biotécnicas da reprodução é a coleta eavaliação do sêmen, seguida da sua criopreservação. Apresentamos aqui alguns protocolos, com base emresultados publicados e observações pessoais, para as diferentes espécies de felídeos selvagens. Para felídeosdomésticos e selvagens, a eletroejaculação é o método mais frequentemente utilizado para coleta de sêmen. Acoleta por vagina artificial, algumas vezes empregada em gatos domésticos e já descrita para guepardos, exige ocondicionamento do animal e a habituação ao coletor. A cateterização uretral, associada a fármacos quepromovem a ejaculação, surge também como uma outra opção para coleta de sêmen.
A basic and essential first step in the application of reproduction biotechniques is the semen collectionand evaluation, followed by its cryopreservation. We present here some protocols, based on published resultsand personal observations, for the different species of wild felids. For domestic and wild felids,electroejaculation is the most frequently used method for collecting semen. Collection by artificial vagina,sometimes used in domestic cats and already described for cheetahs, requires the conditioning of the animal andhabituation to the collector. Urethral catheterization, associated with drugs that promote ejaculation, alsoappears as another option for semen collection.
Assuntos
Masculino , Animais , Gatos , Andrologia/métodos , Criopreservação , Criopreservação/veterinária , Felidae/genética , BiodiversidadeResumo
Os felídeos, principalmente os grandes, muitas vezes são vistos como ícones ou, na terminologiaacadêmica, como espécie bandeira simbolizando o ecossistema. Para que as técnicas de reprodução assistida(TRAs) possam desempenhar um papel significativo na conservação de felídeos, é essencial que as técnicas maisfundamentais de IA, FIV e TE, além da criopreservação de espermatozoides e embriões, primeiro sejamcompletamente desenvolvidas via estudos sistemáticos. Para a coleta de sêmen em felídeos, geralmente tem sidousada a eletroejaculação ou a coleta farmacológica, com fármaco que induz a ejaculação. Uma abordagem parasuperar a baixa qualidade do sêmen após a criopreservação, tem sido utilizar a inseminação laparoscópica, quepossibilita depositar o sêmen no ápice do corno uterino ou mesmo no oviduto, para alcançar uma fertilidade maissatisfatória. Considerando que os felídeos geralmente têm uma expectativa de vida curta, baixa produção defilhotes (1-4 filhotes/ninhada) e início precoce da senescência reprodutiva (~7-10 anos de idade), a atualmanutenção de populações geneticamente viáveis em cativeiro é muito difícil. As TRAs oferecem umaferramenta potencial para enfrentar esses desafios de manejo e auxiliar na conservação de felídeos silvestres.(AU)
Felids, especially the large species, are often seen as icons or, in academic terminology, as flag speciessymbolizing the ecosystem. For assisted reproductive techniques (ARTs) to play a significant role in theconservation of felids, it is essential that the most fundamental techniques of AI, IVF and ET, in addition tocryopreservation of sperm and embryos, be first fully developed through systematic studies. For the semencollection in felids, electroejaculation or pharmacological collection has usually been used, with a drug thatinduces ejaculation. One approach to overcome the poor quality of semen after cryopreservation has been to uselaparoscopic insemination, which makes it possible to deposit the semen at the apex of the uterine horn or evenin the oviduct, to achieve a more satisfactory fertility. Considering that felids generally have a short lifeexpectancy, low pups production (1-4 pups/litter) and early onset of reproductive senescence (~ 7-10 years ofage), the current maintenance of genetically viable populations in captivity is very difficult. ARTs offer apotential tool to address these management challenges and assist in the conservation of wild felids.(AU)
Assuntos
Animais , Técnicas Reprodutivas , Técnicas Reprodutivas/veterinária , Felidae/embriologia , Animais Selvagens/embriologia , Inseminação ArtificialResumo
Os felídeos, principalmente os grandes, muitas vezes são vistos como ícones ou, na terminologiaacadêmica, como espécie bandeira simbolizando o ecossistema. Para que as técnicas de reprodução assistida(TRAs) possam desempenhar um papel significativo na conservação de felídeos, é essencial que as técnicas maisfundamentais de IA, FIV e TE, além da criopreservação de espermatozoides e embriões, primeiro sejamcompletamente desenvolvidas via estudos sistemáticos. Para a coleta de sêmen em felídeos, geralmente tem sidousada a eletroejaculação ou a coleta farmacológica, com fármaco que induz a ejaculação. Uma abordagem parasuperar a baixa qualidade do sêmen após a criopreservação, tem sido utilizar a inseminação laparoscópica, quepossibilita depositar o sêmen no ápice do corno uterino ou mesmo no oviduto, para alcançar uma fertilidade maissatisfatória. Considerando que os felídeos geralmente têm uma expectativa de vida curta, baixa produção defilhotes (1-4 filhotes/ninhada) e início precoce da senescência reprodutiva (~7-10 anos de idade), a atualmanutenção de populações geneticamente viáveis em cativeiro é muito difícil. As TRAs oferecem umaferramenta potencial para enfrentar esses desafios de manejo e auxiliar na conservação de felídeos silvestres.
Felids, especially the large species, are often seen as icons or, in academic terminology, as flag speciessymbolizing the ecosystem. For assisted reproductive techniques (ARTs) to play a significant role in theconservation of felids, it is essential that the most fundamental techniques of AI, IVF and ET, in addition tocryopreservation of sperm and embryos, be first fully developed through systematic studies. For the semencollection in felids, electroejaculation or pharmacological collection has usually been used, with a drug thatinduces ejaculation. One approach to overcome the poor quality of semen after cryopreservation has been to uselaparoscopic insemination, which makes it possible to deposit the semen at the apex of the uterine horn or evenin the oviduct, to achieve a more satisfactory fertility. Considering that felids generally have a short lifeexpectancy, low pups production (1-4 pups/litter) and early onset of reproductive senescence (~ 7-10 years ofage), the current maintenance of genetically viable populations in captivity is very difficult. ARTs offer apotential tool to address these management challenges and assist in the conservation of wild felids.
Assuntos
Animais , Animais Selvagens/embriologia , Felidae/embriologia , Técnicas Reprodutivas , Técnicas Reprodutivas/veterinária , Inseminação ArtificialResumo
Na pecuária leiteira, o interesse em selecionar animais com alto potencial genético para produção e qualidade do leite, pode causar um decréscimo na variabilidade genotípica, devido à intensa pressão de seleção. Neste contexto, as avaliações genéticas têm considerado apenas os efeitos genéticos aditivos, não sendo incluídos efeitos de dominância nos modelos de predição, por exemplo. O objetivo deste trabalho foi verificar a contribuição dos efeitos genéticos não-aditivos nos modelos de predição genômica e inferir a heterozigose molecular e a heterose genômica. Foram testadas a habilidade e o viés na predição dos valores genéticos genômicos (GEBVs) por um modelo puramente aditivo e outro aditivo-dominante. Estes foram comparados e as estimativas de variância computadas e avaliadas de acordo com o modelo proposto. Uma segunda fase compreendeu estimar a heterozigosidade e a heterose genômica, e realizar uma adaptação da associação ampla do genoma (GWAS) para capturar as variâncias não-aditivas, identificar regiões do genoma com possível vantagem heterozigótica e de marcadores moleculares associados ao fenótipo. Em ambas as fases foram utilizados dados simulados e registros fenotípicos reais de bovinos leiteiros da raça Holandesa. As proporções da variância de dominância em relação ao fenótipo foram de 2,9 a 5,2% em dados simulados, e de 0,08 a 3,8% para as características produção e qualidade do leite. A maior acurácia foi de 0,79 e 0,36 no modelo aditivo e aditivo-dominante simulado, respectivamente. Para os dados reais, as estimativas foram semelhantes entre os modelos. O melhor desempenho do modelo foi para gordura e ácido graxo, com maior vantagem para ácido graxo quando incluído os efeitos de dominância na avaliação. Em média, para o cenário de menor herdabilidade (h2 = 0,10), a taxa de heterozigosidade foi de 35,6%, e níveis próximos foram encontrados para os demais cenários (35,4 e 35,7%). O cenário de maior herdabilidade apresentou os maiores valores médios de heterose genômica (17,0%), comparado aos demais (3,02 a 11,0%). Os coeficientes de regressão revelaram que a heterozigosidade tem impacto positivo sobre a heterose genômica para a maioria das populações simuladas. A heterozigosidade avaliada de forma empírica e por meio de dados reais revelou resultados otimistas quanto à possibilidade de selecionar os animais de raça pura, para gerar maior e melhor heterose genômica. Incluir os efeitos de dominância no modelo de GWAS adaptado pode contribuir para a identificação de marcadores associados ao fenótipo, de forma semelhante ou superior ao modelo aditivo adaptado. Conclui-se que incluir os efeitos de dominância deve beneficiar uma melhor estimativa dos componentes de variância genética, principalmente para as características de menor herdabilidade e altamente influenciadas pelo ambiente. Além disso, sugere-se que a heterose genômica em populações de raça pura pode ser acessada se considerado os fatores de heterozigosidade molecular e suas associações com o fenótipo de interesse.
In dairy farming, the interest in selecting animals with high genetic potential for milk production and quality may cause a decrease in phenotypic and genotypic variability, due to intense selective pressure. Furthermore, genetic evaluations have been limited to additive genetic effects, not including dominance effects in genomic prediction models, for example. The aim of this study was to verify the contribution of non-additive genetic effects in genomic prediction models and to infer molecular heterozygosity and genomic heterosis. Two main lines of research were followed. Two main lines of research were followed. Initially, the ability and bias in predicting genomic breeding values by a purely additive model and an additive-dominant model were tested. The models were compared for ability and bias to genomic estimated breeding values (GEBVs) and the estimates of variance computed and evaluated according to the proposed model. The second phase involved inferring genomic heterozygosity and heterosis, and performing an adaptation of genome-wide association (GWAS) to capture non-additive variances, identify regions of the genome with possible heterozygous advantage, and molecular markers associated with the phenotype. In both phases, simulated data and real phenotypic records of Holstein dairy cattle were used. The proportions of dominance variance in relation to phenotype were 2.9 to 5.2% in simulated data, and from 0.08 to 3.8% for the milk yield and quality traits. The highest accuracy was 0.79 and 0.36 in the simulated additive and additivedominant model. The estimates were similar across models for the real data. Higher variance estimates were found for fat and fatty acid, with a greater advantage for fatty acid when dominance effects were included in the assessment. On average, for the lower heritability scenario, heterozygosity was 35.6%, and similar levels were found for the other scenarios (35.4 and 35.7%). The high heritability scenario presented the highest mean values of genomic heterosis (17.0%), compared to the others (3.02 to 11.0%). Regression coefficients revealed that heterozygosity has a positive impact on genomic heterosis for most simulated populations. The heterozygosity evaluated empirically and through real data revealed optimistic results regarding the possibility of selecting purebred animals to genomic heterosis. Including dominance effects in the adapted GWAS model can contribute to the identification of markers associated with the phenotype in a similar or superior way to the adapted additive model. We conclude that accounting for dominance effects in genomic prediction models should benefit better estimates of genetic variance components, especially for traits with lower heritability and highly influenced by the environment. Furthermore, it is suggested that genomic heterosis in purebred populations can be accessed if molecular heterozygosity factors and their associations with the phenotype of interest are considered.