Your browser doesn't support javascript.

Portal de Pesquisa da BVS Veterinária

Informação e Conhecimento para a Saúde

Home > Pesquisa > ()
Imprimir Exportar

Formato de exportação:

Exportar

Exportar:

Email
Adicionar mais destinatários

Enviar resultado
| |

APPLYING NEXT GENERATION SEQUENCE DATA IN ANIMAL BREEDING

HANIEL CEDRAZ DE OLIVEIRA.
Tese em Inglês | VETTESES | ID: vtt-217939

Resumo

No Melhoramento Animal existe um histórico de utilizar dados fenotípicos dos melhores animais de uma geração para produzir a próxima geração. Entretanto, é sabido que a herdabilidade das características de interesse depende de uma base genética e podem ser explicadas através do DNA. Na genética quantitativa é usado o modelo básico que diz que o fenótipo é a soma do genótipo (composição genética do indivíduo) e do ambiente, entretanto, genótipos diferentes podem desempenhar resultados superiores ou inferiores dependendo do ambiente em que estão inseridos, com isso, houve a necessidade de incluir o fator interação entre o genótipo e o ambiente. Com o desenvolvimento tecnológico, o sequenciamento de nova geração (NGS) tem trazido avanços no entendimento de características complexas no melhoramento animal, com o sequenciamento completo do genoma dos animais domésticos foi possível melhor entender como variantes causais e estruturais tem influenciado o fenótipo. Com o uso do NGS é possível quantificar o mRNA que está sendo expresso de um determinado gene que influencia determinada característica (transcriptoma RNA-Seq), descobrir alterações epigenéticas (ChIP-Seq) e, então, conhecer melhor os mecanismos moleculares que modulam a característica e tecido em questão; aumentar a densidade de marcadores de nucleotídeos simples (SNP) com o sequenciamento do genoma completo (WGS) e então, descobrir associações genômicas mais significativas e mais precisas. Com o advento do NGS veio a necessidade de o desenvolvimento poder computacional e novas ferramentas capazes de analisar e armazenar a quantidade de dados gerada. Em função disso, o desenvolvimento de softwares capazes de realizar o controle de qualidade, mapeamento das sequencias contra o genoma de referencia e, quantificar os transcritos (no caso de RNASeq) tem se tornado necessário e, lidar com esse tipo de análise pode ser difícil para aqueles que não tem familiaridade com sistemas computacionais. Visto isso foi desenvolvido um pipeline de uso amigável para analisar dados de RNA-Seq, realizando controle de qualidade, mapeamento e contagem de sequencias. O BAQCOM (Bioinformatics Analysis of Quality Control and Mapping) tem se mostrado eficiente e rápido. Utilizando dados de RNA-Seq objetivou-se conhecer o perfil global de expressão gênica envolvido em Condronecrose Bacteriana com Osteomielite em frangos (BCO), que é desenvolvida nas placas de crescimento ósseo do fêmur e tíbia e colonizada por bactérias oportunistas. Utilizando amostras de tíbia de seis frangos de linhagem comercial (três afetados por BCO e três sadios), foram encontrados 192 genes diferencialmente expressos (FDR < 0.05) divididos em 63 upregulados e 129 downregulados. 26 genes e sete fatores de transcrição foram encontrados downregulados explicando BCO em tíbia, podendo concluir que a BCO em frangos pode ser causada pela baixa expressão de genes relacionados ao crescimento ósseo e, que, a proliferação bacteriana parece ser um processo secundário. Outro cenário para o uso de NGS é o mapeamento fino de região de QTL (quantitative Traits Loci). Uma região de QTL no cromossomo 5 associada com espessura de toucinho foi encontrada em quatro linhagens comercial de suínos (sintético baseado em large-white, Pietrain, Landrace e Large-White). Espessura de toucinho é importante para eficiência alimentar e qualidade de carne, além de ser reservatório energético. Embora Genome Wide Association Study (GWAS) tem sido amplamente usada associada à fenótipos, ainda há a necessidade de reduzir a região de associação se o objetivo é achar mutações causais. Por essa razão objetivou-se reduzir esta região de QTL usando dados de WGS, RNA-Seq e ChIP-Seq. A partir do SNP mais significativo do GWAS (leadSNP SSC5:66103958), os haplótipos foram postos em fase e selecionados haplótipos de tamanho 41 SNPs (20 < leadSNP > 20). Foi selecionado o haplótipo mais frequente entre as linhagens utilizadas, então foi possível identificar uma região de 5 SNPs (2 < leadSNP > 2) presente em todas as linhagens. A partir desta região foi realizado o mapeamento fino, primeiro foi utilizado WGS e foi identificado três variantes candidatas (SSC5:66097445, SSC5:66099282 e SSC5c66103958). Nesta região entre SSC5:66097445-66103958 foram encontradas marcas epigenéticas H3K27me3 e H3K4me3 utilizado dados de ChIP-Seq de macrófagos alveolar de suínos, indicando regulação de expressão gênica durante período de desenvolvimento pre-natal. Em função disso foram utilizados RNA-Seq de embriões e fetos, onde foi possível encontrar alta expressão do gene CCND2, que está relacionado ao desenvolvimento e diferenciação de tecido adiposo, sendo um forte candidato a gene causal para espessura de toucinho. É possível, também, concluir que nesta região pode ter elementos regulatórios envolvidos na expressão do gene CCND2 no desenvolvimento embrionário e que, o impacto epigenético durante a vida embrionária pode impactar a produção de características na vida adulta. Nessa tese foi usado dados de sequenciamento, genotipagem, fenótipo, transcriptoma e ChIP-Seq, integrando todos para estreitar regiões de interesse no genoma, assim, resultando e propondo ferramentas para melhorar o melhoramento animal no futuro.
In Animal Breeding there is a history of using phenotypic data of the best animals from one generation to produce the next one. However, it is known that the heritability of interest traits depends on a genetic basis and can be explained by the DNA. In quantitative genetics, the basic model says that the phenotype is the sum of the genotype (genetic composition of the individual) and the environment, however, different genotypes can perform superior or inferior results depending on the environment in which they are inserted, with that, there was the need to include an interaction factor at the genotype and the environment. The development of Next Generation Sequencing (NGS) has brought advances in the understanding of complex traits in animal breeding, with the Whole Genome Sequencing (WGS) of the domestic animals it was possible to better understand how causal and structural variants have influenced the phenotype. With the use of NGS it is possible to quantify the mRNA that is being expressed of a certain gene that influences a certain trait (transcriptome - RNA-Seq), discover epigenetic changes (ChIP-Seq) and, then, better understand the molecular mechanisms that modulate the trait and tissue in question; increase the density of Simple Nucleotide Polymorphism Markers (SNP) with WGS and then discover more significant and more accurate genomic associations. With the advent of NGS came the need for the development of computational power and new tools capable of analyzing and storing the amount of data generated. As a result, the development of software capable of performing quality control, mapping sequences against the reference genome and quantifying the transcripts (in the case of RNA-Seq) has become necessary and, dealing with this type of analysis can be difficult for those unfamiliar with computer systems. For this reason, a userfriendly pipeline was developed to analyze RNA-Seq data, carrying out quality control, mapping and sequence counting. BAQCOM (Bioinformatics Analysis of Quality Control and Mapping) has been shown to be efficient and fast. Using RNA-Seq data, it was aimed to know the global gene expression profile involved in Bacterial Chondronecrosis with Osteomyelitis (BCO) in chicken, which is developed in the bone growth plates of the femur and tibia followed by opportunistic bacteria. Using tibia samples from six commercial broilers (three affected by BCO and three healthy), 192 differentially expressed genes (FDR <0.05) were found (63 upregulated and 129 downregulated). 26 genes and seven transcription factors were found downregulated, explaining BCO in tibia, concluding that BCO in chickens may be caused by the low expression of genes related to bone growth and that bacterial proliferation seems to be a secondary process. Another scenario for the use of NGS is the fine mapping of QTL (quantitative Traits Loci) regions. A QTL region on chromosome 5 associated with backfat thickness was found in four commercial pig lines (synthetic based on large-white, Pietrain, Landrace and Large-White). Backfat is important for feed efficiency and meat quality, as well as being a storage of energy. Although the Genome Wide Association Study (GWAS) has been widely used in association with phenotypes, there is still a need to reduce the associated region if the goal is to find causal mutations. For this reason, it was aimed to reduce this QTL region using data from WGS, RNA-Seq and ChIPSeq. From the most significant SNP of GWAS (leadSNP - SSC5:66103958), haplotypes were phased and haplotypes of size 41 SNPs (20 20) were selected. The most frequent haplotype was selected among the four breeds, so it was possible to identify a region of 5 SNPs (2 2) cross breed. Fine mapping was carried out using this region, first WGS was used and three candidate variants were identified (SSC5:66097445, SSC5:66099282 and SSC5:66103958). In this region between SSC5:66097445-66103958 epigenetic marks H3K27me3 and H3K4me3 were found using ChIP-Seq data from pig alveolar macrophages, indicating regulation of gene expression during the prenatal development period. From this result, RNA-Seq from embryos and fetuses were used, where it was possible to find high expression of the CCND2 gene, which is related to the development and differentiation of adipose tissue, being a strong candidate for a causal gene for backfat. It is also possible to conclude that in this region there may be regulatory elements involved in the expression of the CCND2 gene in embryonic development and that the epigenetic impact during embryonic life can impact the production of traits in adult life. In this thesis, sequencing, genotyping, phenotype, transcriptome and ChIP-Seq data were used, integrating them all to narrow down regions of interest in the genome, thus resulting and proposing tools to improve animal breeding in the future.
Biblioteca responsável: BR68.1