Your browser doesn't support javascript.
loading
NAToRA, a relatedness-pruning method to minimize the loss of dataset size in genetic and omics analyses.
Leal, Thiago Peixoto; Furlan, Vinicius C; Gouveia, Mateus Henrique; Saraiva Duarte, Julia Maria; Fonseca, Pablo As; Tou, Rafael; Scliar, Marilia de Oliveira; Araujo, Gilderlanio Santana de; Costa, Lucas F; Zolini, Camila; Peixoto, Maria Gabriela Campolina Diniz; Carvalho, Maria Raquel Santos; Lima-Costa, Maria Fernanda; Gilman, Robert H; Tarazona-Santos, Eduardo; Rodrigues, Maíra Ribeiro.
Afiliação
  • Leal TP; Departamento de Genética, Ecologia e Evolução, Instituto de Ciências Biológicas, Universidade Federal de Minas Gerais, Belo Horizonte, MG, Brazil.
  • Furlan VC; Lerner Research Institute, Genomic Medicine, Cleveland Clinic, Cleveland, OH, United States.
  • Gouveia MH; Departamento de Genética, Ecologia e Evolução, Instituto de Ciências Biológicas, Universidade Federal de Minas Gerais, Belo Horizonte, MG, Brazil.
  • Saraiva Duarte JM; Departamento de Genética, Ecologia e Evolução, Instituto de Ciências Biológicas, Universidade Federal de Minas Gerais, Belo Horizonte, MG, Brazil.
  • Fonseca PA; Center for Research on Genomics & Global Health, National Human Genome Research Institute, National Institutes of Health, Bethesda, MD, United States.
  • Tou R; Departamento de Genética, Ecologia e Evolução, Instituto de Ciências Biológicas, Universidade Federal de Minas Gerais, Belo Horizonte, MG, Brazil.
  • Scliar MO; Departamento de Genética, Ecologia e Evolução, Instituto de Ciências Biológicas, Universidade Federal de Minas Gerais, Belo Horizonte, MG, Brazil.
  • Araujo GS; Centre for Genetic Improvement of Livestock, Department of Animal Biosciences, University of Guelph, Guelph, Ontario, Canada.
  • Costa LF; Departamento de Genética, Ecologia e Evolução, Instituto de Ciências Biológicas, Universidade Federal de Minas Gerais, Belo Horizonte, MG, Brazil.
  • Zolini C; Centro de Estudos do Genoma Humano e Células-Tronco, Instituto de Biociências, Universidade de São Paulo, São Paulo, São Paulo, Brazil.
  • Peixoto MGCD; Laboratório de Genética Humana e Médica, Programa de Pós-Graduação em Biologia Molecular, Instituto de Ciências Biológicas, Universidade Federal do Pará, Belém, Pará, Brazil.
  • Carvalho MRS; Departamento de Genética, Ecologia e Evolução, Instituto de Ciências Biológicas, Universidade Federal de Minas Gerais, Belo Horizonte, MG, Brazil.
  • Lima-Costa MF; Departamento de Genética, Ecologia e Evolução, Instituto de Ciências Biológicas, Universidade Federal de Minas Gerais, Belo Horizonte, MG, Brazil.
  • Gilman RH; Beagle, Belo Horizonte, Minas Gerais, Brazil.
  • Tarazona-Santos E; Mosaico Translational Genomics Initiative, Belo Horizonte, Minas Gerais, Brazil.
  • Rodrigues MR; Embrapa Gado de Leite, Embrapa, Juiz de Fora, Minas Gerais, Brazil.
Comput Struct Biotechnol J ; 20: 1821-1828, 2022.
Article em En | MEDLINE | ID: mdl-35521552
ABSTRACT
Genetic and omics analyses frequently require independent observations, which is not guaranteed in real datasets. When relatedness cannot be accounted for, solutions involve removing related individuals (or observations) and, consequently, a reduction of available data. We developed a network-based relatedness-pruning method that minimizes dataset reduction while removing unwanted relationships in a dataset. It uses node degree centrality metric to identify highly connected nodes (or individuals) and implements heuristics that approximate the minimal reduction of a dataset to allow its application to complex datasets. When compared with two other popular population genetics methodologies (PLINK and KING), NAToRA shows the best combination of removing all relatives while keeping the largest possible number of individuals in all datasets tested and also, with similar effects on the allele frequency spectrum and Principal Component Analysis than PLINK and KING. NAToRA is freely available, both as a standalone tool that can be easily incorporated as part of a pipeline, and as a graphical web tool that allows visualization of the relatedness networks. NAToRA also accepts a variety of relationship metrics as input, which facilitates its use. We also release a genealogies simulator software used for different tests performed in this study.
Palavras-chave

Texto completo: 1 Coleções: 01-internacional Base de dados: MEDLINE Idioma: En Ano de publicação: 2022 Tipo de documento: Article

Texto completo: 1 Coleções: 01-internacional Base de dados: MEDLINE Idioma: En Ano de publicação: 2022 Tipo de documento: Article