Efficiency and power as a function of sequence coverage, SNP array density, and imputation.

Flannick, Jason; Korn, Joshua M; Fontanillas, Pierre; Grant, George B; Banks, Eric; Depristo, Mark A; Altshuler, David

Flannick, Jason; Korn, Joshua M; Fontanillas, Pierre; Grant, George B; Banks, Eric; Depristo, Mark A; Altshuler, David.

Afiliação

Flannick J; Broad Institute of Harvard and MIT, Cambridge, Massachusetts, United States of America.

PLoS Comput Biol ; 8(7): e1002604, 2012.

Article em En | MEDLINE | ID: mdl-22807667

ABSTRACT

ABSTRACT

High coverage whole genome sequencing provides near complete information about genetic variation. However, other technologies can be more efficient in some settings by (a) reducing redundant coverage within samples and (b) exploiting patterns of genetic variation across samples. To characterize as many samples as possible, many genetic studies therefore employ lower coverage sequencing or SNP array genotyping coupled to statistical imputation. To compare these approaches individually and in conjunction, we developed a statistical framework to estimate genotypes jointly from sequence reads, array intensities, and imputation. In European samples, we find similar sensitivity (89%) and specificity (99.6%) from imputation with either 1× sequencing or 1 M SNP arrays. Sensitivity is increased, particularly for low-frequency polymorphisms (MAF < 5%), when low coverage sequence reads are added to dense genome-wide SNP arrays--the converse, however, is not true. At sites where sequence reads and array intensities produce different sample genotypes, joint analysis reduces genotype errors and identifies novel error modes. Our joint framework informs the use of next-generation sequencing in genome wide association studies and supports development of improved methods for genotype calling.

Assuntos

Genômica/métodos; Análise de Sequência com Séries de Oligonucleotídeos/métodos; Polimorfismo de Nucleotídeo Único; Análise de Sequência de DNA/métodos; Algoritmos; Análise por Conglomerados; Bases de Dados Genéticas; Estudo de Associação Genômica Ampla; Genótipo; Humanos; Sensibilidade e Especificidade; População Branca

Texto completo

Imprimir

XML

PubMed Links

Buscar no Google

Texto completo: 1 Coleções: 01-internacional Base de dados: MEDLINE Assunto principal: Análise de Sequência de DNA / Análise de Sequência com Séries de Oligonucleotídeos / Polimorfismo de Nucleotídeo Único / Genômica Tipo de estudo: Diagnostic_studies Limite: Humans Idioma: En Ano de publicação: 2012 Tipo de documento: Article

Texto completo

Imprimir

XML

PubMed Links

Buscar no Google