Este artigo é um Preprint
Preprints são relatos preliminares de pesquisa que não foram certificados pela revisão por pares. Eles não devem ser considerados para orientar a prática clínica ou comportamentos relacionados à saúde e não devem ser publicados na mídia como informação estabelecida.
Preprints publicados online permitem que os autores recebam feedback rápido, e toda a comunidade científica pode avaliar o trabalho independentemente e responder adequadamente. Estes comentários são publicados juntamente com os preprints para qualquer pessoa ler e servir como uma avaliação pós-publicação.
Analysis of B-cell receptor repertoires in COVID-19 patients using deep embedded representations of protein sequences
Preprint
em En
| PREPRINT-BIORXIV
| ID: ppbiorxiv-454701
ABSTRACT
Analyzing B cell receptor (BCR) repertoires is immensely useful in evaluating ones immunological status. Conventionally, repertoire analysis methods have focused on comprehensive assessments of clonal compositions, including V(D)J segment usage, nucleotide insertions/deletions, and amino acid distributions. Here, we introduce a novel computational approach that applies deep-learning-based protein embedding techniques to analyze BCR repertoires. By selecting the most frequently occurring BCR sequences in a given repertoire and computing the sum of the vector representations of these sequences, we represent an entire repertoire as a 100-dimensional vector and eventually as a single data point in vector space. We demonstrate that this new approach enables us to not only accurately cluster BCR repertoires of coronavirus disease 2019 (COVID-19) patients and healthy subjects but also efficiently track minute changes in immune status over time as patients undergo treatment. Furthermore, using the distributed representations, we successfully trained an XGBoost classification model that achieved a mean accuracy rate of over 87% given a repertoire of CDR3 sequences.
cc_by_nc_nd
Texto completo:
1
Coleções:
09-preprints
Base de dados:
PREPRINT-BIORXIV
Tipo de estudo:
Experimental_studies
Idioma:
En
Ano de publicação:
2021
Tipo de documento:
Preprint