Modelagem conceitual do sistema de banco de dados ProteinWorldDB / Conceptual modeling of the database system ProteinWorldDB
Rio de Janeiro; s.n; 2012. xi,134 p. ilus, tab.
Thesis
em Pt
| LILACS
| ID: lil-750248
Biblioteca responsável:
BR15.1
RESUMO
Esta tese descreve o projeto conceitual do sistema de banco de dados ProteinWorldDB (PWDB). Um ponto importante da proposta do PWDB é permitir a construção de consultas e procedimentos no domínio da genômica comparativa sem a necessidade de comparação de sequências. Além disso, o PCG comparou milhões de sequências de proteína, incluindo o conjunto proteico total de centenas de genomas completos, utilizando programação dinâmica, e não um método heurístico, para os cálculos de similaridade. A estratégia do PCG, assim como a genômica, está fundamentada no conhecimento de que sequências biológicas por si só são pouco informativas; elas precisam ser analisadas a partir de um enfoque comparativo para a inferência de homologia. A comparação de sequências de diferentes organismos introduz uma perspectiva evolutiva ao processo, e o estudo comparativo de genomas completos pode ampliar a escala do conhecimento de um único processo biológico para o de sistemas biológicos complexos em células e organismos. Para responder eficientemente questões dessa natureza, o esquema conceitual apresentado associa bases de dados biológicos de referência aos índices de similaridade já pré-calculados e armazenados pelo PCGUtilizando um formato gráfico de fácil compreensão para representar conceitos e relacionamentos (diagrama ER), o esquema foi proposto para facilitar o planejamento de consultas e procedimentos por pesquisadores da área de genômica (sem conhecimento de linguagens de bancos de dados), assim como guiar o desenvolvimento e a implementação física do PWDB por profissionais da área de computação. Alguns exemplos são apresentados com o objetivo de demonstrar a utilização do esquema conceitual para a especificação de consultas e procedimentos, mesmo antes da existência de um esquema lógico...
ABSTRACT
This thesis describes the conceptual design of the database system ProteinWorldDB(PWDB). An important point of the PWDB proposal is to allow the construction of queriesand procedures in the field of comparative genomics without the need for sequencecomparison. Moreover, the PCG compared millions of protein sequences, including theentire set of proteins from hundreds of complete genomes using dynamic programming,rather than a heuristic method, for calculating similarityPCGs strategy, like that of genomic studies in general, is grounded in the knowledgethat biological sequences alone are uninformative. They need to be analyzed from acomparative approach to infer homology. The comparison of sequences from differentorganisms introduces an evolutionary perspective to the process and the comparativestudy of complete genomes can expand our knowledge from a single biological processall the way to complex biological systems in cells and organisms. To efficiently answerquestions of this nature, the conceptual schema links selected international referencebiological databases to similarity indexes already precomputed and stored by the PCG.By using an easily understandable graphic format to represent concepts andrelationships (ER diagram), the schema was proposed to help the design of queries andprocedures by genomic researchers (who may not have knowledge of databaselanguages) as well as to guide the development and physical implementation of thesystem by developers. Some examples are presented to demonstrate the use of theconceptual schema for specifying queries and procedures, even before the existence ofa logical schema. The schema can be easily extended. Additional modules can be inserted/removed toinclude other protein sequences comparisons projects that may benefit from theinformation provided by the schema´s central module. Likewise, new databases specificto different areas (-omics, for example) can be cross-referenced to the schema...
Texto completo:
1
Base de dados:
LILACS
Assunto principal:
Homologia de Genes
/
Biologia Computacional
/
Genômica
/
Bases de Dados de Ácidos Nucleicos
Idioma:
Pt
Ano de publicação:
2012
Tipo de documento:
Thesis