Your browser doesn't support javascript.
loading
No one-size-fits-all solution to clean GBIF.
Zizka, Alexander; Antunes Carvalho, Fernanda; Calvente, Alice; Rocio Baez-Lizarazo, Mabel; Cabral, Andressa; Coelho, Jéssica Fernanda Ramos; Colli-Silva, Matheus; Fantinati, Mariana Ramos; Fernandes, Moabe F; Ferreira-Araújo, Thais; Gondim Lambert Moreira, Fernanda; Santos, Nathália Michellyda Cunha; Santos, Tiago Andrade Borges; Dos Santos-Costa, Renata Clicia; Serrano, Filipe C; Alves da Silva, Ana Paula; de Souza Soares, Arthur; Cavalcante de Souza, Paolla Gabryelle; Calisto Tomaz, Eduardo; Vale, Valéria Fonseca; Vieira, Tiago Luiz; Antonelli, Alexandre.
Afiliação
  • Zizka A; sDiv, German Centre for Integrative Biodiversity Research Halle-Jena-Leipzig (iDiv), Leipzig, Germany.
  • Antunes Carvalho F; Naturalis Biodiversity Center, Leiden, The Netherlands.
  • Calvente A; Departamento de Genética, Ecologia e Evolução, Universidade Federal de Minas Gerais, Belo Horizonte, Brazil.
  • Rocio Baez-Lizarazo M; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Cabral A; Departamento de Botânica, Universidade Federal do Rio Grande do Sul, Porto Alegre, Brazil.
  • Coelho JFR; Departamento de Botânica, Universidade de São Paulo, São Paulo, Brazil.
  • Colli-Silva M; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Fantinati MR; Departamento de Botânica, Universidade de São Paulo, São Paulo, Brazil.
  • Fernandes MF; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Ferreira-Araújo T; Departamento de Ciências Biológicas, Universidade Estadual de Feira de Santana, Feira de Santana, Brazil.
  • Gondim Lambert Moreira F; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Santos NMC; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Santos TAB; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Dos Santos-Costa RC; Departamento de Ciências Biológicas, Universidade Estadual de Feira de Santana, Feira de Santana, Brazil.
  • Serrano FC; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Alves da Silva AP; Departamento de Ecologia, Universidade de São Paulo, São Paulo, Brazil.
  • de Souza Soares A; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Cavalcante de Souza PG; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Calisto Tomaz E; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Vale VF; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Vieira TL; Departamento de Botânica e Zoologia, Universidade Federal do Rio Grande do Norte, Natal, Brazil.
  • Antonelli A; Departamento de Ciências Biológicas, Universidade Estadual de Feira de Santana, Feira de Santana, Brazil.
PeerJ ; 8: e9916, 2020.
Article em En | MEDLINE | ID: mdl-33062422
ABSTRACT
Species occurrence records provide the basis for many biodiversity studies. They derive from georeferenced specimens deposited in natural history collections and visual observations, such as those obtained through various mobile applications. Given the rapid increase in availability of such data, the control of quality and accuracy constitutes a particular concern. Automatic filtering is a scalable and reproducible means to identify potentially problematic records and tailor datasets from public databases such as the Global Biodiversity Information Facility (GBIF; http//www.gbif.org), for biodiversity analyses. However, it is unclear how much data may be lost by filtering, whether the same filters should be applied across all taxonomic groups, and what the effect of filtering is on common downstream analyses. Here, we evaluate the effect of 13 recently proposed filters on the inference of species richness patterns and automated conservation assessments for 18 Neotropical taxa, including terrestrial and marine animals, fungi, and plants downloaded from GBIF. We find that a total of 44.3% of the records are potentially problematic, with large variation across taxonomic groups (25-90%). A small fraction of records was identified as erroneous in the strict sense (4.2%), and a much larger proportion as unfit for most downstream analyses (41.7%). Filters of duplicated information, collection year, and basis of record, as well as coordinates in urban areas, or for terrestrial taxa in the sea or marine taxa on land, have the greatest effect. Automated filtering can help in identifying problematic records, but requires customization of which tests and thresholds should be applied to the taxonomic group and geographic area under focus. Our results stress the importance of thorough recording and exploration of the meta-data associated with species records for biodiversity research.
Palavras-chave

Texto completo: 1 Coleções: 01-internacional Base de dados: MEDLINE Tipo de estudo: Prognostic_studies Idioma: En Revista: PeerJ Ano de publicação: 2020 Tipo de documento: Article País de afiliação: Alemanha

Texto completo: 1 Coleções: 01-internacional Base de dados: MEDLINE Tipo de estudo: Prognostic_studies Idioma: En Revista: PeerJ Ano de publicação: 2020 Tipo de documento: Article País de afiliação: Alemanha