[[bot89:aed:repositorios]]

Repositórios de dados

Durante e após esta disciplina, muitas atividades envolverão a importação de dados para o ambiente R para manipulação dos dados, checagem e controle de qualidade, análises, e plotagem de gráficos. Por isso, é importante que essa prática de importar dados seja bem entendida e dominada por vocês.

Nada melhor então do que estar a par dos repositórios de dados online, que são responsáveis por armazenar os dados em uma forma estrutura e sempre acompanhados de metadados, que descrevem este conjunto de dados e permitem a qualquer pesquisador o entendimento sobre o que são aqueles e como reutilizá-los.

Nós compilamos uma lista, incompleta, que serve como uma referência inicial tanto para uma busca de dados quanto para conhecimento a respeito de possíveis repositórios para depositar seus próprios dados:

  • SpeciesLink - coletânea de dados de vários herbários Brasileiros (e outras coleções biológicas). Além de fazer buscas consolidadas, tem várias ferramentas para data cleaning (preprocessamento de dados).
  • INPA-BRAHMS - Base de dados do Herbário INPA
  • Tropicos - Base de dados de nomenclatura botânica e do herbário do Missouri Botanical Garden (MO)
  • NYBG virtual herbarium - link para o site do herbário do NYBG para busca de planta vasculares (outras bases existem no mesmo site) - contain importantes coleções da flora amazônica
  • Herbário Nacional da Holanda - usa a plataforma Brahms e tem coleções importantes da flora amazônica
  • Kew Herbarium Catalogue - base do herbário de Kew (Inglaterra), muita coisa da Amazônia e do Brasil.
  • GBIF - Global Biodiversity Information Facility - repositório global de dados de biodiversidade
  • Field Museum - herbário do Field Museum (Chicago), muitos dados da Amazônia, principalmente da Amazônia Ocidental.
  • GenBank - repositório de dados moleculares de organismos (sequências de nucleotídeos, proteínas). É obrigatório depositar neste repositório dados de estudos filogenéticos antes de publicar os resultados.
  • TreeBASE - repositório de informação filogenética, especificamente árvores filogenéticas e os dados usados para gerar essas árvores (deve ter metadados incluido, será que são explicativos?)
  • Plant Trait Database - repositório de caracteres funcionais de plantas
  • DataBib - permite buscar repositórios de dados
  • Zenodo - Zenodo é um repositório de livre acesso e de múltiplos tipos de dados, desenvolvido no consórcio europeu OpenAIRE e operado pela CERN. Permite que o cientista deposite conjuntos de dados, softwares, relatórios, e qualquer outro documento relacionado à pesquisa. Para cada submissão, um DOI é gerado, permitindo ao objeto depositado a facilidade de uma citação.
  • Mendeley data - Repositório de dados da Elsevier, uma gigante do mercado de publicações científicas mundial.
  • Data in Brief - Periódico da Elsevier que publica o chamado *data paper*, ou artigo de dados, em que se descreve um conjunto de dados depositado, preferencialmente, no Mendeley Data.

Abaixo, preparamos um breve tutorial para baixar dados do DRYAD e GBIF manualmente, ou utilizando a linguagem R para baixar dados do GBIF:

- Baixando dados de repositórios virtuais de dados

  • bot89/aed/repositorios.txt
  • Última modificação: 16/07/2020 13:07
  • por perdiz