Passo 01
Vá para o site do GeneBank
Vá para a página de busca por sequências de nucleotídeos do GenBank aqui http://www.ncbi.nlm.nih.gov/nucleotide.
Escolha o Táxon & Gene
- Clique na opção avançado (Advanced), escolha um táxon (Organism) e um Gene (Gene Name), ou apenas um táxon. Num segundo passo iremos filtrar esses dados para os dados de interesse (isso será feito no R).
- Execute a busca!
Visualize uma sequência dos resultados
Iremos baixar os dados no formato FASTA, portanto, veja o que isso significa. Você poderia baixar em outros formatos (GeneBank) que contém informações adicionais, mas FASTA é um formato muito versátil, lido por praticamente todos os softwares de análises filogenéticas e facilmente convertido para outros formatos. Fasta nada mais é do que um arquivo em formato de texto (.txt).
Salve os Dados no Seu computador
Exporte os TODOS os dados resultantes da sua busca num arquivo no seu computador em formato FASTA.