Preparação de Dados para análise estatística PRN 235 2015 - PRONAT/UFRR
Bem vindo(a). Aqui você encontra informações, programa e material da disciplina, a ser ministrada entre 09 e 13 de novembro de 2015.
Ementa
Princípios sobre organização, armazenamento e disponibilização de dados e metadados. Uso da linguagem do software livre R para manipulação e análise de dados. Montagem de roteiros de análises e funções para análise de dados.
Informações gerais
Data: 09-13 de novembro de 2015
Local: Sala de aula do PRONAT-UFRR
Horário: aulas pela manhã, 9:00-12:00 h, e tarde, 14:00-17:00 h
Número de créditos: Dois
Professor: Lidiany Carvalho (lidycamila@yahoo.com.br) - UFRR
Monitores: Raissa Paiva (UFRR - raissalagreca@hotmail.com) e Ricardo Perdiz (INPA / ricoperdiz@gmail.com).
Este curso é uma adaptação livre das disciplinas Eco-98 Preparação de Dados para Análise Estatística, do Programa de Pós-graduação em Ecologia do Instituto Nacional de Pesquisas da Amazônia (INPA), e Preparação de Dados para Análises Estatísticas do Programa de Pós-graduação em Ciências Biológicas (Botânica), também do INPA. Essas disciplinas são ministradas anualmente pelos professores Fabrício Baccaro (UFAM) e Alberto Vicentini (INPA), respectivamente. Enfatizamos que este curso NÃO é projetado para aulas expositivas; aprender a linguagem R é um exercício diário e que deve ser feito com perseverança, muito estudo e muita prática pelo próprio aluno. Tanto o professor quanto os monitores serão simples guias na condução das aulas, cabendo ao aluno o papel de estudar e se dedicar ao aprendizado.
Turma 2015
Material de apoio da disciplina
- Nossa disciplina será baseada na Apostila de introdução ao R - Vitor Landeiro - versão 6.2. Trata-se de excelente introdução à linguagem R, de autoria de Vitor Landeiro (UFMT, com contribuições de Fabrício Baccaro (UFAM). Durante a semana, utilizaremos conjuntos de dados do próprio autor como exercícios para o aprendizado da linguagem R, que podem ser acessados na página pessoal do autor Vitor Landeiro, ou baixados aqui;
- Apresentação da linguagem R - Breve explanação sobre a filosofia do R e a maneira de se trabalhar dentro dele. Para mais detalhes, recomendamos a leitura da aula introdutória do curso de Introdução à Linguagem R da USP, de autoria dos professores Alexandre Adalardo de Oliveira, João Luis Ferreira Batista e Paulo Inácio Prado.
Softwares para instalação
- Apesar de não ser obrigatório, recomendamos fortemente a instalação de alguma suíte de aplicativos office, como por exemplo, o LibreOffice (usuários de Ubuntu Linux já possuem essa suíte pré-instalada). É recorrente a importação de planilhas de dados em formato ".txt" ou ".csv" no R. Esses arquivos possuem seus dados separados e codificados em diversas maneiras. Caso isso não seja "entendido" pelo R adequadamente, os dados podem sofrer distorções, como, por exemplo, o não reconhecimento de acentos em nomes de pessoas ou lugares. A manipulação desses arquivos pelo LibreOffice confere maior liberdade na escolha do separador de dados e codificador de caracteres em arquivos ".txt" e ".csv". Para maior esclarecimento sobre esses temas, leia textos do Wikipedia sobre codificação de caracteres e delimitação de dados.
- Também recomendamos a instalação de um bom editor de texto, como Notepadd++, para usuários Windows, TextWrangler, para usuários Mac OS X, e GEdit para usuários Linux. Durante a disciplina, teremos a necessidade de entender a estrutura de determinados arquivos e também buscar possíveis erros na separação dos e codificação de caracteres, tarefa facilitada por esses editores.
Programação
A disciplina consiste de aulas teóricas curtas, seguidas de tutoriais e exercícios.
Recursos para aprendizado do R
A lista fornecida abaixo foi organizada pelo professor Alberto Vicentini (INPA), disponibilizada na página da disciplina ministrada por ele anualmente no PPGBOT INPA. Essa lista sofreu modificações e acréscimos pelo monitor Ricardo Perdiz (INPA). Todos os materiais listados, que incluem manuais, arquivos e sítios na web, encontram-se disponíveis gratuitamente online. Aproveitem!
Arquivos
- Os três manuais listados abaixo estão disponíveis no sítio online do R em Contributed Documentation, onde você encontra inclusive documentação em português.
- Venables, W.; Smith, D.M; & R Development Team An Introduction to R. Manual online. Manual oficial de introdução ao R.
- Carlos Alzola and Frank E. Harrell An Introduction to S and the Hmisc and Design Libraries” O Pacote Hmisc veio do S-Plus, e tem várias funções muito úteis para manipulação e análise exploratória de dados. O manual é extenso e é uma referência muito completa sobre a linguagem S.
- Petra Kuhnert and Bill Venables An Introduction to R: Software for Statistical Modelling & Computing. Apostila de 360 páginas de curso de Introdução ao R, além dos scripts de aula e conjuntos de dados.
- No sítio do R, você pode encontrar o chamado R Reference Card. Trata-se de um resumo em que as funções são expostas por categorias (help, input e output, criação de dados etc).
- Taskviews: São listas comentadas dos pacotes do R para uma certa área ou tema, mantidas no CRAN1). Para nossa área, p.ex, há os views Environmetrics, Multivariate, Genetics, Spatial, Morphometrics, Phylogenetics. Todo espelho de CRAN mantém uma cópia dos taskviews. Para o espelho da FMV-USP o link é http://www.vps.fmvz.usp.br/CRAN/web/views/.
- The R Wikibook: manual muito completo na coleção de Wiki Books.
Páginas de disciplina de R
- Página da disciplina deintrodução à Linguagem R para Pós-Graduandos em Ecologia e áreas afins da USP, uma das fontes inspiradoras deste curso. Há muitos recursos disponíveis para aprendizado, incluindo diversos tutoriais. Busquem e aprendam.
- Página da disciplina Preparação de dados para Análise Estatística (BOT-89) 2015 do INPA, ministrada pelo professor Alberto Vicentini, também fonte inspiradora para esta disciplina. Assim como a disciplina da USP citada acima, a página também contem muitos recursos disponíveis para aprendizado, slides das aulas etc. Aproveitem.
Sítios na Rede
- Como fazer mapas no R? Use o R como uma ferramenta de geoprocessamento para fazer mapas. Este link contem uma excelente introdução ao tema.
- R-bloggers é um blog sobre R, com dicas de análises, pacotes e afins. Excelente para aprender novas abordagens, ferramentas de análise e com muitos tutoriais.
- CRANTASTIC!: Excelente sítio com resumos de todos os pacotes do CRAN. Tem recursos para buscas de pacotes e funções por assuntos, resumos de cada pacote, avaliações de pacotes e muito mais. Juntamente com as taskviews, é o recurso básico para encontrar o pacote que você busca no R.
- The R Journal: periódico mantido pelo R Project, onde são publicados artigos sobre novos pacotes, dicas para programadores e usuários, e uso do R nas mais variadas aplicações estatísticas.
- Quick R, de Rob Kabakoff: um guia rápido on line muito bem organizado e fácil de consultar. Foi criado para facilitar a migração de usuários de outros pacotes, mas é um recurso de consulta rápida útil para todos.
- R Graph Gallery: para conhecer gráficos que podem ser gerados com o R (e obter o código se gostar de algum).