Apesar de muito poderoso o terminal nem sempre é conhecido profundamente por pessoas que lidam com dados e por isso é bastante subutilizada. A tela preta causa aversão, mas existem diversos programas que podem auxiliar e agilizar o dia-a-dia de uma cientista de dados: alguns antigos, criados há décadas, e outros mais modernos, que interagem com novos formatos de dados e protocolos.
Nessa oficina será apresentada uma
introdução ao terminal (para os que não conhecem), incluindo diversos
programas úteis no trabalho com dados (todos softwares livres). Como oficina é baseada em resolver problemas, as principais dificuldades relacionadas ao trabalho com dados (conversão e limpeza) guiarão os exercícios.
Para finalizar, serão mostrados
exemplos reais de uso desses programas para libertar vários dos
datasets que estão disponíveis no
https://brasil.io/, um portal de dados abertos acessíveis, desenvolvido de maneira colaborativa.
FerramentasCygwin (apenas para usuários Windows)