Usar o Power Query no Excel para analisar datasets (com vídeo)
Tutorial onde mostramos como carregar dados externos no Power Query (exemplo dataset Titanic do Kaggle).
Começar a utilizar o Power Query (Introdução à ferramenta)
Passo 1 // Vamos descarregar o dataset Titanic - Machine Learning from Disaster do Kaggle, um dos mais famosos na introdução ao mundo da Data Science, e transformar alguns dados com o Power Query. Começamos com o dataset test.csv.Passo 2 // Abrimos a funcionalidade "Obter Dados" e selecionamos a fonte dos dados.
Passo 3 // Importar um ficheiro CSV.
Passo 4 // Selecionar o test.csv do Titanic que descarregámos do Kaggle.
Passo 5 // Podemos "Carregar" os dados tal e qual o formato original do dataset ou "Transformar" para personalizar a informação carregada. Seguimos com a opção "Carregar".
As 418 linhas deste CSV estão carregadas na sheet do nosso ficheiro. Estes são os dados de origem sobre o qual trabalharemos no Power Query.
Passo 6 // Podemos actualizar ou acrescentar mais dados a este dataset. E para o demonstrar, vamos regressar ao Kaggle, descarregar o dataset de treino (train.csv) e acrescentá-lo ao dataset inicial de teste (test.csv).
Sabemos que ambos têm a mesma estrutura de colunas pelo que apenas temos que repetir o "Passo 3" e adicionar este novo CSV ao nosso ficheiro.
Passo 7 // Se quisessemos abrir os dados de apenas um CSV isolado, bastaria "Iniciar o editor do Power Query" a partir da sheet com os dados a transformar.
Mas como vamos querer trabalhar as duas fontes de dados em conjunto (os dois CSV) vamos chamar o Power Query via opção "Combinar Consultas".
E selecionamos os dados que pretendemos.
Passo 8 // Já temos os dois datasets (train e test) combinados numa tabela de Power Query pelo que podemos começar a analisar os dados e a fazer Transformações nestes Dados.
Exemplos de Transformação de Dados no Dataset Titanic
Vídeo 1 e 2 // Dividir Coluna pelo Delimitador
Vídeo 3 // Mover uma Coluna
Vídeo 4 // Colocar com Maiúsculas
Vídeo 5 // Ordenar Dados
Vídeo 6 // Formatar e Substituir Dados em Falta (Missing Values)
Vídeo 7 // Adicionar uma nova Coluna Condicional
Vídeo 8 // Ver Qualidade, Perfil e Distribuição dos Dados
Vídeo 9 // Voltar atrás num Erro de Código
Vídeo 10 // Tratar Erros de Dados
Não encontras o Power Query? Lê o artigo “O meu Excel não tem Power Query?"
Para receberes directamente na tua caixa de correio os nossos artigos mais recentes sobre dicas e truques de Excel em português subscreve a nossa lista de emails!
Descargas
Descarrega aqui o ficheiro com os exemplos do artigo para usar o Power Query na análise de datasets