Usar o Power Query no Excel para analisar datasets (com vídeo)

Tutorial onde mostramos como carregar dados externos no Power Query (exemplo dataset Titanic do Kaggle).
Introdução ao power query

Começar a utilizar o Power Query (Introdução à ferramenta)

Passo 1 // Vamos descarregar o dataset Titanic - Machine Learning from Disaster do Kaggle, um dos mais famosos na introdução ao mundo da Data Science, e transformar alguns dados com o Power Query. Começamos com o dataset test.csv.

Titanic test dataset

Passo 2 // Abrimos a funcionalidade "Obter Dados" e selecionamos a fonte dos dados.

Passo 3 // Importar um ficheiro CSV.

Obter dados

Passo 4 // Selecionar o test.csv do Titanic que descarregámos do Kaggle.

Ligar dados

Passo 5 // Podemos "Carregar" os dados tal e qual o formato original do dataset ou "Transformar" para personalizar a informação carregada. Seguimos com a opção "Carregar".

Carregar dados

As 418 linhas deste CSV estão carregadas na sheet do nosso ficheiro. Estes são os dados de origem sobre o qual trabalharemos no Power Query.

Dados carregados na sheet

Passo 6 // Podemos actualizar ou acrescentar mais dados a este dataset. E para o demonstrar, vamos regressar ao Kaggle, descarregar o dataset de treino (train.csv) e acrescentá-lo ao dataset inicial de teste (test.csv).

Sabemos que ambos têm a mesma estrutura de colunas pelo que apenas temos que repetir o "Passo 3" e adicionar este novo CSV ao nosso ficheiro.

Adicionar outro csv

Passo 7 // Se quisessemos abrir os dados de apenas um CSV isolado, bastaria "Iniciar o editor do Power Query" a partir da sheet com os dados a transformar.

Iniciar o editor do power query

Mas como vamos querer trabalhar as duas fontes de dados em conjunto (os dois CSV) vamos chamar o Power Query via opção "Combinar Consultas".

Combinar consultas

E selecionamos os dados que pretendemos.

Combinar 2 tabelas

Passo 8 // Já temos os dois datasets (train e test) combinados numa tabela de Power Query pelo que podemos começar a analisar os dados e a fazer Transformações nestes Dados.

Editor carregado com 2 tabelas

Exemplos de Transformação de Dados no Dataset Titanic


Vídeo 1 e 2 // Dividir Coluna pelo Delimitador
Vídeo 3 // Mover uma Coluna
Vídeo 4 // Colocar com Maiúsculas
Vídeo 5 // Ordenar Dados
Vídeo 6 // Formatar e Substituir Dados em Falta (Missing Values)
Vídeo 7 // Adicionar uma nova Coluna Condicional
Vídeo 8 // Ver Qualidade, Perfil e Distribuição dos Dados
Vídeo 9 // Voltar atrás num Erro de Código
Vídeo 10 // Tratar Erros de Dados
Não encontras o Power Query? Lê o artigo “O meu Excel não tem Power Query?"

Para receberes directamente na tua caixa de correio os nossos artigos mais recentes sobre dicas e truques de Excel em português subscreve a nossa lista de emails!

Descargas

Descarrega aqui o ficheiro com os exemplos do artigo para usar o Power Query na análise de datasets