Resolvido: adicione nova coluna ao dataframe do pandas

Neste artigo, exploraremos o processo de adicionar uma nova coluna a um Pandas DataFrame, uma biblioteca popular em Python para manipulação e análise de dados. Discutiremos a solução para esse problema, passaremos por uma explicação passo a passo do código e abordaremos alguns tópicos e funções relacionados na biblioteca do Pandas. Pandas é uma biblioteca amplamente utilizada com estruturas e ferramentas de dados de alto nível, perfeitas para tarefas eficientes de análise e manipulação de dados.

Para começar, vamos supor que temos um conjunto de dados na forma de um Pandas DataFrame e queremos adicionar uma nova coluna a ele. Esse é um requisito comum no estágio de preparação de dados, geralmente necessário para engenharia de recursos ou para gerar informações adicionais com base em colunas existentes. Vamos mergulhar em como isso pode ser alcançado.

Adicionando uma nova coluna a um Pandas DataFrame

Começaremos importando a biblioteca necessária e criando um exemplo de DataFrame.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Agora, vamos adicionar uma nova coluna 'Country' ao nosso DataFrame com um valor padrão, digamos 'USA'.

df['Country'] = 'USA'

Esta simples linha de código adicionará uma nova coluna chamada 'Country' ao nosso DataFrame 'df' existente com o valor 'USA' em todas as suas linhas. Nosso DataFrame atualizado ficaria assim:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Explicação do código passo a passo

Vamos detalhar o código e entendê-lo passo a passo.

1. Primeiro, importamos a biblioteca Pandas usando o alias padrão 'pd'. Isso nos permite acessar as funções e classes do Pandas usando o prefixo 'pd'.

import pandas as pd

2. Em seguida, criamos um dicionário 'dados' contendo alguns dados de amostra. Cada chave no dicionário representa um nome de coluna e seu valor correspondente é uma lista de valores para essa coluna.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Em seguida, convertemos este dicionário em um objeto Pandas DataFrame usando a função `pd.DataFrame()`.

df = pd.DataFrame(data)

4. Finalmente, para adicionar uma nova coluna, simplesmente usamos o operador de atribuição “=” com o DataFrame, fornecendo o nome da nova coluna entre colchetes e especificando o valor padrão. No nosso caso, adicionamos a coluna 'País' com o valor padrão 'EUA'.

df['Country'] = 'USA'

Biblioteca Pandas e funções relacionadas

Pandas é uma poderosa biblioteca Python, particularmente adequada para tarefas de processamento, limpeza e análise de dados. Ele fornece duas estruturas de dados principais: Quadro de dados e Série. Um DataFrame é uma estrutura de dados tabular bidimensional com eixos rotulados (linhas e colunas). Uma série, por outro lado, é uma matriz rotulada unidimensional capaz de conter dados de qualquer tipo.

Algumas funções comuns do Pandas relacionadas à adição, modificação e exclusão de colunas em um DataFrame são as seguintes:

  • inserir(): Para inserir uma coluna em uma posição especificada.
  • derrubar(): Para remover uma coluna do DataFrame.
  • renomear(): Para renomear a coluna de um DataFrame.
  • atribuir(): Para criar uma nova coluna com base no resultado de uma expressão.

Portanto, adicionar uma nova coluna a um Pandas DataFrame é simples e eficiente. Neste artigo, abordamos o método básico de adicionar uma nova coluna com um valor padrão e fornecemos explicações detalhadas para as etapas envolvidas. Também apresentamos o Pandas como uma poderosa biblioteca de manipulação de dados e discutimos algumas funções relacionadas para gerenciar colunas DataFrame. Ao dominar essas técnicas, você estará bem equipado para lidar com uma ampla gama de tarefas de processamento de dados em Python.

Artigos relacionados:

Deixe um comentário