해결됨: pandas 데이터 프레임에 새 열 추가

이 기사에서는 데이터 조작 및 분석을 위해 Python에서 인기 있는 라이브러리인 Pandas DataFrame에 새 열을 추가하는 프로세스를 살펴봅니다. 이 문제에 대한 해결책에 대해 논의하고, 코드에 대한 단계별 설명을 살펴보고, Pandas 라이브러리의 일부 관련 주제와 기능을 다룰 것입니다. Pandas는 효율적인 데이터 분석 및 처리 작업에 적합한 높은 수준의 데이터 구조 및 도구를 제공하는 널리 사용되는 라이브러리입니다.

먼저 Pandas DataFrame 형식의 데이터 세트가 있고 여기에 새 열을 추가한다고 가정해 보겠습니다. 이는 데이터 준비 단계의 일반적인 요구 사항으로, 기능 엔지니어링 또는 기존 열을 기반으로 추가 정보를 생성하는 데 종종 필요합니다. 이를 달성할 수 있는 방법에 대해 살펴보겠습니다.

Pandas DataFrame에 새 열 추가

필요한 라이브러리를 가져오고 샘플 DataFrame을 만드는 것으로 시작하겠습니다.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

이제 DataFrame에 새 열 '국가'를 기본값 'USA'로 추가해 보겠습니다.

df['Country'] = 'USA'

이 간단한 코드 줄은 모든 행에 값이 'USA'인 기존 DataFrame 'df'에 'Country'라는 새 열을 추가합니다. 업데이트된 DataFrame은 다음과 같습니다.

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

단계별 코드 설명

코드를 분해하고 단계별로 이해해 봅시다.

1. 먼저 표준 별칭 'pd'를 사용하여 Pandas 라이브러리를 가져옵니다. 이를 통해 'pd' 접두사를 사용하여 Pandas 함수 및 클래스에 액세스할 수 있습니다.

import pandas as pd

2. 다음으로 일부 샘플 데이터가 포함된 사전 '데이터'를 만듭니다. 사전의 각 키는 열 이름을 나타내며 해당 값은 해당 열의 값 목록입니다.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. 그런 다음 `pd.DataFrame()` 함수를 사용하여 이 사전을 Pandas DataFrame 객체로 변환합니다.

df = pd.DataFrame(data)

4. 마지막으로 새 열을 추가하려면 DataFrame과 함께 할당 연산자 "="를 사용하여 대괄호 안에 새 열 이름을 제공하고 기본값을 지정합니다. 우리의 경우 기본값 'USA'로 '국가' 열을 추가했습니다.

df['Country'] = 'USA'

Pandas 라이브러리 및 관련 기능

Pandas는 특히 데이터 처리, 정리 및 분석 작업에 적합한 강력한 Python 라이브러리입니다. 두 가지 주요 데이터 구조를 제공합니다. 데이터 프레임연속. DataFrame은 레이블이 지정된 축(행 및 열)이 있는 XNUMX차원 표 형식 데이터 구조입니다. 반면 Series는 모든 유형의 데이터를 보유할 수 있는 XNUMX차원 레이블 배열입니다.

DataFrame에서 열 추가, 수정 및 삭제와 관련된 몇 가지 일반적인 Pandas 기능은 다음과 같습니다.

  • 끼워 넣다(): 지정된 위치에 열을 삽입합니다.
  • 떨어지다(): DataFrame에서 열을 제거하려면.
  • 이름 바꾸기(): DataFrame의 열 이름을 바꾸려면.
  • 양수인(): 식의 결과를 기반으로 새 열을 생성합니다.

따라서 Pandas DataFrame에 새 열을 추가하는 것이 간단하고 효율적입니다. 이 문서에서는 기본값으로 새 열을 추가하는 기본 방법을 다루고 관련 단계에 대한 자세한 설명을 제공했습니다. 또한 Pandas를 강력한 데이터 조작 라이브러리로 소개하고 DataFrame 열 관리를 위한 몇 가지 관련 기능에 대해 논의했습니다. 이러한 기술을 마스터하면 Python에서 광범위한 데이터 처리 작업을 처리할 수 있습니다.

관련 게시물:

코멘트 남김