해결됨: 날짜를 생략하는 방법 pandas datetime

패션과 프로그래밍은 완전히 다른 두 세계처럼 보일 수 있지만 데이터 분석과 트렌드 예측에 관해서는 아름답게 결합할 수 있습니다. 이 기사에서는 패션 산업의 데이터 분석에 대한 일반적인 문제인 pandas datetime 데이터에서 특정 날짜를 생략하는 문제를 살펴봅니다. 이는 패턴, 추세 및 판매 데이터를 분석할 때 특히 유용할 수 있습니다. 코드를 단계별로 설명하고 목표를 달성하는 데 도움이 되는 다양한 라이브러리와 기능에 대해 논의할 것입니다.

패션의 판다와 데이트타임

Pandas는 주로 데이터 분석 및 조작에 사용되는 인기 있는 Python 라이브러리입니다. 패션계에서는 방대한 양의 데이터를 선별하여 트렌드를 파악하고 고객 선호도를 분석하며 미래의 패턴을 예측하는 데 사용할 수 있습니다. Pandas는 datetime 기능을 지원하므로 날짜와 시간을 쉽게 사용할 수 있습니다.

많은 경우 데이터 세트에서 특정 날짜 또는 날짜 범위를 생략해야 합니다. 예를 들어 블랙 프라이데이 또는 사이버 먼데이와 같은 중요한 판매일에 집중하기 위해 주말이나 공휴일을 제외할 수 있습니다.

문제 이해

CSV 형식의 일일 판매 데이터가 포함된 데이터 세트가 있고 주말을 제외하고 정보를 분석하려고 한다고 가정해 보겠습니다. 이를 달성하기 위해 다음과 같이 시작할 것입니다. pandas를 사용하여 데이터 세트를 가져온 다음 데이터를 조작하여 주말을 제거합니다.

다음은 단계별 절차입니다.

1. 필요한 라이브러리를 가져옵니다.
2. 데이터세트를 로드합니다.
3. 날짜 열을 날짜/시간 형식으로 변환합니다(해당 형식이 아닌 경우).
4. 주말을 제외하도록 데이터 프레임을 필터링합니다.
5. 필터링된 데이터를 분석합니다.

참고 : 이 방법은 날짜가 별도의 열에 저장되어 있는 모든 데이터 세트에 적용할 수 있습니다.

# Step 1: Import the necessary libraries
import pandas as pd
from pandas.tseries.offsets import BDay

# Step 2: Load the dataset
data = pd.read_csv('sales_data.csv')

# Step 3: Convert the date column to datetime format
data['date'] = pd.to_datetime(data['date'])

# Step 4: Filter the dataframe to exclude weekends
filtered_data = data[data['date'].dt.dayofweek < 5]

# Step 5: Analyze the filtered data
print(filtered_data.head())

코드 해석

위의 코드 블록에서 pandas.tseries.offsets에서 pandas 및 BDay(영업일)라는 두 가지 필수 라이브러리를 가져오는 것으로 시작합니다. pandas 함수를 사용하여 데이터 세트를 로드합니다. read_csv, 날짜 열이 날짜/시간 형식인지 확인합니다.

최대 XNUMXW 출력을 제공하는 dt.dayofweek 속성은 요일을 정수로 반환합니다(월요일: 0, 일요일: 6). 주말을 필터링하기 위해 dayofweek 값이 5보다 작은 행만 유지합니다.

마지막으로 처음 몇 행을 인쇄하여 필터링된 데이터를 분석합니다. 머리() 기능.

추가 기능 및 라이브러리

이 방법은 다른 필터링 기준을 포함하거나 다른 날짜 범위로 작업하도록 추가로 확장될 수 있습니다. 이 프로세스를 지원할 수 있는 몇 가지 유용한 라이브러리 및 기능은 다음과 같습니다.

  • 넘파이: 효율적인 배열 조작 및 수학 연산에 사용할 수 있는 Python의 수치 컴퓨팅용 라이브러리입니다.
  • 날짜 시간: 날짜와 시간을 쉽게 다루는 데 도움이 되는 Python 표준 라이브러리의 모듈입니다.
  • 날짜 범위: 영업일, 주 또는 월과 같은 다양한 빈도 설정에 따라 날짜 범위를 생성할 수 있는 pandas 내의 기능입니다.

이러한 도구와 기술을 pandas 및 datetime 조작과 함께 활용하면 트렌드 식별, 고객 선호도 및 판매 실적과 같은 패션 산업의 특정 요구 사항을 충족하는 강력한 데이터 분석 워크플로를 생성할 수 있습니다.

관련 게시물:

코멘트 남김