Diselesaikan: cara menghilangkan hari pandas datetime

Fashion dan pemrograman mungkin tampak seperti dua dunia yang sama sekali berbeda, tetapi jika menyangkut analisis data dan peramalan tren, keduanya dapat digabungkan dengan indah. Pada artikel ini, kita akan mengeksplorasi masalah umum untuk analisis data di industri fashion: menghilangkan hari-hari tertentu dari data waktu panda. Ini bisa sangat berguna saat menganalisis pola, tren, dan data penjualan. Kami akan melalui penjelasan kode langkah demi langkah, dan mendiskusikan berbagai pustaka dan fungsi yang akan membantu kami mencapai tujuan kami.

Panda dan Datetime dalam Mode

Pandas adalah pustaka Python populer yang terutama digunakan untuk analisis dan manipulasi data. Dalam dunia mode, ini dapat digunakan untuk menyaring sejumlah besar data untuk mengidentifikasi tren, menganalisis preferensi pelanggan, dan memprediksi pola masa depan. Panda mendukung fungsi datetime, memungkinkan kita bekerja dengan tanggal dan waktu dengan mudah.

Dalam banyak kasus, hari atau rentang hari tertentu perlu dihilangkan dari kumpulan data kami. Misalnya, kami mungkin ingin mengecualikan akhir pekan atau hari libur untuk berfokus pada hari obral penting, seperti Black Friday atau Cyber ​​Monday.

Memahami Masalah

Katakanlah kita memiliki kumpulan data yang berisi data penjualan harian dalam format CSV, dan kita ingin menganalisis informasinya sambil mengecualikan akhir pekan. Untuk mencapai ini, kita akan mulai dengan mengimpor dataset menggunakan panda, lalu kami akan memanipulasi data untuk menghapus akhir pekan.

Berikut proses langkah demi langkah:

1. Impor pustaka yang diperlukan.
2. Muat kumpulan data.
3. Ubah kolom tanggal menjadi format datetime (jika belum ada dalam format tersebut).
4. Filter kerangka data untuk mengecualikan akhir pekan.
5. Analisis data yang difilter.

Catatan: Metode ini dapat diterapkan pada kumpulan data apa pun yang tanggalnya disimpan dalam kolom terpisah.

# Step 1: Import the necessary libraries
import pandas as pd
from pandas.tseries.offsets import BDay

# Step 2: Load the dataset
data = pd.read_csv('sales_data.csv')

# Step 3: Convert the date column to datetime format
data['date'] = pd.to_datetime(data['date'])

# Step 4: Filter the dataframe to exclude weekends
filtered_data = data[data['date'].dt.dayofweek < 5]

# Step 5: Analyze the filtered data
print(filtered_data.head())

Menafsirkan Kode

Pada blok kode di atas, kita mulai dengan mengimpor dua pustaka penting: panda dan BDay (hari kerja) dari pandas.tseries.offsets. Kami memuat dataset menggunakan fungsi pandas baca_csv, dan pastikan kolom tanggal dalam format datetime.

Grafik dt.hari minggu atribut mengembalikan hari dalam seminggu sebagai bilangan bulat (Senin: 0, Minggu: 6). Untuk memfilter akhir pekan, kami hanya menyimpan baris dengan nilai hari dalam seminggu kurang dari 5.

Terakhir, kami menganalisis data yang difilter dengan mencetak beberapa baris pertama menggunakan kepala() fungsi.

Fungsi dan Pustaka Tambahan

Metode ini dapat diperluas lebih lanjut untuk menyertakan kriteria pemfilteran lain atau bekerja dengan rentang tanggal yang berbeda. Beberapa pustaka dan fungsi berguna yang dapat mendukung proses ini meliputi:

  • Jumlah: Pustaka untuk komputasi numerik dengan Python, yang dapat digunakan untuk manipulasi larik yang efisien dan operasi matematika.
  • Tanggal Waktu: Sebuah modul di pustaka standar Python yang membantu kita bekerja dengan tanggal dan waktu dengan mudah.
  • rentang_tanggal: Fungsi di dalam panda yang memungkinkan kita membuat rentang tanggal sesuai dengan pengaturan frekuensi yang berbeda, seperti hari kerja, minggu, atau bulan.

Dengan memanfaatkan alat dan teknik ini bersama dengan panda dan manipulasi waktu, Anda dapat membuat alur kerja analisis data yang kuat yang memenuhi kebutuhan khusus industri mode, seperti mengidentifikasi tren, preferensi pelanggan, dan kinerja penjualan.

Pos terkait:

Tinggalkan Komentar