Λύθηκε: πώς να παραλείψετε ημέρες pandas datetime

Η μόδα και ο προγραμματισμός μπορεί να φαίνονται σαν δύο εντελώς διαφορετικοί κόσμοι, αλλά όσον αφορά την ανάλυση δεδομένων και την πρόβλεψη των τάσεων, μπορούν να συνδυαστούν όμορφα. Σε αυτό το άρθρο, θα διερευνήσουμε ένα κοινό πρόβλημα για την ανάλυση δεδομένων στη βιομηχανία της μόδας: την παράλειψη συγκεκριμένων ημερών από τα δεδομένα ημερομηνίας των πάντα. Αυτό μπορεί να είναι ιδιαίτερα χρήσιμο όταν αναλύονται μοτίβα, τάσεις και δεδομένα πωλήσεων. Θα προχωρήσουμε σε μια βήμα προς βήμα επεξήγηση του κώδικα και θα συζητήσουμε διάφορες βιβλιοθήκες και λειτουργίες που θα μας βοηθήσουν να πετύχουμε τον στόχο μας.

Pandas και Datetime στη μόδα

Το Pandas είναι μια δημοφιλής βιβλιοθήκη Python που χρησιμοποιείται κυρίως για ανάλυση και χειρισμό δεδομένων. Στον κόσμο της μόδας, μπορεί να χρησιμοποιηθεί για την αναζήτηση τεράστιων ποσοτήτων δεδομένων για τον εντοπισμό τάσεων, την ανάλυση των προτιμήσεων των πελατών και την πρόβλεψη μελλοντικών προτύπων. Το Pandas υποστηρίζει τη λειτουργία ημερομηνίας, επιτρέποντάς μας να εργαζόμαστε με ημερομηνίες και ώρες χωρίς κόπο.

Σε πολλές περιπτώσεις, είναι απαραίτητο να παραλείψουμε συγκεκριμένες ημέρες ή εύρος ημερών από το σύνολο δεδομένων μας. Για παράδειγμα, μπορεί να θέλουμε να εξαιρέσουμε τα Σαββατοκύριακα ή τις αργίες για να εστιάσουμε σε σημαντικές ημέρες εκπτώσεων, όπως η Black Friday ή η Cyber ​​Monday.

Κατανόηση του Προβλήματος

Ας υποθέσουμε ότι έχουμε ένα σύνολο δεδομένων που περιέχει δεδομένα ημερήσιων πωλήσεων σε μορφή CSV και θέλουμε να αναλύσουμε τις πληροφορίες εξαιρουμένων των Σαββατοκύριακων. Για να το πετύχουμε αυτό, θα ξεκινήσουμε εισάγοντας το σύνολο δεδομένων χρησιμοποιώντας panda και, στη συνέχεια, θα χειριστούμε τα δεδομένα για να αφαιρέσουμε τα Σαββατοκύριακα.

Ακολουθεί η διαδικασία βήμα προς βήμα:

1. Εισαγάγετε τις απαραίτητες βιβλιοθήκες.
2. Φορτώστε το σύνολο δεδομένων.
3. Μετατρέψτε τη στήλη ημερομηνίας σε μορφή ημερομηνίας ώρας (αν δεν είναι ήδη σε αυτήν τη μορφή).
4. Φιλτράρετε το πλαίσιο δεδομένων για να εξαιρέσετε τα Σαββατοκύριακα.
5. Αναλύστε τα φιλτραρισμένα δεδομένα.

Σημείωση: Αυτή η μέθοδος μπορεί να εφαρμοστεί σε οποιοδήποτε σύνολο δεδομένων όπου η ημερομηνία αποθηκεύεται σε ξεχωριστή στήλη.

# Step 1: Import the necessary libraries
import pandas as pd
from pandas.tseries.offsets import BDay

# Step 2: Load the dataset
data = pd.read_csv('sales_data.csv')

# Step 3: Convert the date column to datetime format
data['date'] = pd.to_datetime(data['date'])

# Step 4: Filter the dataframe to exclude weekends
filtered_data = data[data['date'].dt.dayofweek < 5]

# Step 5: Analyze the filtered data
print(filtered_data.head())

Ερμηνεία του Κώδικα

Στο παραπάνω μπλοκ κώδικα, ξεκινάμε εισάγοντας δύο βασικές βιβλιοθήκες: pandas και BDay (εργάσιμη ημέρα) από το pandas.tseries.offsets. Φορτώνουμε το σύνολο δεδομένων χρησιμοποιώντας τη συνάρτηση pandas read_csv, και βεβαιωθείτε ότι η στήλη ημερομηνία είναι σε μορφή ημερομηνίας ώρας.

Η dt.ημέρα της εβδομάδας Το χαρακτηριστικό επιστρέφει την ημέρα της εβδομάδας ως ακέραιο αριθμό (Δευτέρα: 0, Κυριακή: 6). Για να φιλτράρουμε τα Σαββατοκύριακα, διατηρούμε μόνο σειρές με τιμή ημέρας εβδομάδας μικρότερη από 5.

Τέλος, αναλύουμε τα φιλτραρισμένα δεδομένα εκτυπώνοντας τις πρώτες σειρές χρησιμοποιώντας το κεφάλι() λειτουργία.

Πρόσθετες Λειτουργίες και Βιβλιοθήκες

Αυτή η μέθοδος μπορεί να επεκταθεί περαιτέρω για να συμπεριλάβει άλλα κριτήρια φιλτραρίσματος ή να λειτουργήσει με διαφορετικά εύρη ημερομηνιών. Μερικές χρήσιμες βιβλιοθήκες και λειτουργίες που μπορούν να υποστηρίξουν αυτήν τη διαδικασία περιλαμβάνουν:

  • numPy: Μια βιβλιοθήκη για αριθμητικούς υπολογισμούς σε Python, η οποία μπορεί να χρησιμοποιηθεί για αποτελεσματικό χειρισμό πινάκων και μαθηματικές πράξεις.
  • Ημερομηνία ώρα: Μια ενότητα στην τυπική βιβλιοθήκη της Python που μας βοηθά να εργαζόμαστε εύκολα με ημερομηνίες και ώρες.
  • εύρος ημερομηνιών: Μια λειτουργία μέσα στα πάντα που μας επιτρέπει να δημιουργήσουμε μια σειρά ημερομηνιών σύμφωνα με διαφορετικές ρυθμίσεις συχνότητας, όπως εργάσιμες ημέρες, εβδομάδες ή μήνες.

Αξιοποιώντας αυτά τα εργαλεία και τις τεχνικές σε συνδυασμό με τα πάντα και τη χειραγώγηση ώρας ημερομηνίας, μπορείτε να δημιουργήσετε ισχυρές ροές εργασίας ανάλυσης δεδομένων που καλύπτουν τις συγκεκριμένες ανάγκες της βιομηχανίας της μόδας, όπως ο εντοπισμός τάσεων, προτιμήσεων πελατών και απόδοσης πωλήσεων.

Σχετικές αναρτήσεις:

Αφήστε ένα σχόλιο