Επιλύθηκε: προσθήκη νέας στήλης στο πλαίσιο δεδομένων pandas

Σε αυτό το άρθρο, θα διερευνήσουμε τη διαδικασία προσθήκης μιας νέας στήλης σε ένα Pandas DataFrame, μια δημοφιλή βιβλιοθήκη στην Python για χειρισμό και ανάλυση δεδομένων. Θα συζητήσουμε τη λύση σε αυτό το πρόβλημα, θα εξετάσουμε βήμα-βήμα τον κώδικα και θα καλύψουμε ορισμένα σχετικά θέματα και λειτουργίες στη βιβλιοθήκη Pandas. Η Pandas είναι μια ευρέως χρησιμοποιούμενη βιβλιοθήκη που διαθέτει δομές και εργαλεία δεδομένων υψηλού επιπέδου, ιδανική για αποτελεσματική ανάλυση δεδομένων και χειρισμό εργασιών.

Αρχικά, ας υποθέσουμε ότι έχουμε ένα σύνολο δεδομένων με τη μορφή Pandas DataFrame και θέλουμε να προσθέσουμε μια νέα στήλη σε αυτό. Αυτή είναι μια κοινή απαίτηση στο στάδιο προετοιμασίας δεδομένων, που συχνά απαιτείται για τη μηχανική χαρακτηριστικών ή για τη δημιουργία πρόσθετων πληροφοριών με βάση τις υπάρχουσες στήλες. Ας δούμε πώς μπορεί να επιτευχθεί αυτό.

Προσθήκη νέας στήλης σε ένα Pandas DataFrame

Θα ξεκινήσουμε εισάγοντας την απαιτούμενη βιβλιοθήκη και δημιουργώντας ένα δείγμα DataFrame.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Τώρα, ας προσθέσουμε μια νέα στήλη "Χώρα" στο DataFrame μας με μια προεπιλεγμένη τιμή, πείτε "ΗΠΑ".

df['Country'] = 'USA'

Αυτή η απλή γραμμή κώδικα θα προσθέσει μια νέα στήλη με το όνομα «Χώρα» στο υπάρχον DataFrame «df» με την τιμή «ΗΠΑ» σε όλες τις σειρές του. Το ενημερωμένο μας DataFrame θα μοιάζει με αυτό:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Εξήγηση κώδικα βήμα προς βήμα

Ας αναλύσουμε τον κώδικα και ας τον κατανοήσουμε βήμα προς βήμα.

1. Αρχικά, εισάγουμε τη βιβλιοθήκη Pandas χρησιμοποιώντας το τυπικό ψευδώνυμο 'pd'. Αυτό μας επιτρέπει να έχουμε πρόσβαση στις συναρτήσεις και τις κλάσεις Pandas χρησιμοποιώντας το πρόθεμα «pd».

import pandas as pd

2. Στη συνέχεια, δημιουργούμε ένα λεξικό «δεδομένα» που περιέχει ορισμένα δείγματα δεδομένων. Κάθε κλειδί στο λεξικό αντιπροσωπεύει ένα όνομα στήλης και η αντίστοιχη τιμή του είναι μια λίστα τιμών για αυτήν τη στήλη.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Στη συνέχεια, μετατρέπουμε αυτό το λεξικό σε αντικείμενο Pandas DataFrame χρησιμοποιώντας τη συνάρτηση `pd.DataFrame()`.

df = pd.DataFrame(data)

4. Τέλος, για να προσθέσουμε μια νέα στήλη, χρησιμοποιούμε απλώς τον τελεστή εκχώρησης "=" με το DataFrame, παρέχοντας το όνομα της νέας στήλης μέσα σε αγκύλες και καθορίζοντας την προεπιλεγμένη τιμή. Στην περίπτωσή μας, προσθέσαμε τη στήλη "Χώρα" με την προεπιλεγμένη τιμή "ΗΠΑ".

df['Country'] = 'USA'

Βιβλιοθήκη Pandas και σχετικές λειτουργίες

Το Pandas είναι μια ισχυρή βιβλιοθήκη Python, ιδιαίτερα κατάλληλη για εργασίες επεξεργασίας δεδομένων, καθαρισμού και ανάλυσης. Παρέχει δύο κύριες δομές δεδομένων: Πλαίσιο δεδομένων και Σειρές. Το DataFrame είναι μια δισδιάστατη δομή δεδομένων σε πίνακα με επισημασμένους άξονες (γραμμές και στήλες). Μια σειρά, από την άλλη πλευρά, είναι ένας μονοδιάστατος πίνακας με ετικέτα που μπορεί να συγκρατεί δεδομένα οποιουδήποτε τύπου.

Μερικές κοινές λειτουργίες του Panda που σχετίζονται με την προσθήκη, τροποποίηση και διαγραφή στηλών σε ένα DataFrame είναι οι εξής:

  • εισάγετε(): Για να εισαγάγετε μια στήλη σε μια καθορισμένη θέση.
  • πτώση(): Για να αφαιρέσετε μια στήλη από το DataFrame.
  • μετονομάζω(): Για να μετονομάσετε μια στήλη DataFrame.
  • αναθέτω(): Για να δημιουργήσετε μια νέα στήλη με βάση το αποτέλεσμα μιας έκφρασης.

Έτσι, η προσθήκη μιας νέας στήλης σε ένα Pandas DataFrame είναι απλή και αποτελεσματική. Σε αυτό το άρθρο, καλύψαμε τη βασική μέθοδο προσθήκης μιας νέας στήλης με προεπιλεγμένη τιμή και παρείχαμε λεπτομερείς επεξηγήσεις για τα σχετικά βήματα. Παρουσιάσαμε επίσης το Pandas ως μια ισχυρή βιβλιοθήκη χειρισμού δεδομένων και συζητήσαμε ορισμένες σχετικές λειτουργίες για τη διαχείριση στηλών DataFrame. Κατακτώντας αυτές τις τεχνικές, θα είστε καλά εξοπλισμένοι για να χειριστείτε ένα ευρύ φάσμα εργασιών επεξεργασίας δεδομένων στην Python.

Σχετικές αναρτήσεις:

Αφήστε ένα σχόλιο