נפתרה: הוסף מספר עמודות ל-dataframe אם אין פנדות קיימות

Pandas היא ספריית Python בקוד פתוח המספקת מבני נתונים בעלי ביצועים גבוהים וקלים לשימוש וכלים לניתוח נתונים. זה הפך לבחירה מומלצת עבור מפתחים ומדעני נתונים בכל הנוגע למניפולציה וניתוח נתונים. אחת התכונות החזקות שמספקת Pandas היא יצירה ושינוי של מסגרות נתונים. במאמר זה, נחקור את התהליך של הוספת עמודות מרובות למסגרת נתונים אם הן אינן קיימות, באמצעות ספריית פנדות. נעבור על הסבר שלב אחר שלב על הקוד וצלול לפונקציות קשורות, ספריות ובעיות שאתה עלול להיתקל בהן בדרך.

עבודה עם מסגרות נתונים היא חיונית בעת טיפול בנתונים, ולעתים קרובות אתה עלול למצוא את עצמך במצב שבו אתה צריך להוסיף מספר עמודות בבת אחת למסגרת נתונים. זה יכול להיות מסובך, אבל ספריית Pandas הופכת את המשימה הזו לחלקה ויעילה. ראשית, נתחיל בייבוא ​​ספריית Pandas:

import pandas as pd

הוספת עמודות מרובות ל-Pandas Dataframe

כדי להוסיף מספר עמודות ל-dataframe, אנו יכולים להשתמש בשיטת DataFrame.assign() . שיטה זו מאפשרת לנו להוסיף עמודה אחת או כמה ל-dataframe בבת אחת. בואו ניצור מסגרת נתונים לדוגמה ולאחר מכן נוסיף לה עמודות מרובות אם הן עדיין לא קיימות:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

ב קטע קוד למעלה, אנו יוצרים תחילה מסגרת נתונים לדוגמה עם שתי עמודות, 'עמודה1' ו'עמודה2'. לאחר מכן אנו יוצרים רשימה של עמודות חדשות, 'עמודה 3' ו'עמודה 4', שאנו רוצים להוסיף למסגרת הנתונים. לבסוף, אנו עוברים על רשימת העמודות ומוסיפים עמודה חדשה אם היא עדיין לא קיימת ב-dataframe.

הסבר שלב אחר שלב

הנה שלב אחר שלב הסבר על כל חלק של הפתרון שלנו:

1. אנו מתחילים בייבוא ​​ספריית Pandas באמצעות "ייבוא ​​פנדות כ-pd".
2. לאחר מכן, אנו יוצרים מסגרת נתונים לדוגמה בשם 'df' עם שתי עמודות: 'column1' ו-'column2'.
3. אנו יוצרים רשימה של עמודות חדשות שאנו רוצים להוסיף ל-dataframe – 'עמודה3' ו'עמודה4'.
4. אנו משתמשים בלולאת for כדי לחזור על רשימת העמודות החדשות.
5. בתוך הלולאה, אנו בודקים אם העמודה החדשה כבר קיימת ב-dataframe באמצעות התנאי 'לא נמצא'. אם העמודה החדשה לא קיימת, נוסיף את העמודה החדשה למסגרת הנתונים עם ערך ברירת המחדל של None.

פונקציות וספריות של פנדה

Pandas מציעה מגוון עצום של פונקציות ושיטות המפשטות את הטיפול והמניפולציה של מסגרות נתונים. בפתרון שלנו, השתמשנו במרכיבי המפתח הבאים:

  • DataFrame - בתור מבנה הנתונים העיקרי בפנדות, DataFrame הוא נתונים טבלאי דו-מימדי, שניתן לשינוי, הטרוגניים בפוטנציה עם צירים מסומנים (שורות ועמודות)
  • DataFrame.columns – תכונה זו מחזירה את תוויות העמודות של ה-DataFrame, ומאפשרת לנו לגשת ולוודא אם קיימת עמודה או לא.
  • pd.DataFrame() - זוהי פונקציית הבנאי ליצור מסגרת נתונים חדשה. זה מאפשר לך להגדיר את הנתונים ושמות העמודות במהלך היצירה.

עכשיו שיש לך הבנה טובה יותר כיצד לעשות זאת הוסף מספר עמודות ל-Pandas dataframe, טכניקה זו תעזור לך לנהל ולתפעל נתונים ביעילות. זכור ש-Pandas מציעה תכונות רבות ועוצמתיות אחרות לניתוח נתונים ומניפולציה, אז הקפד לחקור אותם גם כדי להפוך למפתח Python יעיל יותר.

הודעות קשורות:

השאירו תגובה