I have a dataframe that looks like this:
<code>df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [2, 3, 4, 5], 'C': [3, 4, 5, 6]})

   A  B  C
0  1  2  3
1  2  3  4
2  3  4  5
3  4  5  6
I want to create a new column D that sums the values in column A if the value in column B is greater than the value in column C. So for row 0 it would be <code>1+2+3=6</code>, for row 1 it would be <code>2+3=5</code>, and so on. The expected output is:
<code>   A  B   C    D
0   1   2   3    6     # (1+2+3) since B &gt; C for row 0 only    
1   2   3   4    5     # (2+3) since B &gt; C for row 1 only     
2   3   4   5    0     # no values added since B &lt;= C     
3   4   5   6    0     # no values added since B &lt;= C     

זהו קוד Python שיוצר עמודה D חדשה ב-PandaFrame. עמודה D החדשה מכילה את סכום הערכים בעמודה A, אך רק אם הערך בעמודה B גדול מהערך בעמודה C.


Sumif היא ספריית Python לחישוב סיכומים של נתונים. ניתן להשתמש בו כדי לחשב את הסכום, הממוצע, המינימום, המקסימום או האחוזון של רשימת ערכים.

צור עמודות

ב-Python, אתה יכול ליצור עמודות במסגרת נתונים באמצעות הפונקציה column() . התחביר עבור עמודה() הוא כדלקמן:

עמודה (שם, נתונים)

כאשר שם הוא שם העמודה ונתונים הם הנתונים שברצונך לשים בעמודה זו.

עבודה עם נתונים ועמודות

ב-Python, אתה יכול לעבוד עם נתונים בעמודות באמצעות הפונקציה dict() . פונקציה זו לוקחת כארגומנט שלה רשימה של שמות עמודות, ומחזירה אובייקט מילון. כל מפתח במילון זה הוא שם עמודה, וכל ערך הוא ערך מתאים ממערך הנתונים.

לדוגמה, כדי ליצור אובייקט מילון המכיל את הערכים מקבוצת הנתונים "נתונים" בעמודות "שם" ו-"גיל", תוכל להשתמש בקוד הבא:

data = [ 'שם' , 'גיל' ] dict ( נתונים )

