I have a dataframe that looks like this:
<code>df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [2, 3, 4, 5], 'C': [3, 4, 5, 6]})

   A  B  C
0  1  2  3
1  2  3  4
2  3  4  5
3  4  5  6
I want to create a new column D that sums the values in column A if the value in column B is greater than the value in column C. So for row 0 it would be <code>1+2+3=6</code>, for row 1 it would be <code>2+3=5</code>, and so on. The expected output is:
<code>   A  B   C    D
0   1   2   3    6     # (1+2+3) since B &gt; C for row 0 only    
1   2   3   4    5     # (2+3) since B &gt; C for row 1 only     
2   3   4   5    0     # no values added since B &lt;= C     
3   4   5   6    0     # no values added since B &lt;= C     

Detta är en Python-kod som skapar en ny kolumn D i en pandas DataFrame. Den nya kolumnen D innehåller summan av värdena i kolumn A, men bara om värdet i kolumn B är större än värdet i kolumn C.


Sumif är ett Python-bibliotek för att beräkna sammanfattningar av data. Den kan användas för att beräkna summan, medelvärdet, minimum, maximum eller percentil för en lista med värden.

Skapa kolumner

I Python kan du skapa kolumner i en dataram genom att använda funktionen column(). Syntaxen för column() är följande:

kolumn (namn, data)

där namn är namnet på kolumnen och data är den data du vill lägga i den kolumnen.

Arbeta med data och kolumner

I Python kan du arbeta med data i kolumner genom att använda dict()-funktionen. Denna funktion tar som argument en lista med kolumnnamn och returnerar ett ordboksobjekt. Varje nyckel i denna ordbok är ett kolumnnamn och varje värde är ett motsvarande värde från datamängden.

Till exempel, för att skapa ett ordboksobjekt som innehåller värdena från datamängden "data" i kolumnerna "namn" och "ålder", kan du använda följande kod:

data = [ 'namn' , 'ålder' ] dict ( data )

