I have a dataframe that looks like this:
<code>df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [2, 3, 4, 5], 'C': [3, 4, 5, 6]})

   A  B  C
0  1  2  3
1  2  3  4
2  3  4  5
3  4  5  6
I want to create a new column D that sums the values in column A if the value in column B is greater than the value in column C. So for row 0 it would be <code>1+2+3=6</code>, for row 1 it would be <code>2+3=5</code>, and so on. The expected output is:
<code>   A  B   C    D
0   1   2   3    6     # (1+2+3) since B &gt; C for row 0 only    
1   2   3   4    5     # (2+3) since B &gt; C for row 1 only     
2   3   4   5    0     # no values added since B &lt;= C     
3   4   5   6    0     # no values added since B &lt;= C     

Това е код на Python, който създава нова колона D в pandas DataFrame. Новата колона D съдържа сумата от стойностите в колона A, но само ако стойността в колона B е по-голяма от стойността в колона C.


Sumif е библиотека на Python за изчисляване на обобщени данни. Може да се използва за изчисляване на сумата, средната стойност, минимума, максимума или процентила на списък от стойности.

Създайте колони

В Python можете да създавате колони в рамка с данни, като използвате функцията column(). Синтаксисът за column() е както следва:

колона (име, данни)

където име е името на колоната, а данните са данните, които искате да поставите в тази колона.

Работа с данни и колони

В Python можете да работите с данни в колони, като използвате функцията dict(). Тази функция приема като аргумент списък с имена на колони и връща обект от речник. Всеки ключ в този речник е име на колона и всяка стойност е съответстваща стойност от набора от данни.

Например, за да създадете обект на речник, който съдържа стойностите от набора данни „данни“ в колони „име“ и „възраст“, ​​можете да използвате следния код:

данни = [ 'име', 'възраст'] dict (данни)

