Решено: добавете няколко колони към рамката с данни, ако не съществуват панди

Pandas е библиотека на Python с отворен код, която предоставя високопроизводителни, лесни за използване структури от данни и инструменти за анализ на данни. Той се превърна в предпочитан избор за разработчици и специалисти по данни, когато става въпрос за манипулиране и анализ на данни. Една от мощните функции, предоставени от Pandas, е създаването и модифицирането на кадри с данни. В тази статия ще проучим процеса на добавяне на множество колони към рамка с данни, ако те не съществуват, с помощта на библиотека pandas. Ще преминем през стъпка по стъпка обяснение на кода и ще се потопим в свързани функции, библиотеки и проблеми, които може да срещнете по пътя.

Работата с рамки за данни е от решаващо значение при работа с данни и често може да се окажете в ситуация, в която трябва да добавите няколко колони наведнъж към рамка с данни. Това може да е трудно, но библиотеката Pandas прави тази задача гладка и ефективна. Първо, нека започнем с импортиране на библиотеката Pandas:

import pandas as pd

Добавяне на множество колони към Pandas Dataframe

За да добавим няколко колони към рамка с данни, можем да използваме метода DataFrame.assign(). Този метод ни позволява да добавим една или няколко колони към рамката с данни наведнъж. Нека създадем примерна рамка с данни и след това да добавим няколко колони към нея, ако все още не съществуват:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

в кодов фрагмент по-горе, първо създаваме примерна рамка с данни с две колони, „колона1“ и „колона2“. След това създаваме списък с нови колони, „column3“ и „column4“, които искаме да добавим към рамката с данни. Накрая преминаваме през списъка с колони и добавяме нова колона, ако вече не съществува в рамката с данни.

Обяснение стъпка по стъпка

Ето стъпка по стъпка обяснение на всяка част на нашето решение:

1. Започваме с импортиране на библиотеката на Pandas, използвайки „import pandas as pd“.
2. След това създаваме примерен кадър с данни, наречен "df" с две колони: "column1" и "column2".
3. Създаваме списък с нови колони, които искаме да добавим към рамката с данни – 'column3' и 'column4'.
4. Използваме for цикъл, за да преминем през списъка с нови колони.
5. В рамките на цикъла проверяваме дали новата колона вече съществува в рамката с данни, като използваме условието „не е в“. Ако новата колона не съществува, добавяме новата колона към рамката с данни със стойност по подразбиране None.

Функции и библиотеки на Pandas

Pandas предлага широк набор от функции и методи, които опростяват обработката и манипулирането на рамки с данни. В нашето решение използвахме следните ключови компоненти:

  • DataFrame – Като основна структура от данни в pandas, DataFrame е двуизмерна, променлива, потенциално разнородна таблична информация с обозначени оси (редове и колони)
  • DataFrame.columns – Този атрибут връща етикетите на колоните на DataFrame, което ни позволява да осъществим достъп и да проверим дали дадена колона съществува или не.
  • pd.DataFrame() – Това е функцията на конструктора за създаване на нов кадър с данни. Позволява ви да дефинирате данните и имената на колоните по време на създаването.

Сега, когато разбирате по-добре как да добавяне на няколко колони към рамка с данни на Pandas, тази техника ще ви помогне ефективно да управлявате и манипулирате данни. Не забравяйте, че Pandas предлага множество други мощни функции за анализ и манипулиране на данни, така че не забравяйте да ги проучите, за да станете по-ефективен разработчик на Python.

Подобни публикации:

Оставете коментар