Решено: ажурирање ћелије у листу по имену колоне помоћу панда

У свету анализе података, употреба табела је уобичајена, посебно када се ради са структурираним подацима у колонском формату. Једна од популарних библиотека за рад са подацима у табелама у Питхон-у је Пандас. Ова моћна библиотека омогућава програмерима да са лакоћом читају, манипулишу и извозе табеларне податке. У овом чланку ћемо се фокусирати на конкретан проблем: ажурирање ћелија на листу по имену колоне помоћу Пандас-а. Уронимо у решење, након чега следи објашњење кода корак по корак, и на крају разговарамо о повезаним концептима и функционалности у Пандас-у, као што је рад са индексима и одабир података. Дакле, хајде да почнемо.

Ажурирање ћелија према називу колоне помоћу Панда

Да бисмо ажурирали ћелије на листу према имену колоне, прво морамо да инсталирамо Пандас библиотеку ако већ није инсталирана помоћу следеће команде:

!pip install pandas

Са инсталираним Пандас-ом, хајде да опишемо кораке за ажурирање ћелија у листу према имену колоне:

1. Учитајте лист у објекат ДатаФраме.
2. Приступите ћелијама које желимо да ажурирамо.
3. Измените жељене ћелије додељивањем нових вредности.
4. Сачувајте ДатаФраме објекат назад на листу.

Ево исечка кода који демонстрира решење са једноставним примером:

import pandas as pd

# Load data from a CSV file into a DataFrame object
df = pd.read_csv('your_spreadsheet.csv')

# Access and update the desired cells - let's update column 'Age' by adding 1 to each value
df['Age'] = df['Age'] + 1

# Save the updated DataFrame back to the CSV file
df.to_csv('your_updated_spreadsheet.csv', index=False)

Разумевање Кодекса

Први корак је да увезете Пандас библиотеку под псеудонимом `пд`. Затим морамо да учитамо податке из ЦСВ датотеке у објекат ДатаФраме користећи функцију `пд.реад_цсв()`, наводећи назив улазне датотеке ('иоур_спреадсхеет.цсв').

Сада долази главни део проблема: приступ и ажурирање жељених ћелија. У овом примеру желимо да ажурирамо колону „Старост“ додавањем 1 свакој вредности у колони. Ово радимо једноставним додавањем 1 колони 'Аге', којој се приступа помоћу синтаксе `дф['Аге']`. Овај код ће извршити елементарно додавање 1 свакој ставци у колони „Старост“.

Коначно, ажурирани ДатаФраме чувамо назад у ЦСВ датотеку користећи функцију `дф.то_цсв()` са именом излазне датотеке ('иоур_упдатед_спреадсхеет.цсв'). Параметар `индек=Фалсе` се користи да би се избегло писање бројева редова у излазну датотеку.

Панда индекси и одабир података

Пандас се у великој мери ослања на концепт индекса за одабир и манипулацију подацима. Подразумевано, када учитава податке из датотеке, Пандас додељује а нумерички индекс у сваки ред ДатаФраме-а, почевши од 0. Када радите са подацима у Пандас-у, неопходно је разумети различите начине избор и филтрирање података на основу вредности индекса или назива колона.

На пример, да бисте изабрали одређени ред или редове, можете користити `илоц` индексер, који вам омогућава да приступите редовима на основу њиховог целобројног индекса:

# Select the first row of the DataFrame
first_row = df.iloc[0]

# Select rows 1 to 3 (excluding 3)
rows_1_to_2 = df.iloc[1:3]

Када треба да ажурирате ћелије на основу одређеног услова, као што је ажурирање колоне „Старост“ само за оне редове у којима друга колона (нпр. „Град“) има одређену вредност, можете да користите логичко индексирање:

# Update the 'Age' column by adding 1, only for rows where 'City' is equal to 'New York'
df.loc[df['City'] == 'New York', 'Age'] = df['Age'] + 1

У овом примеру, `лоц` индексер се користи за избор редова на основу логичког услова, а затим се колона 'Аге' ажурира.

Имајте на уму да је ово само врх леденог брега када је у питању рад са подацима у Пандас-у. Библиотека пружа мноштво функција и техника за ефикасну манипулацију, анализу и визуелизацију ваших података. Разумевање основа, као што је ажурирање ћелија у листу према називу колоне, поставља јаку основу за рад са сложенијим структурама података и задацима анализе у будућности.

Релатед постс:

Оставите коментар