Zgjidhur: përditësoni qelizën në fletë sipas emrit të kolonës duke përdorur pandat

Në botën e analizës së të dhënave, përdorimi i spreadsheets është i zakonshëm, veçanërisht kur punoni me të dhëna të strukturuara në një format kolone. Një nga bibliotekat e njohura për të punuar me të dhënat e spreadsheet në Python është Pandas. Kjo bibliotekë e fuqishme i lejon zhvilluesit të lexojnë, manipulojnë dhe eksportojnë me lehtësi të dhënat tabelare. Në këtë artikull, ne do të përqendrohemi në një problem specifik: përditësimin e qelizave në një fletë sipas emrit të kolonës duke përdorur Pandas. Ne do të zhytemi në zgjidhjen, e ndjekur nga një shpjegim hap pas hapi i kodit dhe në fund do të diskutojmë konceptet dhe funksionalitetin e lidhur në Panda, si puna me indekset dhe përzgjedhja e të dhënave. Pra, le të fillojmë.

Përditësimi i qelizave sipas emrit të kolonës duke përdorur panda

Për të përditësuar qelizat në një fletë sipas emrit të kolonës, së pari duhet të instalojmë bibliotekën Pandas nëse nuk është instaluar tashmë duke përdorur komandën e mëposhtme:

!pip install pandas

Me Panda të instaluara, le të përshkruajmë hapat për përditësimin e qelizave në një fletë sipas emrit të kolonës:

1. Ngarkoni fletën në një objekt DataFrame.
2. Hyni në qelizat që duam të përditësojmë.
3. Modifikoni qelizat e dëshiruara duke caktuar vlera të reja.
4. Ruani objektin DataFrame përsëri në fletë.

Këtu është një copë kodi që demonstron zgjidhjen me një shembull të thjeshtë:

import pandas as pd

# Load data from a CSV file into a DataFrame object
df = pd.read_csv('your_spreadsheet.csv')

# Access and update the desired cells - let's update column 'Age' by adding 1 to each value
df['Age'] = df['Age'] + 1

# Save the updated DataFrame back to the CSV file
df.to_csv('your_updated_spreadsheet.csv', index=False)

Kuptimi i Kodit

Hapi i parë është të importoni bibliotekën e Pandas nën pseudonimin `pd`. Më pas, duhet të ngarkojmë të dhënat nga një skedar CSV në një objekt DataFrame duke përdorur funksionin `pd.read_csv()`, duke specifikuar emrin e skedarit hyrës ('your_spreadsheet.csv').

Tani vjen pjesa kryesore e problemit: qasja dhe përditësimi i qelizave të dëshiruara. Në këtë shembull, ne duam të përditësojmë kolonën 'Mosha' duke shtuar 1 në secilën vlerë në kolonë. Ne e bëjmë këtë thjesht duke shtuar 1 në kolonën 'Mosha', e cila aksesohet duke përdorur sintaksën 'df['Mosha']'. Ky kod do të kryejë shtimin e elementeve të 1 për çdo artikull në kolonën "Mosha".

Së fundi, ne e ruajmë DataFrame-in e përditësuar përsëri në skedarin CSV duke përdorur funksionin `df.to_csv()` me emrin e skedarit dalës ('your_updated_spreadsheet.csv'). Parametri `index=False` përdoret për të shmangur shkrimin e numrave të rreshtave në skedarin dalës.

Indekset e pandave dhe zgjedhja e të dhënave

Pandat mbështeten shumë në konceptin e indekseve për zgjedhjen dhe manipulimin e të dhënave. Si parazgjedhje, kur ngarkon të dhënat nga një skedar, Pandas cakton një indeksi numerik në çdo rresht të DataFrame, duke filluar nga 0. Kur punoni me të dhëna në Panda, është thelbësore të kuptoni mënyrat e ndryshme të përzgjedhjen dhe filtrimin e të dhënave bazuar në vlerat e indeksit ose emrat e kolonave.

Për shembull, për të zgjedhur një rresht ose rreshta të veçantë, mund të përdorni indeksuesin `iloc`, i cili ju lejon të aksesoni rreshtat bazuar në indeksin e tyre të numrit të plotë:

# Select the first row of the DataFrame
first_row = df.iloc[0]

# Select rows 1 to 3 (excluding 3)
rows_1_to_2 = df.iloc[1:3]

Kur ju duhet të përditësoni qelizat bazuar në një kusht specifik, si p.sh. përditësimi i kolonës "Mosha" vetëm për ato rreshta ku një kolonë tjetër (p.sh. "Qyteti") ka një vlerë të caktuar, mund të përdorni indeksimin boolean:

# Update the 'Age' column by adding 1, only for rows where 'City' is equal to 'New York'
df.loc[df['City'] == 'New York', 'Age'] = df['Age'] + 1

Në këtë shembull, indeksuesi `loc` përdoret për të zgjedhur rreshtat bazuar në një kusht boolean, dhe më pas kolona 'Mosha' përditësohet.

Mbani në mend se kjo është vetëm maja e ajsbergut kur bëhet fjalë për të punuar me të dhënat në Panda. Biblioteka ofron një bollëk funksionesh dhe teknikash për të manipuluar, analizuar dhe vizualizuar të dhënat tuaja në mënyrë efikase. Kuptimi i bazave, të tilla si përditësimi i qelizave në një fletë sipas emrit të kolonës, vendos një bazë të fortë për të punuar me strukturat më komplekse të të dhënave dhe detyrat e analizës në të ardhmen.

Mesazhe të ngjashme:

Lini një koment