Išspręsta: atnaujinkite lapo langelį pagal stulpelio pavadinimą, naudodami pandas

Duomenų analizės pasaulyje įprasta naudoti skaičiuokles, ypač dirbant su struktūriniais duomenimis stulpelių formatu. Viena iš populiariausių bibliotekų, skirtų darbui su skaičiuoklės duomenimis Python, yra Pandas. Ši galinga biblioteka leidžia kūrėjams lengvai skaityti, valdyti ir eksportuoti lentelės duomenis. Šiame straipsnyje mes sutelksime dėmesį į konkrečią problemą: lapo langelių atnaujinimą pagal stulpelio pavadinimą naudojant Pandas. Pasinersime į sprendimą, po to žingsnis po žingsnio paaiškinsime kodą ir galiausiai aptarsime susijusias Pandas sąvokas ir funkcijas, pvz., darbą su indeksais ir duomenų pasirinkimą. Taigi, pradėkime.

Ląstelių atnaujinimas pagal stulpelio pavadinimą naudojant Pandas

Norėdami atnaujinti lapo langelius pagal stulpelio pavadinimą, pirmiausia turime įdiegti Pandas biblioteką, jei ji dar neįdiegta, naudodami šią komandą:

!pip install pandas

Įdiegę Pandas, apibūdinkime veiksmus, kaip atnaujinti lapo langelius pagal stulpelio pavadinimą:

1. Įkelkite lapą į DataFrame objektą.
2. Pasiekite langelius, kuriuos norime atnaujinti.
3. Modifikuokite norimus langelius priskirdami naujas reikšmes.
4. Išsaugokite DataFrame objektą atgal į lapą.

Štai kodo fragmentas, kuriame paprastas pavyzdys parodo sprendimą:

import pandas as pd

# Load data from a CSV file into a DataFrame object
df = pd.read_csv('your_spreadsheet.csv')

# Access and update the desired cells - let's update column 'Age' by adding 1 to each value
df['Age'] = df['Age'] + 1

# Save the updated DataFrame back to the CSV file
df.to_csv('your_updated_spreadsheet.csv', index=False)

Kodekso supratimas

Pirmiausia reikia importuoti Pandas biblioteką slapyvardžiu „pd“. Tada turime įkelti duomenis iš CSV failo į „DataFrame“ objektą naudodami funkciją „pd.read_csv()“, nurodydami įvesties failo pavadinimą („your_spreadsheet.csv“).

Dabar ateina pagrindinė problemos dalis: prieiga prie norimų langelių ir jų atnaujinimas. Šiame pavyzdyje norime atnaujinti stulpelį „Amžius“ prie kiekvienos stulpelio reikšmės pridėdami 1. Tai darome tiesiog įtraukdami 1 į stulpelį „Age“, kuris pasiekiamas naudojant sintaksę „df['Age']“. Šis kodas pagal elementą pridės 1 prie kiekvieno elemento stulpelyje „Amžius“.

Galiausiai išsaugome atnaujintą „DataFrame“ atgal į CSV failą naudodami funkciją „df.to_csv()“ su išvesties failo pavadinimu („your_updated_spreadsheet.csv“). Parametras „index=False“ naudojamas siekiant išvengti eilučių numerių įrašymo į išvesties failą.

Pandų indeksai ir duomenų pasirinkimas

Pandos labai remiasi indeksų koncepcija, kad pasirinktų ir tvarkytų duomenis. Pagal numatytuosius nustatymus, įkeliant duomenis iš failo, Pandas priskiria a skaitmeninis indeksas į kiekvieną DataFrame eilutę, pradedant nuo 0. Dirbant su duomenimis Pandas, labai svarbu suprasti skirtingus būdus duomenų parinkimas ir filtravimas remiantis indekso reikšmėmis arba stulpelių pavadinimais.

Pavyzdžiui, norėdami pasirinkti konkrečią eilutę ar eilutes, galite naudoti indeksavimo priemonę „iloc“, kuri leidžia pasiekti eilutes pagal jų sveikojo skaičiaus indeksą:

# Select the first row of the DataFrame
first_row = df.iloc[0]

# Select rows 1 to 3 (excluding 3)
rows_1_to_2 = df.iloc[1:3]

Kai reikia atnaujinti langelius pagal konkrečią sąlygą, pvz., atnaujinti stulpelį „Amžius“ tik tose eilutėse, kuriose kitas stulpelis (pvz., „Miestas“) turi tam tikrą reikšmę, galite naudoti loginį indeksavimą:

# Update the 'Age' column by adding 1, only for rows where 'City' is equal to 'New York'
df.loc[df['City'] == 'New York', 'Age'] = df['Age'] + 1

Šiame pavyzdyje indeksavimo priemonė „loc“ naudojama eilutėms pasirinkti pagal loginę sąlygą, tada atnaujinamas stulpelis „Amžius“.

Atminkite, kad tai tik ledkalnio viršūnė, kai kalbama apie darbą su duomenimis „Panda“. Bibliotekoje yra daugybė funkcijų ir metodų, leidžiančių efektyviai valdyti, analizuoti ir vizualizuoti duomenis. Supratimas apie pagrindinius dalykus, pvz., lapo langelių atnaujinimas pagal stulpelio pavadinimą, sukuria tvirtą pagrindą dirbti su sudėtingesnėmis duomenų struktūromis ir analizės užduotimis ateityje.

Susijusios naujienos:

Palikite komentarą