Išspręsta: naudokite dict, kad pakeistumėte trūkstamas reikšmes pandos

Duomenų manipuliavimo ir analizės pasaulyje trūkstamų verčių tvarkymas yra esminė užduotis. Pandas, plačiai naudojama Python biblioteka, leidžia efektyviai valdyti trūkstamus duomenis. Vienas įprastas būdas spręsti trūkstamas vertes yra naudoti žodynus šioms reikšmėms nustatyti ir pakeisti. Šiame straipsnyje aptarsime, kaip panaudoti Pandas ir Python galią, norint naudoti žodynus trūkstamoms duomenų rinkinio reikšmėms pakeisti.

Sprendimas

Pagrindinis sprendimas, kurį išnagrinėsime, yra naudoti fillna () funkcija kartu su žodynais. Šis metodas leis mums pakeisti trūkstamas reikšmes atitinkamomis reikšmėmis iš nurodyto žodyno.

Žingsnis po žingsnio kodo paaiškinimas

Norėdami iliustruoti šį procesą, tarkime, kad turime duomenų rinkinį, kuriame yra informacijos apie įvairius mados stilius, įskaitant drabužius, spalvas ir istorinį kontekstą. Kai kuriais atvejais šiame duomenų rinkinyje gali trūkti reikšmių.

Pirmiausia importuokite reikiamas bibliotekas ir sukurkite pavyzdį „DataFrame“:

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

Dabar, kai turime „DataFrame“, iliustruojančią problemą, pastebėkite, kad trūksta kai kurių reikšmių (žymima None). Norėdami pakeisti šias reikšmes, sukurkite žodynus su atitinkamais atvaizdais:

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

Galiausiai naudokite fillna () funkcija, skirta pakeisti trūkstamas reikšmes naudojant kombinuotą žodyną:

df_filled = df.fillna(replacement_dict)

Pandų bibliotekos supratimas

Pandas yra universali Python biblioteka, skirta duomenų apdorojimui ir analizei. Ji siūlo lanksčias ir galingas duomenų struktūras, tokias kaip Series ir DataFrame. Šios struktūros yra būtinos norint efektyviai dirbti su struktūriniais, lentelės duomenimis.

Pandos suteikia gausų funkcijų rinkinį, pvz fillna (), naudojamas trūkstamiems duomenims tvarkyti. Su Pandas galima sklandžiai atlikti ir kitas operacijas, tokias kaip duomenų sujungimas, pasukami duomenys ir laiko eilučių analizė.

Trūkstamų duomenų tvarkymo funkcijos

Be to, fillna () funkcija, Pandas siūlo keletą kitų funkcijų ir metodų, skirtų tvarkyti trūkstamus duomenis, pavyzdžiui:

  • dropna (): pašalinkite eilutes arba stulpelius, kuriuose trūksta duomenų.
  • isna (): nustatykite, kurių DataFrame arba Series elementų trūksta arba kurių nėra.
  • notna (): nustatykite, kurių „DataFrame“ ar „Series“ elementų netrūksta arba kurių nėra.
  • interpoliuoti (): užpildykite trūkstamas reikšmes naudodami tiesinę interpoliaciją.

Šie metodai kartu su fillna (), pateikia išsamų įrankių rinkinį trūkstamiems duomenims tvarkyti įvairiuose kontekstuose.

Apibendrinant, šis straipsnis parodė, kaip naudoti diktuoti pakeisti trūkstamas reikšmes Pandas DataFrame. Pagrindinė mūsų naudojama funkcija, fillna (), yra galingas Pandas bibliotekos įrankis, leidžiantis efektyviai tvarkyti trūkstamus duomenis. Naudodami žodynus galime susieti trūkstamas reikšmes su atitinkamais pakaitalais ir užtikrinti, kad mūsų duomenų rinkinys būtų išsamus ir prasmingas. Giliau supratę Pandas biblioteką ir į ją įtrauktas funkcijas, galime efektyviai dirbti su dideliais duomenų rinkiniais ir iš savo duomenų pasisemti vertingų įžvalgų.

Susijusios naujienos:

Palikite komentarą