Lahendatud: kasutage puuduvate väärtuste asendamiseks dict pandasid

Andmetöötluse ja -analüüsi maailmas on puuduvate väärtuste käsitlemine ülioluline ülesanne. Pandad, laialdaselt kasutatav Pythoni teek, võimaldab meil puuduvaid andmeid tõhusalt hallata. Üks levinud lähenemisviis puuduvate väärtustega tegelemiseks hõlmab sõnaraamatute kasutamist nende väärtuste kaardistamiseks ja asendamiseks. Selles artiklis käsitleme, kuidas kasutada Pandade ja Pythoni võimet kasutada andmekogus puuduvate väärtuste asendamiseks sõnastikke.

Lahendus

Peamine lahendus, mida uurime, on kasutada fillna() funktsioon koos sõnaraamatutega. See lähenemisviis võimaldab meil asendada puuduvad väärtused vastavate väärtustega määratud sõnastikust.

Koodi samm-sammult selgitus

Selle protsessi illustreerimiseks oletame, et meil on andmestik, mis sisaldab teavet erinevate moestiilide, sealhulgas rõivaste, värvide ja ajaloolise konteksti kohta. Mõnel juhul võivad selles andmekogumis väärtused puududa.

Esiteks importige vajalikud teegid ja looge näidis DataFrame:

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

Nüüd, kui meil on probleemi illustreeriv DataFrame, pange tähele, et mõned väärtused puuduvad (tähistatud kui None). Nende väärtuste asendamiseks looge sobivaid vastendusi sisaldavad sõnastikud:

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

Lõpuks kasutage fillna() funktsioon puuduvate väärtuste asendamiseks kombineeritud sõnaraamatu abil:

df_filled = df.fillna(replacement_dict)

Pandade raamatukogu mõistmine

Pandad on Pythoni mitmekülgne teek, mis on mõeldud andmete töötlemiseks ja analüüsimiseks. See pakub paindlikke ja võimsaid andmestruktuure, nagu Series ja DataFrame. Need struktuurid on olulised struktureeritud tabeliandmetega tõhusaks töötamiseks.

Pandas pakub rikkalikku funktsioonide kogumit, näiteks fillna(), mida kasutatakse puuduvate andmete käsitlemiseks. Muid toiminguid, nagu andmete liitmine, andmete käänamine ja aegridade analüüs, saab Pandaga sujuvalt teha.

Funktsioonid puuduvate andmete käsitlemiseks

Lisaks fillna() Pandas pakub puuduvate andmetega tegelemiseks mitmeid muid funktsioone ja meetodeid, näiteks:

  • dropna (): eemaldage puuduvate andmetega read või veerud.
  • isna (): määrake, millised DataFrame'i või Seriesi elemendid puuduvad või puuduvad.
  • notna (): määrake, millised DataFrame'i või Seriesi elemendid ei puudu või puuduvad.
  • interpoleerida (): täitke puuduvad väärtused lineaarse interpolatsiooni abil.

Need meetodid koos fillna(), pakuvad laiaulatuslikku tööriistakomplekti puuduvate andmete käsitlemiseks erinevates kontekstides.

Kokkuvõtteks võib öelda, et see artikkel on näidanud, kuidas seda kasutada dikteerima Panda DataFrame'i puuduvate väärtuste asendamiseks. Põhifunktsioon, mida kasutasime, fillna(), on võimas tööriist Pandase teegis, mis võimaldab meil puuduvaid andmeid tõhusalt käsitleda. Sõnaraamatuid kasutades saame kaardistada puuduvad väärtused sobivateks asendusteks ja tagada, et meie andmestik on täielik ja sisukas. Pandase teegi ja selle funktsioonide sügavama mõistmise kaudu saame suurte andmekogumitega tõhusalt töötada ja oma andmetest väärtuslikke teadmisi ammutada.

Seonduvad postitused:

Jäta kommentaar