Solvut: iffiltra l-kolonni kollha f'pandas

Fid-dinja tal-analiżi tad-dejta, l-immaniġġjar ta’ settijiet ta’ dejta kbar jista’ jkun biċċa xogħol kbira. Waħda mill-partijiet essenzjali ta 'dan il-proċess hija l-iffiltrar tad-dejta biex tinkiseb l-informazzjoni rilevanti. Meta niġu għal Python, il-librerija qawwija panda jiġi għall-għajnuna tagħna. F'dan l-artikolu, ser niddiskutu kif tiffiltra l-kolonni kollha f'pandas DataFrame. Se ngħaddu minn spjegazzjoni pass pass tal-kodiċi u nipprovdu fehim profond tal-libreriji u l-funzjonijiet li jistgħu jintużaw għal problemi simili.

Introduzzjoni pandas

hija librerija ta’ sors miftuħ li tipprovdi strutturi ta’ dejta faċli biex jintużaw u għodod ta’ analiżi tad-dejta għal-lingwa ta’ programmar Python. Għandu rwol sinifikanti fl-ekosistema tax-xjenza tad-dejta u sar għodda indispensabbli għal kwalunkwe xjenzat tad-dejta jew analista li jaħdem ma 'Python. Fost il-karatteristiċi tiegħu, il-pandas joffru żewġ strutturi tad-dejta primarji: DataFrame u Serje. DataFrame hija tabella bidimensjonali b'assi ttikkettjati (ringieli u kolonni), filwaqt li Serje hija firxa b'tikketta b'dimensjoni waħda.

Għal dan l-artikolu, aħna se niffukaw fuq l-iffiltrar ta 'valuri speċifiċi preżenti fi kwalunkwe kolonna ta' Pandas DataFrame. Biex tagħmel dan, se nużaw il-pandas .isin() funzjoni flimkien ma 'masking boolean.

Iffiltrar ta' DataFrame

Biex tiffiltra DataFrame f'pandas, segwi dawn il-passi:

1. Importa l-librerija tal-pandas
2. Oħloq DataFrame jew tagħbijah minn fajl
3. Iddefinixxi l-valuri li trid tiffiltra
4. Applika l-filtru billi tuża l-funzjoni `.isin()` u l-masking boolean
5. Uri d-DataFrame iffiltrat

Ejja nimxu fil-kodiċi biex nifhmu kif taħdem.

import pandas as pd

# Creating a DataFrame
data = {'Column1': [1, 2, 3, 4, 5],
        'Column2': [10, 20, 30, 40, 50],
        'Column3': ['A', 'B', 'A', 'B', 'A']}
df = pd.DataFrame(data)

# Define the values to filter
filter_values = [1, 3, 5, 'A']

# Apply the filter using .isin() and boolean masking
filtered_df = df[df.isin(filter_values).any(axis=1)]

# Display the filtered DataFrame
print(filtered_df)

F'dan l-eżempju, l-ewwel nimportaw il-librerija tal-pandas u noħolqu DataFrame bi tliet kolonni. Aħna niddefinixxu l-valuri li rridu niffiltraw (1, 3, 5, u 'A') u napplikaw il-filtru billi tuża l-funzjoni `.isin()` flimkien ma' masking boolean. Il-funzjoni `kull(axis=1)` tiċċekkja jekk xi valur f'ringiela jissodisfax il-kriterji ta' filtrazzjoni. Fl-aħħarnett, nipprintjaw id-DataFrame iffiltrat.

Il-funzjoni .isin() u l-masking boolean

il .isin() funzjoni fil-pandas hija għodda versatili għall-iffiltrar tad-dejta bbażata fuq lista jew sett ta 'valuri. Jirritorna DataFrame boolean tal-istess forma bħal dik oriġinali, li jindika liema elementi huma preżenti fil-lista jew is-sett ipprovdut. Fil-każ tagħna, aħna ngħaddu lista ta 'valuri li rridu niffiltraw.

Il-masking boolean huwa teknika użata fil-pandas għall-iffiltrar tad-dejta skont l-elementi. Tikkonsisti fl-applikazzjoni ta 'maskra booleana (firxa ta' valuri Veru u Foloz) għal struttura tad-dejta biex tiffiltra l-elementi tagħha. Fil-kuntest tal-problema tagħna, nużaw masking boolean flimkien mal-funzjoni .isin() biex nirkupraw ringieli li fihom il-valuri mixtieqa.

B'fehim ċar tal-librerija tal-pandas, l-istrutturi tad-DataFrame, u l-funzjoni .isin(), nistgħu niffiltraw b'mod effettiv kwalunkwe Pandas DataFrame. Dawn it-tekniki jippermettulna nesploraw settijiet ta' dejta kbar u niġbdu għarfien siewi b'mod faċli, u jagħmlu l-pandas librerija ta' aċċess għall-analiżi tad-dejta f'Python.

Related postijiet:

Kumment