Solvut: jkollna n-numru ta 'valuri neqsin fil-pandas

Pandas hija librerija ta' manipulazzjoni tad-dejta open-source użata ħafna għal Python. Jipprovdi strutturi u funzjonijiet tad-dejta meħtieġa biex jimmanipulaw u janalizzaw settijiet ta' dejta kbar b'mod effettiv. Problema komuni li x-xjentisti u l-analisti tad-dejta jiltaqgħu magħhom waqt li jużaw pandas hija li jimmaniġġjaw il-valuri neqsin fis-sett tad-dejta. F'dan l-artikolu, se nesploraw kif tgħodd in-numru ta 'valuri neqsin f'pandas DataFrame billi tuża diversi tekniki, spjegazzjonijiet pass pass tal-kodiċi, u nidħlu aktar fil-fond f'xi wħud mil-libreriji u l-funzjonijiet involuti fis-soluzzjoni ta' din il-problema.

Għadd ta' Valuri Neqsin f'Pandas

Biex tibda, għandna bżonn l-ewwel jimportaw il-librerija tal-pandas. Jekk għadek ma installajtx, sempliċement ħaddem il-kmand "pip install pandas" fit-terminal tiegħek jew fil-pront tal-kmand.

import pandas as pd

Ladarba nkunu importajna l-librerija tal-pandas, ejja noħolqu kampjun tad-DataFrame b'valuri neqsin, li ser nużaw matul dan l-artikolu biex nuru tekniki differenti ta 'għadd ta' valuri neqsin.

data = {
    'Name': ['Anna', 'Ben', 'Carla', None, 'Eva'],
    'Age': [25, None, 30, 35, None],
    'City': ['NY', 'LA', None, 'SF', 'LA']
}

df = pd.DataFrame(data)

F'dan l-eżempju, għandna DataFrame bi tliet kolonni: Isem, Età u Belt. Hemm xi valuri neqsin, li se nsibu u ngħoddu fit-taqsima li jmiss.

Sib u Għadd ta' Valuri Neqsin bl-użu ta' isnull() u sum()

L-ewwel metodu biex jingħaddu l-valuri neqsin f'pandas DataFrame huwa billi tuża l- huwa null() funzjoni. Din il-funzjoni tirritorna DataFrame tal-istess forma bħall-oriġinal, iżda b'valuri Veru jew Foloz li jindikaw jekk l-entrata korrispondenti hijiex nieqsa (jiġifieri, fiha Xejn jew NaN) jew le.

missing_values = df.isnull()

Issa għandna DataFrame tal-istess forma, b'valuri Veri li jindikaw entrati nieqsa. Biex tgħodd dawn il-valuri neqsin, nistgħu sempliċement nużaw il- somma() funzjoni. Billi tużaha fuq id-DataFrame, nistgħu niksbu n-numru ta 'valuri neqsin għal kull kolonna.

count_missing_values = df.isnull().sum()

Dan se jagħtina Serje pandas bin-numru ta 'valuri neqsin għal kull kolonna fid-DataFrame tagħna.

Approċċ Alternattiv: Bl-użu isna() u sum()

Approċċ ieħor biex jingħaddu l-valuri neqsin f'pandas DataFrame huwa billi tuża l- isna() funzjoni. Huwa alias għal isnull() u jaħdem bl-istess mod.

count_missing_values = df.isna().sum()

Dan jagħti l-istess riżultat bħall-approċċ preċedenti, billi jgħodd in-numru ta 'valuri neqsin għal kull kolonna fid-DataFrame tagħna.

Għadd ta' Valuri Neqsin fid-DataFrame Sħiħ

Jekk irridu nsibu n-numru totali ta 'valuri neqsin fid-DataFrame kollu, nistgħu sempliċement nikkatina ieħor somma() funzjoni wara l-ewwel funzjoni somma().

total_missing_values = df.isnull().sum().sum()

Dan se jirritorna n-numru totali ta 'valuri neqsin fid-DataFrame kollu.

Fil-qosor, l-immaniġġjar tal-valuri neqsin fil-pandas huwa pass kruċjali fil-fażi tat-tindif tad-dejta u l-ipproċessar minn qabel. Bl-użu tal-funzjonijiet isnull() jew isna(), flimkien mal-funzjoni sum(), nistgħu ngħoddu b'mod effiċjenti n-numru ta 'valuri neqsin fid-DataFrame tagħna, li jagħmilha aktar faċli biex jiġu indirizzati u mmaniġġjati kwistjonijiet ta' data nieqsa fl-analiżi tagħna.

Related postijiet:

Kumment