Pandas se yon bibliyotèk manipilasyon done ki lajman itilize pou Python. Li bay estrikti done ak fonksyon ki nesesè pou byen manipile ak analize gwo datasets. Yon pwoblèm komen done syantis yo ak analis yo rankontre pandan y ap itilize panda se jere valè ki manke nan done a. Nan atik sa a, nou pral eksplore ki jan yo konte kantite valè ki manke nan yon panda DataFrame lè l sèvi avèk divès teknik, etap pa etap eksplikasyon sou kòd la, epi fouye pi fon nan kèk nan bibliyotèk yo ak fonksyon ki enplike nan rezoud pwoblèm sa a.
contents
Konte valè ki manke nan panda
Pou kòmanse, nou bezwen premye enpòte bibliyotèk la panda. Si ou poko enstale li, tou senpleman kouri lòd "pip install pandas" nan tèminal ou oswa èd memwa lòd ou a.
import pandas as pd
Yon fwa nou fin enpòte bibliyotèk panda a, ann kreye yon echantiyon DataFrame ak valè ki manke, ke nou pral itilize nan tout atik sa a pou montre diferan teknik pou konte valè ki manke yo.
data = { 'Name': ['Anna', 'Ben', 'Carla', None, 'Eva'], 'Age': [25, None, 30, 35, None], 'City': ['NY', 'LA', None, 'SF', 'LA'] } df = pd.DataFrame(data)
Nan egzanp sa a, nou gen yon DataFrame ak twa kolòn: Non, Laj, ak Vil. Gen kèk valè ki manke, ke nou pral jwenn ak konte nan pwochen seksyon an.
Jwenn ak konte valè ki manke yo lè l sèvi avèk isnull () ak sum ()
Premye metòd pou konte valè ki manke nan yon panda DataFrame se lè l sèvi avèk la isnull () fonksyon. Fonksyon sa a retounen yon DataFrame ki gen menm fòm ak orijinal la, men ak valè Vrè oswa Fo ki endike si antre korespondan an manke (sa vle di, pa gen okenn oswa NaN) oswa ou pa.
missing_values = df.isnull()
Koulye a, nou gen yon DataFrame ki gen menm fòm, ak valè Vrè ki endike antre ki manke yo. Pou konte valè ki manke sa yo, nou ka tou senpleman itilize a sòm () fonksyon. Lè nou itilize li sou DataFrame a, nou ka jwenn kantite valè ki manke pou chak kolòn.
count_missing_values = df.isnull().sum()
Sa a pral ban nou yon seri panda ak kantite valè ki manke pou chak kolòn nan DataFrame nou an.
Apwòch altènatif: Sèvi ak isna () ak sòm ()
Yon lòt apwòch pou konte valè ki manke nan yon panda DataFrame se lè l sèvi avèk la isna() fonksyon. Li se yon alyas pou isnull () epi li travay nan menm fason an.
count_missing_values = df.isna().sum()
Sa a pral bay menm rezilta ak apwòch anvan an, konte kantite valè ki manke pou chak kolòn nan DataFrame nou an.
Konte valè ki manke nan tout DataFrame a
Si nou vle jwenn kantite total valè ki manke nan tout DataFrame a, nou ka tou senpleman chenn yon lòt sòm () fonksyon apre premye fonksyon sum().
total_missing_values = df.isnull().sum().sum()
Sa a pral retounen kantite total valè ki manke nan tout DataFrame a.
An rezime, manyen valè ki manke nan panda se yon etap enpòtan nan netwayaj done ak faz pre-pwosesis la. Lè nou itilize fonksyon isnull() oswa isna(), ansanm ak fonksyon sum(), nou ka konte avèk efikasite kantite valè ki manke nan DataFrame nou an, sa ki fè li pi fasil pou adrese ak jere pwoblèm done ki manke nan analiz nou an.