ઉકેલાયેલ: પાંડામાં ગુમ થયેલ મૂલ્યોની સંખ્યા મેળવવી

Pandas એ પાયથોન માટે વ્યાપકપણે ઉપયોગમાં લેવાતી ઓપન-સોર્સ ડેટા મેનીપ્યુલેશન લાઇબ્રેરી છે. તે મોટા ડેટાસેટ્સને અસરકારક રીતે ચાલાકી અને વિશ્લેષણ કરવા માટે જરૂરી ડેટા સ્ટ્રક્ચર્સ અને કાર્યો પ્રદાન કરે છે. પંડાનો ઉપયોગ કરતી વખતે ડેટા વૈજ્ઞાનિકો અને વિશ્લેષકોની એક સામાન્ય સમસ્યા ડેટાસેટમાં ખૂટતા મૂલ્યોને હેન્ડલ કરવાની છે. આ લેખમાં, અમે વિવિધ તકનીકોનો ઉપયોગ કરીને પાંડા ડેટાફ્રેમમાં ગુમ થયેલ મૂલ્યોની સંખ્યા કેવી રીતે ગણવી, કોડના પગલા-દર-પગલાંની સ્પષ્ટતાઓ અને આ સમસ્યાને ઉકેલવામાં સામેલ કેટલીક લાઇબ્રેરીઓ અને કાર્યોમાં ઊંડાણપૂર્વક તપાસ કરીશું.

પાંડામાં ખૂટતા મૂલ્યોની ગણતરી

શરૂ કરવા માટે, અમારે પહેલા પાંડા લાઇબ્રેરી આયાત કરવાની જરૂર છે. જો તમે હજી સુધી તેને ઇન્સ્ટોલ કર્યું નથી, તો ફક્ત તમારા ટર્મિનલ અથવા કમાન્ડ પ્રોમ્પ્ટમાં `pip install pandas` આદેશ ચલાવો.

import pandas as pd

એકવાર આપણે પાન્ડાસ લાઇબ્રેરી આયાત કરી લીધા પછી, ચાલો ગુમ થયેલ મૂલ્યો સાથે એક નમૂના ડેટાફ્રેમ બનાવીએ, જેનો ઉપયોગ આપણે આ લેખમાં ગુમ થયેલ મૂલ્યોની ગણતરી કરવાની વિવિધ તકનીકો દર્શાવવા માટે કરીશું.

data = {
    'Name': ['Anna', 'Ben', 'Carla', None, 'Eva'],
    'Age': [25, None, 30, 35, None],
    'City': ['NY', 'LA', None, 'SF', 'LA']
}

df = pd.DataFrame(data)

આ ઉદાહરણમાં, અમારી પાસે ત્રણ કૉલમ્સ સાથે ડેટાફ્રેમ છે: નામ, ઉંમર અને શહેર. કેટલાક ખૂટતા મૂલ્યો છે, જે આપણે આગળના વિભાગમાં શોધીશું અને ગણીશું.

isnull() અને sum() નો ઉપયોગ કરીને ખૂટતી કિંમતો શોધવી અને ગણવી

પાંડા ડેટાફ્રેમમાં ગુમ થયેલ મૂલ્યોની ગણતરી કરવાની પ્રથમ પદ્ધતિનો ઉપયોગ કરીને છે isnull() કાર્ય આ ફંક્શન અસલ જેવો જ આકારનો ડેટાફ્રેમ આપે છે, પરંતુ સાચા અથવા ખોટા મૂલ્યો સાથે જે દર્શાવે છે કે અનુરૂપ એન્ટ્રી ખૂટે છે (એટલે ​​કે, તેમાં કંઈ અથવા NaN નથી) કે નહીં.

missing_values = df.isnull()

હવે અમારી પાસે સમાન આકારની ડેટાફ્રેમ છે, જેમાં સાચી કિંમતો ખૂટતી એન્ટ્રીઓ દર્શાવે છે. આ ગુમ થયેલ મૂલ્યોની ગણતરી કરવા માટે, આપણે ફક્ત નો ઉપયોગ કરી શકીએ છીએ રકમ() કાર્ય ડેટાફ્રેમ પર તેનો ઉપયોગ કરીને, આપણે દરેક કૉલમ માટે ખૂટતી કિંમતોની સંખ્યા મેળવી શકીએ છીએ.

count_missing_values = df.isnull().sum()

આનાથી અમને અમારા ડેટાફ્રેમમાં દરેક કૉલમ માટે ખૂટતી કિંમતોની સંખ્યા સાથે પાંડા શ્રેણી મળશે.

વૈકલ્પિક અભિગમ: isna() અને sum() નો ઉપયોગ કરવો

પાંડા ડેટાફ્રેમમાં ગુમ થયેલ મૂલ્યોની ગણતરી કરવાનો બીજો અભિગમ છે isna() કાર્ય તે isnull() માટે ઉપનામ છે અને તે જ રીતે કાર્ય કરે છે.

count_missing_values = df.isna().sum()

આ અમારા ડેટાફ્રેમમાં દરેક કૉલમ માટે ખૂટતી કિંમતોની સંખ્યા ગણીને, અગાઉના અભિગમ જેવું જ પરિણામ આપશે.

સમગ્ર ડેટાફ્રેમમાં ખૂટતા મૂલ્યોની ગણતરી

જો આપણે સમગ્ર ડેટાફ્રેમમાં ગુમ થયેલ મૂલ્યોની કુલ સંખ્યા શોધવા માંગીએ છીએ, તો આપણે ફક્ત બીજી સાંકળ બનાવી શકીએ છીએ રકમ() પ્રથમ sum() ફંક્શન પછી ફંક્શન.

total_missing_values = df.isnull().sum().sum()

આ સમગ્ર ડેટાફ્રેમમાં ગુમ થયેલ મૂલ્યોની કુલ સંખ્યા પરત કરશે.

સારાંશમાં, પાંડામાં ખૂટતા મૂલ્યોનું સંચાલન કરવું એ ડેટા ક્લિનિંગ અને પ્રી-પ્રોસેસિંગ તબક્કામાં એક નિર્ણાયક પગલું છે. isnull() અથવા isna() ફંક્શનનો ઉપયોગ કરીને, sum() ફંક્શન સાથે સંયોજનમાં, અમે અમારા ડેટાફ્રેમમાં ગુમ થયેલ મૂલ્યોની સંખ્યાને અસરકારક રીતે ગણી શકીએ છીએ, જે અમારા પૃથક્કરણમાં ખોવાયેલા ડેટા મુદ્દાઓને સંબોધવા અને સંચાલિત કરવાનું સરળ બનાવે છે.

સંબંધિત પોસ્ટ્સ:

પ્રતિક્રિયા આપો