ઉકેલાયેલ: ગુમ થયેલ મૂલ્યો પાંડા બદલવા માટે dict નો ઉપયોગ કરો

ડેટા મેનીપ્યુલેશન અને વિશ્લેષણની દુનિયામાં, ગુમ થયેલ મૂલ્યોનું સંચાલન કરવું એ એક નિર્ણાયક કાર્ય છે. પાંડા, વ્યાપકપણે ઉપયોગમાં લેવાતી Python લાઇબ્રેરી, અમને ગુમ થયેલ ડેટાને અસરકારક રીતે સંચાલિત કરવાની મંજૂરી આપે છે. ગુમ થયેલ મૂલ્યો સાથે વ્યવહાર કરવા માટેનો એક સામાન્ય અભિગમ આ મૂલ્યોને નકશા અને બદલવા માટે શબ્દકોશોનો ઉપયોગ કરે છે. આ લેખમાં, અમે ચર્ચા કરીશું કે ડેટાસેટમાં ખૂટતા મૂલ્યોને બદલવા માટે શબ્દકોશનો ઉપયોગ કરવા માટે પાંડા અને પાયથોનની શક્તિનો ઉપયોગ કેવી રીતે કરવો.

ઉકેલ

પ્રાથમિક ઉકેલ અમે અન્વેષણ કરીશું ભરવું() શબ્દકોશો સાથે જોડાણમાં કાર્ય. આ અભિગમ અમને ગુમ થયેલ મૂલ્યોને ચોક્કસ શબ્દકોશમાંથી અનુરૂપ મૂલ્યો સાથે બદલવા માટે સક્ષમ બનાવશે.

કોડનું પગલું દ્વારા પગલું સમજૂતી

આ પ્રક્રિયાને સમજાવવા માટે, ચાલો ધારીએ કે અમારી પાસે વસ્ત્રો, રંગો અને ઐતિહાસિક સંદર્ભો સહિત વિવિધ ફેશન શૈલીઓ વિશેની માહિતી ધરાવતો ડેટાસેટ છે. કેટલાક કિસ્સાઓમાં, આ ડેટાસેટમાં ગુમ થયેલ મૂલ્યો હોઈ શકે છે.

પ્રથમ, જરૂરી લાઇબ્રેરીઓ આયાત કરો અને નમૂના ડેટાફ્રેમ બનાવો:

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

હવે જ્યારે અમારી પાસે સમસ્યાનું વર્ણન કરતી ડેટાફ્રેમ છે, તો નોંધ લો કે કેટલાક મૂલ્યો ખૂટે છે (કોઈ દ્વારા સૂચિત નથી). આ મૂલ્યોને બદલવા માટે, યોગ્ય મેપિંગ ધરાવતા શબ્દકોશો બનાવો:

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

છેલ્લે, ઉપયોગ કરો ભરવું() સંયુક્ત શબ્દકોશનો ઉપયોગ કરીને ગુમ થયેલ મૂલ્યોને બદલવા માટેનું કાર્ય:

df_filled = df.fillna(replacement_dict)

પાંડા પુસ્તકાલયને સમજવું

પાંડા પાયથોનમાં બહુમુખી લાઇબ્રેરી છે જે ડેટા મેનીપ્યુલેશન અને વિશ્લેષણ માટે રચાયેલ છે. તે સિરીઝ અને ડેટાફ્રેમ જેવા લવચીક અને શક્તિશાળી ડેટા સ્ટ્રક્ચર ઓફર કરે છે. સ્ટ્રક્ચર્ડ, ટેબ્યુલર ડેટા સાથે કાર્યક્ષમ રીતે કાર્ય કરવા માટે આ સ્ટ્રક્ચર્સ આવશ્યક છે.

પાંડા કાર્યોનો સમૃદ્ધ સંગ્રહ પ્રદાન કરે છે, જેમ કે ભરવું(), ગુમ થયેલ ડેટાને હેન્ડલ કરવા માટે વપરાય છે. અન્ય કામગીરી, જેમ કે ડેટાને મર્જ કરવું, ડેટા પીવોટિંગ અને સમય-શ્રેણી વિશ્લેષણ, પાંડા સાથે એકીકૃત રીતે કરી શકાય છે.

ગુમ થયેલ ડેટાને હેન્ડલ કરવા માટેનાં કાર્યો

આ ઉપરાંત ભરવું() ફંક્શન, પાંડા ગુમ થયેલ ડેટા સાથે કામ કરવા માટે અન્ય ઘણા કાર્યો અને પદ્ધતિઓ પ્રદાન કરે છે, જેમ કે:

  • ડ્રોપના(): ગુમ થયેલ ડેટા સાથે પંક્તિઓ અથવા કૉલમ દૂર કરો.
  • isna(): નક્કી કરો કે કયા ડેટાફ્રેમ અથવા શ્રેણી તત્વો ખૂટે છે અથવા શૂન્ય છે.
  • નોટના(): નક્કી કરો કે કયા ડેટાફ્રેમ અથવા શ્રેણી તત્વો ખૂટે છે અથવા શૂન્ય નથી.
  • ઇન્ટરપોલેટ(): રેખીય પ્રક્ષેપનો ઉપયોગ કરીને ખૂટતા મૂલ્યો ભરો.

આ પદ્ધતિઓ સાથે ભરવું(), વિવિધ સંદર્ભોમાં ગુમ થયેલ ડેટાને હેન્ડલ કરવા માટે ટૂલ્સનો વ્યાપક સ્યુટ પ્રદાન કરો.

નિષ્કર્ષમાં, આ લેખમાં કેવી રીતે ઉપયોગ કરવો તે દર્શાવ્યું છે ડિક પાંડા ડેટાફ્રેમમાં ગુમ થયેલ મૂલ્યોને બદલવા માટે. અમે કાર્યરત મુખ્ય કાર્ય, ભરવું(), એ Pandas લાઇબ્રેરીમાં એક શક્તિશાળી સાધન છે જે અમને ગુમ થયેલ ડેટાને અસરકારક રીતે હેન્ડલ કરવાની મંજૂરી આપે છે. શબ્દકોશોનો ઉપયોગ કરીને, અમે ગુમ થયેલ મૂલ્યોને યોગ્ય સ્થાનાંતરણ માટે મેપ કરી શકીએ છીએ અને ખાતરી કરી શકીએ છીએ કે અમારો ડેટાસેટ સંપૂર્ણ અને અર્થપૂર્ણ છે. Pandas લાઇબ્રેરી અને તેના સમાવિષ્ટ કાર્યોની ઊંડી સમજણ દ્વારા, અમે મોટા ડેટાસેટ્સ સાથે અસરકારક રીતે કામ કરી શકીએ છીએ અને અમારા ડેટામાંથી મૂલ્યવાન આંતરદૃષ્ટિ મેળવી શકીએ છીએ.

સંબંધિત પોસ્ટ્સ:

પ્રતિક્રિયા આપો