Pandas એ એક ઓપન-સોર્સ પાયથોન લાઇબ્રેરી છે જે ઉચ્ચ-પ્રદર્શન, ઉપયોગમાં સરળ ડેટા સ્ટ્રક્ચર્સ અને ડેટા વિશ્લેષણ સાધનો પ્રદાન કરે છે. જ્યારે ડેટા મેનીપ્યુલેશન અને વિશ્લેષણની વાત આવે છે ત્યારે તે વિકાસકર્તાઓ અને ડેટા વૈજ્ઞાનિકો માટે પસંદગી બની ગઈ છે. Pandas દ્વારા પૂરી પાડવામાં આવેલ શક્તિશાળી સુવિધાઓમાંની એક ડેટાફ્રેમ બનાવવા અને સંશોધિત કરવી છે. આ લેખમાં, અમે પાંડા લાઇબ્રેરીનો ઉપયોગ કરીને, જો તે અસ્તિત્વમાં ન હોય તો ડેટાફ્રેમમાં બહુવિધ કૉલમ ઉમેરવાની પ્રક્રિયાનું અન્વેષણ કરીશું. અમે કોડના પગલા-દર-પગલાંની સમજૂતીમાંથી પસાર થઈશું અને સંબંધિત કાર્યો, પુસ્તકાલયો અને તમને રસ્તામાં આવી શકે તેવી સમસ્યાઓમાં ડાઇવ કરીશું.
ડેટા હેન્ડલ કરતી વખતે ડેટાફ્રેમ્સ સાથે કામ કરવું મહત્વપૂર્ણ છે, અને ઘણીવાર તમે તમારી જાતને એવી પરિસ્થિતિમાં શોધી શકો છો કે જ્યાં તમારે ડેટાફ્રેમમાં એક સાથે બહુવિધ કૉલમ ઉમેરવાની જરૂર હોય. આ મુશ્કેલ હોઈ શકે છે, પરંતુ Pandas પુસ્તકાલય આ કાર્યને સરળ અને કાર્યક્ષમ બનાવે છે. પ્રથમ, ચાલો Pandas લાઇબ્રેરી આયાત કરીને શરૂ કરીએ:
import pandas as pd
Pandas Dataframe માં બહુવિધ કૉલમ ઉમેરવાનું
ડેટાફ્રેમમાં બહુવિધ કૉલમ ઉમેરવા માટે, અમે DataFrame.assign() પદ્ધતિનો ઉપયોગ કરી શકીએ છીએ. આ પદ્ધતિ અમને ડેટાફ્રેમમાં એક સાથે એક અથવા અનેક કૉલમ ઉમેરવાની મંજૂરી આપે છે. ચાલો એક સેમ્પલ ડેટાફ્રેમ બનાવીએ અને પછી જો તે પહેલાથી અસ્તિત્વમાં ન હોય તો તેમાં બહુવિધ કૉલમ ઉમેરીએ:
# Create a sample dataframe data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]} df = pd.DataFrame(data) # Add multiple columns if they do not exist new_columns = ['column3', 'column4'] for new_col in new_columns: if new_col not in df.columns: df[new_col] = None
માં ઉપર કોડ સ્નિપેટ, અમે પ્રથમ બે કૉલમ, 'કૉલમ1' અને 'કૉલમ2' સાથે નમૂના ડેટાફ્રેમ બનાવીએ છીએ. અમે પછી નવા કૉલમ્સની યાદી બનાવીએ છીએ, 'column3' અને 'column4', જેને અમે ડેટાફ્રેમમાં ઉમેરવા માગીએ છીએ. છેલ્લે, અમે કૉલમની સૂચિ દ્વારા પુનરાવર્તિત કરીએ છીએ અને જો તે ડેટાફ્રેમમાં પહેલેથી અસ્તિત્વમાં ન હોય તો નવી કૉલમ ઉમેરીએ છીએ.
પગલું દ્વારા પગલું સમજૂતી
અહીં એક પગલું દ્વારા પગલું છે દરેક ભાગની સમજૂતી અમારા ઉકેલમાંથી:
1. અમે "pd તરીકે પાંડા આયાત કરો" નો ઉપયોગ કરીને પાંડા લાઇબ્રેરીને આયાત કરીને પ્રારંભ કરીએ છીએ.
2. આગળ, અમે બે કૉલમ્સ સાથે 'df' નામની સેમ્પલ ડેટાફ્રેમ બનાવીએ છીએ: 'column1' અને 'column2'.
3. અમે નવા કૉલમ્સની યાદી બનાવીએ છીએ જેને અમે ડેટાફ્રેમમાં ઉમેરવા માગીએ છીએ - 'column3' અને 'column4'.
4. અમે નવી કૉલમ્સની સૂચિ દ્વારા પુનરાવર્તન કરવા માટે લૂપનો ઉપયોગ કરીએ છીએ.
5. લૂપની અંદર, અમે 'નોટ ઇન' કંડીશનનો ઉપયોગ કરીને ડેટાફ્રેમમાં નવી કોલમ પહેલેથી અસ્તિત્વમાં છે કે કેમ તે તપાસીએ છીએ. જો નવી કૉલમ અસ્તિત્વમાં ન હોય, તો અમે કોઈ નહીંની ડિફોલ્ટ મૂલ્ય સાથે ડેટાફ્રેમમાં નવી કૉલમ ઉમેરીએ છીએ.
પાંડા કાર્યો અને પુસ્તકાલયો
Pandas કાર્યો અને પદ્ધતિઓની વિશાળ શ્રેણી પ્રદાન કરે છે જે ડેટાફ્રેમને હેન્ડલિંગ અને હેરફેરને સરળ બનાવે છે. અમારા ઉકેલમાં, અમે નીચેના મુખ્ય ઘટકોનો ઉપયોગ કર્યો:
- ડેટાફ્રેમ - પાંડામાં પ્રાથમિક ડેટા સ્ટ્રક્ચર તરીકે, ડેટાફ્રેમ એ દ્વિ-પરિમાણીય, પરિવર્તનશીલ, સંભવિત રૂપે વિજાતીય ટેબ્યુલર ડેટા છે જેમાં લેબલવાળી અક્ષો (પંક્તિઓ અને કૉલમ્સ) છે.
- DataFrame.columns - આ એટ્રિબ્યુટ ડેટાફ્રેમના કૉલમ લેબલ્સ પરત કરે છે, જે અમને કૉલમ અસ્તિત્વમાં છે કે નહીં તે ઍક્સેસ કરવા અને ચકાસવાની મંજૂરી આપે છે.
- pd.ડેટાફ્રેમ() - નવી ડેટાફ્રેમ બનાવવા માટે તે કન્સ્ટ્રક્ટર ફંક્શન છે. તે તમને બનાવટ દરમિયાન ડેટા અને કૉલમના નામોને વ્યાખ્યાયિત કરવાની મંજૂરી આપે છે.
હવે તમને કેવી રીતે કરવું તે વધુ સારી રીતે સમજાયું છે બહુવિધ કૉલમ ઉમેરો Pandas ડેટાફ્રેમમાં, આ તકનીક તમને ડેટાને અસરકારક રીતે સંચાલિત કરવામાં અને તેની હેરફેર કરવામાં મદદ કરશે. યાદ રાખો કે Pandas ડેટા વિશ્લેષણ અને મેનીપ્યુલેશન માટે અસંખ્ય અન્ય શક્તિશાળી સુવિધાઓ પ્રદાન કરે છે, તેથી વધુ અસરકારક પાયથોન ડેવલપર બનવા માટે તેનું અન્વેષણ કરવાનું સુનિશ્ચિત કરો.