ઉકેલી: પાંડા ડેટાફ્રેમમાં નવી કૉલમ ઉમેરો

આ લેખમાં, અમે ડેટા મેનીપ્યુલેશન અને વિશ્લેષણ માટે પાયથોનમાં લોકપ્રિય લાઇબ્રેરી, Pandas DataFrameમાં નવી કૉલમ ઉમેરવાની પ્રક્રિયાનું અન્વેષણ કરીશું. અમે આ સમસ્યાના ઉકેલની ચર્ચા કરીશું, કોડના પગલા-દર-પગલાંની સમજૂતીમાંથી પસાર થઈશું અને પાંડા લાઇબ્રેરીમાં કેટલાક સંબંધિત વિષયો અને કાર્યોને આવરી લઈશું. Pandas એ ઉચ્ચ સ્તરીય ડેટા સ્ટ્રક્ચર્સ અને સાધનો દર્શાવતી વ્યાપકપણે ઉપયોગમાં લેવાતી લાઇબ્રેરી છે, જે કાર્યક્ષમ ડેટા વિશ્લેષણ અને હેન્ડલિંગ કાર્યો માટે યોગ્ય છે.

શરૂ કરવા માટે, ચાલો ધારીએ કે અમારી પાસે Pandas DataFrame ના રૂપમાં ડેટાસેટ છે અને અમે તેમાં એક નવી કૉલમ ઉમેરવા માંગીએ છીએ. ડેટા તૈયારીના તબક્કામાં આ એક સામાન્ય જરૂરિયાત છે, જે ઘણીવાર ફીચર એન્જિનિયરિંગ માટે અથવા હાલની કૉલમના આધારે વધારાની માહિતી જનરેટ કરવા માટે જરૂરી છે. ચાલો આ કેવી રીતે હાંસલ કરી શકાય તે વિશે ડાઇવ કરીએ.

Pandas DataFrame માં નવી કૉલમ ઉમેરી રહ્યા છીએ

અમે જરૂરી લાઇબ્રેરી આયાત કરીને અને નમૂના ડેટાફ્રેમ બનાવીને પ્રારંભ કરીશું.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

હવે, ચાલો એક નવી કૉલમ 'દેશ'ને ડિફોલ્ટ મૂલ્ય સાથે અમારા ડેટાફ્રેમમાં ઉમેરીએ, 'યુએસએ' કહો.

df['Country'] = 'USA'

કોડની આ સરળ લાઇન અમારી હાલની ડેટાફ્રેમ 'df'માં 'કંટ્રી' નામની નવી કૉલમને તેની તમામ પંક્તિઓમાં 'USA' મૂલ્ય સાથે ઉમેરશે. અમારી અપડેટ કરેલી ડેટાફ્રેમ આના જેવી દેખાશે:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

પગલું દ્વારા પગલું કોડ સમજૂતી

ચાલો કોડને તોડીએ અને તેને તબક્કાવાર સમજીએ.

1. પ્રથમ, અમે પ્રમાણભૂત ઉપનામ 'pd' નો ઉપયોગ કરીને Pandas લાઇબ્રેરી આયાત કરીએ છીએ. આ અમને 'pd' ઉપસર્ગનો ઉપયોગ કરીને Pandas કાર્યો અને વર્ગોને ઍક્સેસ કરવાની મંજૂરી આપે છે.

import pandas as pd

2. આગળ, અમે કેટલાક નમૂના ડેટા ધરાવતો શબ્દકોશ 'ડેટા' બનાવીએ છીએ. શબ્દકોશમાંની દરેક કી કૉલમના નામનું પ્રતિનિધિત્વ કરે છે, અને તેનું અનુરૂપ મૂલ્ય તે કૉલમ માટેના મૂલ્યોની સૂચિ છે.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. પછી અમે `pd.DataFrame()` ફંક્શનનો ઉપયોગ કરીને આ શબ્દકોશને Pandas DataFrame ઑબ્જેક્ટમાં રૂપાંતરિત કરીએ છીએ.

df = pd.DataFrame(data)

4. છેલ્લે, નવી કૉલમ ઉમેરવા માટે, અમે ડેટાફ્રેમ સાથે અસાઇનમેન્ટ ઑપરેટર “=” નો ઉપયોગ કરીએ છીએ, ચોરસ કૌંસમાં નવા કૉલમનું નામ પ્રદાન કરીએ છીએ અને ડિફૉલ્ટ મૂલ્યનો ઉલ્લેખ કરીએ છીએ. અમારા કિસ્સામાં, અમે ડિફોલ્ટ મૂલ્ય 'યુએસએ' સાથે 'દેશ' કૉલમ ઉમેરી.

df['Country'] = 'USA'

પાંડા પુસ્તકાલય અને સંબંધિત કાર્યો

Pandas એ એક શક્તિશાળી Python લાઇબ્રેરી છે, ખાસ કરીને ડેટા પ્રોસેસિંગ, સફાઈ અને વિશ્લેષણ કાર્યો માટે યોગ્ય. તે બે મુખ્ય ડેટા સ્ટ્રક્ચર્સ પ્રદાન કરે છે: ડેટાફ્રેમ અને સિરીઝ. ડેટાફ્રેમ એ લેબલવાળી અક્ષો (પંક્તિઓ અને કૉલમ્સ) સાથેનું દ્વિ-પરિમાણીય ટેબ્યુલર ડેટા માળખું છે. બીજી બાજુ, શ્રેણી એ એક-પરિમાણીય લેબલવાળી એરે છે જે કોઈપણ પ્રકારનો ડેટા રાખવા માટે સક્ષમ છે.

ડેટાફ્રેમમાં કૉલમ ઉમેરવા, સંશોધિત કરવા અને કાઢી નાખવા સંબંધિત કેટલાક સામાન્ય પાંડા કાર્યો નીચે મુજબ છે:

  • insert(): ચોક્કસ સ્થાન પર કૉલમ દાખલ કરવા માટે.
  • છોડો(): ડેટાફ્રેમમાંથી કૉલમ દૂર કરવા.
  • નામ બદલો(): ડેટાફ્રેમની કોલમનું નામ બદલવા માટે.
  • સોંપો(): અભિવ્યક્તિના પરિણામના આધારે નવી કૉલમ બનાવવા માટે.

તેથી, Pandas DataFrameમાં નવી કૉલમ ઉમેરવાનું સરળ અને કાર્યક્ષમ છે. આ લેખમાં, અમે ડિફોલ્ટ મૂલ્ય સાથે નવી કૉલમ ઉમેરવાની મૂળભૂત પદ્ધતિને આવરી લીધી છે અને તેમાં સમાવિષ્ટ પગલાંઓ માટે વિગતવાર સ્પષ્ટતા પ્રદાન કરી છે. અમે પાંડાને એક શક્તિશાળી ડેટા મેનીપ્યુલેશન લાઇબ્રેરી તરીકે પણ રજૂ કર્યા છે અને ડેટાફ્રેમ કૉલમના સંચાલન માટે કેટલાક સંબંધિત કાર્યોની ચર્ચા કરી છે. આ તકનીકોમાં નિપુણતા પ્રાપ્ત કરીને, તમે પાયથોનમાં ડેટા પ્રોસેસિંગ કાર્યોની વિશાળ શ્રેણીને હેન્ડલ કરવા માટે સારી રીતે સજ્જ હશો.

સંબંધિત પોસ્ટ્સ:

પ્રતિક્રિયા આપો