આ લેખમાં, અમે ડેટા મેનીપ્યુલેશન અને વિશ્લેષણ માટે પાયથોનમાં લોકપ્રિય લાઇબ્રેરી, Pandas DataFrameમાં નવી કૉલમ ઉમેરવાની પ્રક્રિયાનું અન્વેષણ કરીશું. અમે આ સમસ્યાના ઉકેલની ચર્ચા કરીશું, કોડના પગલા-દર-પગલાંની સમજૂતીમાંથી પસાર થઈશું અને પાંડા લાઇબ્રેરીમાં કેટલાક સંબંધિત વિષયો અને કાર્યોને આવરી લઈશું. Pandas એ ઉચ્ચ સ્તરીય ડેટા સ્ટ્રક્ચર્સ અને સાધનો દર્શાવતી વ્યાપકપણે ઉપયોગમાં લેવાતી લાઇબ્રેરી છે, જે કાર્યક્ષમ ડેટા વિશ્લેષણ અને હેન્ડલિંગ કાર્યો માટે યોગ્ય છે.
શરૂ કરવા માટે, ચાલો ધારીએ કે અમારી પાસે Pandas DataFrame ના રૂપમાં ડેટાસેટ છે અને અમે તેમાં એક નવી કૉલમ ઉમેરવા માંગીએ છીએ. ડેટા તૈયારીના તબક્કામાં આ એક સામાન્ય જરૂરિયાત છે, જે ઘણીવાર ફીચર એન્જિનિયરિંગ માટે અથવા હાલની કૉલમના આધારે વધારાની માહિતી જનરેટ કરવા માટે જરૂરી છે. ચાલો આ કેવી રીતે હાંસલ કરી શકાય તે વિશે ડાઇવ કરીએ.
Pandas DataFrame માં નવી કૉલમ ઉમેરી રહ્યા છીએ
અમે જરૂરી લાઇબ્રેરી આયાત કરીને અને નમૂના ડેટાફ્રેમ બનાવીને પ્રારંભ કરીશું.
import pandas as pd data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'], 'Age': [25, 28, 23, 22], 'City': ['NY', 'LA', 'SF', 'Chicago']} df = pd.DataFrame(data)
હવે, ચાલો એક નવી કૉલમ 'દેશ'ને ડિફોલ્ટ મૂલ્ય સાથે અમારા ડેટાફ્રેમમાં ઉમેરીએ, 'યુએસએ' કહો.
df['Country'] = 'USA'
કોડની આ સરળ લાઇન અમારી હાલની ડેટાફ્રેમ 'df'માં 'કંટ્રી' નામની નવી કૉલમને તેની તમામ પંક્તિઓમાં 'USA' મૂલ્ય સાથે ઉમેરશે. અમારી અપડેટ કરેલી ડેટાફ્રેમ આના જેવી દેખાશે:
Name Age City Country 0 Alex 25 NY USA 1 Tom 28 LA USA 2 Nick 23 SF USA 3 Sam 22 Chicago USA
પગલું દ્વારા પગલું કોડ સમજૂતી
ચાલો કોડને તોડીએ અને તેને તબક્કાવાર સમજીએ.
1. પ્રથમ, અમે પ્રમાણભૂત ઉપનામ 'pd' નો ઉપયોગ કરીને Pandas લાઇબ્રેરી આયાત કરીએ છીએ. આ અમને 'pd' ઉપસર્ગનો ઉપયોગ કરીને Pandas કાર્યો અને વર્ગોને ઍક્સેસ કરવાની મંજૂરી આપે છે.
import pandas as pd
2. આગળ, અમે કેટલાક નમૂના ડેટા ધરાવતો શબ્દકોશ 'ડેટા' બનાવીએ છીએ. શબ્દકોશમાંની દરેક કી કૉલમના નામનું પ્રતિનિધિત્વ કરે છે, અને તેનું અનુરૂપ મૂલ્ય તે કૉલમ માટેના મૂલ્યોની સૂચિ છે.
data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'], 'Age': [25, 28, 23, 22], 'City': ['NY', 'LA', 'SF', 'Chicago']}
3. પછી અમે `pd.DataFrame()` ફંક્શનનો ઉપયોગ કરીને આ શબ્દકોશને Pandas DataFrame ઑબ્જેક્ટમાં રૂપાંતરિત કરીએ છીએ.
df = pd.DataFrame(data)
4. છેલ્લે, નવી કૉલમ ઉમેરવા માટે, અમે ડેટાફ્રેમ સાથે અસાઇનમેન્ટ ઑપરેટર “=” નો ઉપયોગ કરીએ છીએ, ચોરસ કૌંસમાં નવા કૉલમનું નામ પ્રદાન કરીએ છીએ અને ડિફૉલ્ટ મૂલ્યનો ઉલ્લેખ કરીએ છીએ. અમારા કિસ્સામાં, અમે ડિફોલ્ટ મૂલ્ય 'યુએસએ' સાથે 'દેશ' કૉલમ ઉમેરી.
df['Country'] = 'USA'
પાંડા પુસ્તકાલય અને સંબંધિત કાર્યો
Pandas એ એક શક્તિશાળી Python લાઇબ્રેરી છે, ખાસ કરીને ડેટા પ્રોસેસિંગ, સફાઈ અને વિશ્લેષણ કાર્યો માટે યોગ્ય. તે બે મુખ્ય ડેટા સ્ટ્રક્ચર્સ પ્રદાન કરે છે: ડેટાફ્રેમ અને સિરીઝ. ડેટાફ્રેમ એ લેબલવાળી અક્ષો (પંક્તિઓ અને કૉલમ્સ) સાથેનું દ્વિ-પરિમાણીય ટેબ્યુલર ડેટા માળખું છે. બીજી બાજુ, શ્રેણી એ એક-પરિમાણીય લેબલવાળી એરે છે જે કોઈપણ પ્રકારનો ડેટા રાખવા માટે સક્ષમ છે.
ડેટાફ્રેમમાં કૉલમ ઉમેરવા, સંશોધિત કરવા અને કાઢી નાખવા સંબંધિત કેટલાક સામાન્ય પાંડા કાર્યો નીચે મુજબ છે:
- insert(): ચોક્કસ સ્થાન પર કૉલમ દાખલ કરવા માટે.
- છોડો(): ડેટાફ્રેમમાંથી કૉલમ દૂર કરવા.
- નામ બદલો(): ડેટાફ્રેમની કોલમનું નામ બદલવા માટે.
- સોંપો(): અભિવ્યક્તિના પરિણામના આધારે નવી કૉલમ બનાવવા માટે.
તેથી, Pandas DataFrameમાં નવી કૉલમ ઉમેરવાનું સરળ અને કાર્યક્ષમ છે. આ લેખમાં, અમે ડિફોલ્ટ મૂલ્ય સાથે નવી કૉલમ ઉમેરવાની મૂળભૂત પદ્ધતિને આવરી લીધી છે અને તેમાં સમાવિષ્ટ પગલાંઓ માટે વિગતવાર સ્પષ્ટતા પ્રદાન કરી છે. અમે પાંડાને એક શક્તિશાળી ડેટા મેનીપ્યુલેશન લાઇબ્રેરી તરીકે પણ રજૂ કર્યા છે અને ડેટાફ્રેમ કૉલમના સંચાલન માટે કેટલાક સંબંધિત કાર્યોની ચર્ચા કરી છે. આ તકનીકોમાં નિપુણતા પ્રાપ્ત કરીને, તમે પાયથોનમાં ડેટા પ્રોસેસિંગ કાર્યોની વિશાળ શ્રેણીને હેન્ડલ કરવા માટે સારી રીતે સજ્જ હશો.