ઉકેલાયેલ: પાંડાનો ઉપયોગ કરીને કૉલમ નામ દ્વારા શીટમાં સેલ અપડેટ કરો

ડેટા વિશ્લેષણની દુનિયામાં, સ્પ્રેડશીટ્સનો ઉપયોગ સામાન્ય છે, ખાસ કરીને જ્યારે સ્તંભાકાર ફોર્મેટમાં સ્ટ્રક્ચર્ડ ડેટા સાથે કામ કરતી વખતે. પાયથોનમાં સ્પ્રેડશીટ ડેટા સાથે કામ કરવા માટેની લોકપ્રિય લાઇબ્રેરીઓમાંની એક પાંડા છે. આ શક્તિશાળી લાઇબ્રેરી વિકાસકર્તાઓને ટેબ્યુલર ડેટાને સરળતાથી વાંચવા, હેરફેર કરવા અને નિકાસ કરવાની મંજૂરી આપે છે. આ લેખમાં, અમે ચોક્કસ સમસ્યા પર ધ્યાન કેન્દ્રિત કરીશું: Pandas નો ઉપયોગ કરીને કૉલમ નામ દ્વારા શીટમાં કોષોને અપડેટ કરવું. અમે સોલ્યુશનમાં ડૂબકી લગાવીશું, ત્યારબાદ કોડનું પગલું-દર-પગલાં સમજૂતી કરીશું, અને અંતે પાંડામાં સંબંધિત ખ્યાલો અને કાર્યક્ષમતાની ચર્ચા કરીશું, જેમ કે અનુક્રમણિકાઓ સાથે કામ કરવું અને ડેટા પસંદ કરવો. તો, ચાલો શરુ કરીએ.

પાંડાનો ઉપયોગ કરીને કૉલમ નામ દ્વારા કોષોને અપડેટ કરવું

કૉલમના નામ દ્વારા શીટમાં કોષોને અપડેટ કરવા માટે, અમારે પહેલા પાંડા લાઇબ્રેરીને ઇન્સ્ટોલ કરવાની જરૂર છે જો તે નીચેના આદેશનો ઉપયોગ કરીને પહેલાથી ઇન્સ્ટોલ કરેલ નથી:

!pip install pandas

Pandas ઇન્સ્ટોલ સાથે, ચાલો કૉલમ નામ દ્વારા શીટમાં કોષોને અપડેટ કરવાના પગલાંની રૂપરેખા આપીએ:

1. ડેટાફ્રેમ ઑબ્જેક્ટમાં શીટ લોડ કરો.
2. અમે અપડેટ કરવા માંગીએ છીએ તે કોષોને ઍક્સેસ કરો.
3. નવા મૂલ્યો સોંપીને ઇચ્છિત કોષોને સંશોધિત કરો.
4. ડેટાફ્રેમ ઑબ્જેક્ટને શીટ પર પાછા સાચવો.

અહીં એક કોડ સ્નિપેટ છે જે એક સરળ ઉદાહરણ સાથે ઉકેલ દર્શાવે છે:

import pandas as pd

# Load data from a CSV file into a DataFrame object
df = pd.read_csv('your_spreadsheet.csv')

# Access and update the desired cells - let's update column 'Age' by adding 1 to each value
df['Age'] = df['Age'] + 1

# Save the updated DataFrame back to the CSV file
df.to_csv('your_updated_spreadsheet.csv', index=False)

કોડને સમજવું

પહેલું પગલું એ ઉપનામ `pd` હેઠળ પાંડા લાઇબ્રેરીને આયાત કરવાનું છે. આગળ, આપણે CSV ફાઇલમાંથી ડેટાને `pd.read_csv()` ફંક્શનનો ઉપયોગ કરીને ડેટાફ્રેમ ઑબ્જેક્ટમાં લોડ કરવાનો છે, ઇનપુટ ફાઇલ નામ ('your_spreadsheet.csv') નો ઉલ્લેખ કરીને.

હવે સમસ્યાનો મુખ્ય ભાગ આવે છે: ઇચ્છિત કોષોને ઍક્સેસ અને અપડેટ કરવું. આ ઉદાહરણમાં, અમે કૉલમમાં દરેક મૂલ્યમાં 1 ઉમેરીને 'ઉંમર' કૉલમ અપડેટ કરવા માગીએ છીએ. અમે આ 'એજ' કૉલમમાં ફક્ત 1 ઉમેરીને કરીએ છીએ, જે વાક્યરચના `df['Age']` નો ઉપયોગ કરીને ઍક્સેસ કરવામાં આવે છે. આ કોડ 'વય' કૉલમમાં દરેક આઇટમમાં 1 નો ઘટક મુજબ ઉમેરો કરશે.

છેલ્લે, અમે આઉટપુટ ફાઇલ નામ ('your_updated_spreadsheet.csv') સાથે `df.to_csv()` ફંક્શનનો ઉપયોગ કરીને અપડેટ કરેલ ડેટાફ્રેમને CSV ફાઇલમાં પાછા સાચવીએ છીએ. આઉટપુટ ફાઇલમાં પંક્તિ નંબર લખવાનું ટાળવા માટે `ઇન્ડેક્સ=ફોલ્સ` પેરામીટરનો ઉપયોગ થાય છે.

પાંડા અનુક્રમણિકાઓ અને ડેટાની પસંદગી

પાંડા ડેટા પસંદ કરવા અને તેની હેરફેર કરવા માટે ઇન્ડેક્સની વિભાવના પર ખૂબ આધાર રાખે છે. મૂળભૂત રીતે, ફાઇલમાંથી ડેટા લોડ કરતી વખતે, Pandas એ સોંપે છે આંકડાકીય અનુક્રમણિકા ડેટાફ્રેમની દરેક પંક્તિમાં, 0 થી શરૂ થાય છે. પાંડામાં ડેટા સાથે કામ કરતી વખતે, તેની વિવિધ રીતોને સમજવી જરૂરી છે. ડેટાની પસંદગી અને ફિલ્ટરિંગ અનુક્રમણિકા મૂલ્યો અથવા કૉલમ નામો પર આધારિત.

ઉદાહરણ તરીકે, ચોક્કસ પંક્તિ અથવા પંક્તિઓ પસંદ કરવા માટે, તમે `iloc` ઇન્ડેક્સરનો ઉપયોગ કરી શકો છો, જે તમને તેમના પૂર્ણાંક અનુક્રમણિકાના આધારે પંક્તિઓને ઍક્સેસ કરવાની મંજૂરી આપે છે:

# Select the first row of the DataFrame
first_row = df.iloc[0]

# Select rows 1 to 3 (excluding 3)
rows_1_to_2 = df.iloc[1:3]

જ્યારે તમારે ચોક્કસ સ્થિતિના આધારે કોષોને અપડેટ કરવાની જરૂર હોય, જેમ કે માત્ર તે પંક્તિઓ માટે 'ઉંમર' કૉલમ અપડેટ કરવી જ્યાં અન્ય કૉલમ (દા.ત., 'શહેર') ચોક્કસ મૂલ્ય ધરાવે છે, તો તમે બુલિયન ઇન્ડેક્સિંગનો ઉપયોગ કરી શકો છો:

# Update the 'Age' column by adding 1, only for rows where 'City' is equal to 'New York'
df.loc[df['City'] == 'New York', 'Age'] = df['Age'] + 1

આ ઉદાહરણમાં, બુલિયન સ્થિતિના આધારે પંક્તિઓ પસંદ કરવા માટે `loc` ઇન્ડેક્સરનો ઉપયોગ થાય છે, અને પછી 'ઉંમર' કૉલમ અપડેટ થાય છે.

ધ્યાનમાં રાખો કે જ્યારે પાંડામાં ડેટા સાથે કામ કરવાની વાત આવે છે ત્યારે આ ફક્ત આઇસબર્ગની ટોચ છે. લાઇબ્રેરી તમારા ડેટાને અસરકારક રીતે ચાલાકી, વિશ્લેષણ અને વિઝ્યુઅલાઈઝ કરવા માટે ઘણા બધા કાર્યો અને તકનીકો પ્રદાન કરે છે. કૉલમ નામ દ્વારા શીટમાં કોષોને અપડેટ કરવા જેવી મૂળભૂત બાબતોને સમજવી, ભવિષ્યમાં વધુ જટિલ ડેટા સ્ટ્રક્ચર્સ અને વિશ્લેષણ કાર્યો સાથે કામ કરવા માટે મજબૂત પાયો સુયોજિત કરે છે.

સંબંધિત પોસ્ટ્સ:

પ્રતિક્રિયા આપો