હલ: પંડામાં તમામ કૉલમ ફિલ્ટર કરો

ડેટા વિશ્લેષણની દુનિયામાં, મોટા ડેટાસેટ્સને હેન્ડલ કરવું મુશ્કેલ કાર્ય હોઈ શકે છે. આ પ્રક્રિયાના આવશ્યક ભાગોમાંનું એક સંબંધિત માહિતી મેળવવા માટે ડેટાને ફિલ્ટર કરવાનું છે. જ્યારે પાયથોનની વાત આવે છે, ત્યારે શક્તિશાળી પુસ્તકાલય પંડાસ અમારી મદદ માટે આવે છે. આ લેખમાં, અમે ચર્ચા કરીશું પાંડા ડેટાફ્રેમમાં બધી કૉલમ કેવી રીતે ફિલ્ટર કરવી. અમે કોડના પગલા-દર-પગલા સમજૂતીમાંથી પસાર થઈશું અને સમાન સમસ્યાઓ માટે ઉપયોગમાં લઈ શકાય તેવી લાઇબ્રેરીઓ અને કાર્યોની ઊંડી સમજ આપીશું.

પાંડાનો પરિચય

એક ઓપન-સોર્સ લાઇબ્રેરી છે જે પાયથોન પ્રોગ્રામિંગ ભાષા માટે ઉપયોગમાં સરળ ડેટા સ્ટ્રક્ચર્સ અને ડેટા વિશ્લેષણ સાધનો પ્રદાન કરે છે. તે ડેટા સાયન્સ ઇકોસિસ્ટમમાં નોંધપાત્ર ભૂમિકા ભજવે છે અને પાયથોન સાથે કામ કરતા કોઈપણ ડેટા વૈજ્ઞાનિક અથવા વિશ્લેષક માટે તે એક આવશ્યક સાધન બની ગયું છે. તેની વિશેષતાઓમાં, પાંડા બે પ્રાથમિક ડેટા સ્ટ્રક્ચર ઓફર કરે છે: ડેટાફ્રેમ અને સિરીઝ. ડેટાફ્રેમ એ લેબલવાળી અક્ષો (પંક્તિઓ અને કૉલમ્સ) સાથેનું દ્વિ-પરિમાણીય કોષ્ટક છે, જ્યારે શ્રેણી એ એક-પરિમાણીય લેબલવાળી એરે છે.

આ લેખ માટે, અમે પાંડા ડેટાફ્રેમની કોઈપણ કૉલમમાં હાજર ચોક્કસ મૂલ્યોને ફિલ્ટર કરવા પર ધ્યાન કેન્દ્રિત કરીશું. આ કરવા માટે, અમે પાંડાનો ઉપયોગ કરીશું .મા છે() બુલિયન માસ્કિંગ સાથે કાર્ય.

ડેટાફ્રેમ ફિલ્ટર કરી રહ્યું છે

પાંડામાં ડેટાફ્રેમ ફિલ્ટર કરવા માટે, આ પગલાં અનુસરો:

1. પાંડા લાઇબ્રેરી આયાત કરો
2. ડેટાફ્રેમ બનાવો અથવા તેને ફાઇલમાંથી લોડ કરો
3. તમે ફિલ્ટર કરવા માંગો છો તે મૂલ્યોને વ્યાખ્યાયિત કરો
4. `.isin()` ફંક્શન અને બુલિયન માસ્કિંગનો ઉપયોગ કરીને ફિલ્ટર લાગુ કરો
5. ફિલ્ટર કરેલ ડેટાફ્રેમ દર્શાવો

ચાલો તે કેવી રીતે કાર્ય કરે છે તે સમજવા માટે કોડમાં ડાઇવ કરીએ.

import pandas as pd

# Creating a DataFrame
data = {'Column1': [1, 2, 3, 4, 5],
        'Column2': [10, 20, 30, 40, 50],
        'Column3': ['A', 'B', 'A', 'B', 'A']}
df = pd.DataFrame(data)

# Define the values to filter
filter_values = [1, 3, 5, 'A']

# Apply the filter using .isin() and boolean masking
filtered_df = df[df.isin(filter_values).any(axis=1)]

# Display the filtered DataFrame
print(filtered_df)

આ ઉદાહરણમાં, આપણે સૌપ્રથમ pandas લાઇબ્રેરી આયાત કરીએ છીએ અને ત્રણ કૉલમ સાથે ડેટાફ્રેમ બનાવીએ છીએ. અમે જે મૂલ્યોને ફિલ્ટર કરવા માગીએ છીએ તે વ્યાખ્યાયિત કરીએ છીએ (1, 3, 5, અને 'A') અને બુલિયન માસ્કિંગ સાથે સંયુક્ત `.isin()` ફંક્શનનો ઉપયોગ કરીને ફિલ્ટર લાગુ કરીએ છીએ. `any(axis=1)` ફંક્શન તપાસે છે કે પંક્તિમાં કોઈપણ મૂલ્ય ફિલ્ટરિંગ માપદંડને પૂર્ણ કરે છે કે કેમ. છેલ્લે, અમે ફિલ્ટર કરેલ ડેટાફ્રેમ પ્રિન્ટ કરીએ છીએ.

.isin() ફંક્શન અને બુલિયન માસ્કીંગ

.મા છે() પાંડામાં ફંક્શન એ સૂચિ અથવા મૂલ્યોના સમૂહના આધારે ડેટા ફિલ્ટર કરવા માટેનું બહુમુખી સાધન છે. તે મૂળની જેમ જ આકારની બુલિયન ડેટાફ્રેમ પરત કરે છે, જે દર્શાવે છે કે પ્રદાન કરેલ સૂચિ અથવા સેટમાં કયા તત્વો હાજર છે. અમારા કિસ્સામાં, અમે મૂલ્યોની સૂચિ પસાર કરીએ છીએ જેને આપણે ફિલ્ટર કરવા માંગીએ છીએ.

બુલિયન માસ્કિંગ એ એક તકનીક છે જેનો ઉપયોગ પાંડામાં ડેટાના તત્વ મુજબના ફિલ્ટરિંગ માટે થાય છે. તે તેના તત્વોને ફિલ્ટર કરવા માટે ડેટા સ્ટ્રક્ચરમાં બુલિયન માસ્ક (સાચા અને ખોટા મૂલ્યોની એરે) લાગુ કરવાનો સમાવેશ કરે છે. અમારી સમસ્યાના સંદર્ભમાં, અમે ઇચ્છિત મૂલ્યો ધરાવતી પંક્તિઓ પુનઃપ્રાપ્ત કરવા માટે .isin() ફંક્શન સાથે બુલિયન માસ્કિંગનો ઉપયોગ કરીએ છીએ.

પાંડા લાઇબ્રેરી, ડેટાફ્રેમ સ્ટ્રક્ચર્સ અને .isin() ફંક્શનની સ્પષ્ટ સમજ સાથે, અમે કોઈપણ પાંડા ડેટાફ્રેમને અસરકારક રીતે ફિલ્ટર કરી શકીએ છીએ. આ તકનીકો અમને મોટા ડેટાસેટ્સનું અન્વેષણ કરવાની અને સરળતા સાથે મૂલ્યવાન આંતરદૃષ્ટિ મેળવવાની મંજૂરી આપે છે, પાયથોનમાં ડેટા વિશ્લેષણ માટે પાંડાને એક ગો-ટૂ લાઇબ્રેરી બનાવે છે.

સંબંધિત પોસ્ટ્સ:

પ્રતિક્રિયા આપો