ಪರಿಹರಿಸಲಾಗಿದೆ: ಪಾಂಡಾಗಳಲ್ಲಿನ ಎಲ್ಲಾ ಕಾಲಮ್‌ಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿ

ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ ಜಗತ್ತಿನಲ್ಲಿ, ದೊಡ್ಡ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ನಿರ್ವಹಿಸುವುದು ಬೆದರಿಸುವ ಕೆಲಸವಾಗಿದೆ. ಸಂಬಂಧಿತ ಮಾಹಿತಿಯನ್ನು ಪಡೆಯಲು ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡುವುದು ಈ ಪ್ರಕ್ರಿಯೆಯ ಪ್ರಮುಖ ಭಾಗಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ. ಪೈಥಾನ್‌ಗೆ ಬಂದಾಗ, ಶಕ್ತಿಯುತ ಗ್ರಂಥಾಲಯ ಪಾಂಡಾಗಳು ನಮ್ಮ ಸಹಾಯಕ್ಕೆ ಬರುತ್ತದೆ. ಈ ಲೇಖನದಲ್ಲಿ, ನಾವು ಚರ್ಚಿಸುತ್ತೇವೆ ಪಾಂಡಾಸ್ ಡೇಟಾಫ್ರೇಮ್‌ನಲ್ಲಿ ಎಲ್ಲಾ ಕಾಲಮ್‌ಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡುವುದು ಹೇಗೆ. ನಾವು ಕೋಡ್‌ನ ಹಂತ-ಹಂತದ ವಿವರಣೆಯ ಮೂಲಕ ಹೋಗುತ್ತೇವೆ ಮತ್ತು ಇದೇ ರೀತಿಯ ಸಮಸ್ಯೆಗಳಿಗೆ ಬಳಸಬಹುದಾದ ಲೈಬ್ರರಿಗಳು ಮತ್ತು ಕಾರ್ಯಗಳ ಆಳವಾದ ತಿಳುವಳಿಕೆಯನ್ನು ಒದಗಿಸುತ್ತೇವೆ.

ಪಾಂಡಾಗಳನ್ನು ಪರಿಚಯಿಸಲಾಗುತ್ತಿದೆ

ಪೈಥಾನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಭಾಷೆಗಾಗಿ ಬಳಸಲು ಸುಲಭವಾದ ಡೇಟಾ ರಚನೆಗಳು ಮತ್ತು ಡೇಟಾ ವಿಶ್ಲೇಷಣಾ ಸಾಧನಗಳನ್ನು ಒದಗಿಸುವ ತೆರೆದ ಮೂಲ ಗ್ರಂಥಾಲಯವಾಗಿದೆ. ಇದು ಡೇಟಾ ವಿಜ್ಞಾನ ಪರಿಸರ ವ್ಯವಸ್ಥೆಯಲ್ಲಿ ಮಹತ್ವದ ಪಾತ್ರವನ್ನು ವಹಿಸುತ್ತದೆ ಮತ್ತು ಪೈಥಾನ್‌ನೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವ ಯಾವುದೇ ಡೇಟಾ ವಿಜ್ಞಾನಿ ಅಥವಾ ವಿಶ್ಲೇಷಕರಿಗೆ-ಹೊಂದಿರಬೇಕು ಸಾಧನವಾಗಿದೆ. ಅದರ ವೈಶಿಷ್ಟ್ಯಗಳಲ್ಲಿ, ಪಾಂಡಾಗಳು ಎರಡು ಪ್ರಾಥಮಿಕ ಡೇಟಾ ರಚನೆಗಳನ್ನು ನೀಡುತ್ತವೆ: ಡೇಟಾ ಫ್ರೇಮ್ ಮತ್ತು ಸರಣಿ. ಡೇಟಾಫ್ರೇಮ್ ಎಂಬುದು ಲೇಬಲ್ ಮಾಡಲಾದ ಅಕ್ಷಗಳನ್ನು (ಸಾಲುಗಳು ಮತ್ತು ಕಾಲಮ್‌ಗಳು) ಹೊಂದಿರುವ ಎರಡು ಆಯಾಮದ ಕೋಷ್ಟಕವಾಗಿದೆ, ಆದರೆ ಸರಣಿಯು ಒಂದು ಆಯಾಮದ ಲೇಬಲ್ ಮಾಡಲಾದ ಸರಣಿಯಾಗಿದೆ.

ಈ ಲೇಖನಕ್ಕಾಗಿ, ನಾವು ಪಾಂಡಾಸ್ ಡೇಟಾಫ್ರೇಮ್‌ನ ಯಾವುದೇ ಕಾಲಮ್‌ನಲ್ಲಿರುವ ನಿರ್ದಿಷ್ಟ ಮೌಲ್ಯಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡುವುದರ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತೇವೆ. ಇದನ್ನು ಮಾಡಲು, ನಾವು ಪಾಂಡಾಗಳನ್ನು ಬಳಸುತ್ತೇವೆ .isin() ಬೂಲಿಯನ್ ಮರೆಮಾಚುವಿಕೆಯೊಂದಿಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.

ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲಾಗುತ್ತಿದೆ

ಪಾಂಡಾಗಳಲ್ಲಿ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲು, ಈ ಹಂತಗಳನ್ನು ಅನುಸರಿಸಿ:

1. ಪಾಂಡಾಗಳ ಲೈಬ್ರರಿಯನ್ನು ಆಮದು ಮಾಡಿ
2. ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸಿ ಅಥವಾ ಫೈಲ್‌ನಿಂದ ಅದನ್ನು ಲೋಡ್ ಮಾಡಿ
3. ನೀವು ಫಿಲ್ಟರ್ ಮಾಡಲು ಬಯಸುವ ಮೌಲ್ಯಗಳನ್ನು ವಿವರಿಸಿ
4. `.isin()` ಫಂಕ್ಷನ್ ಮತ್ತು ಬೂಲಿಯನ್ ಮಾಸ್ಕಿಂಗ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಫಿಲ್ಟರ್ ಅನ್ನು ಅನ್ವಯಿಸಿ
5. ಫಿಲ್ಟರ್ ಮಾಡಿದ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ಪ್ರದರ್ಶಿಸಿ

ಅದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಕೋಡ್‌ಗೆ ಧುಮುಕೋಣ.

import pandas as pd

# Creating a DataFrame
data = {'Column1': [1, 2, 3, 4, 5],
        'Column2': [10, 20, 30, 40, 50],
        'Column3': ['A', 'B', 'A', 'B', 'A']}
df = pd.DataFrame(data)

# Define the values to filter
filter_values = [1, 3, 5, 'A']

# Apply the filter using .isin() and boolean masking
filtered_df = df[df.isin(filter_values).any(axis=1)]

# Display the filtered DataFrame
print(filtered_df)

ಈ ಉದಾಹರಣೆಯಲ್ಲಿ, ನಾವು ಮೊದಲು ಪಾಂಡಾಗಳ ಲೈಬ್ರರಿಯನ್ನು ಆಮದು ಮಾಡಿಕೊಳ್ಳುತ್ತೇವೆ ಮತ್ತು ಮೂರು ಕಾಲಮ್‌ಗಳೊಂದಿಗೆ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸುತ್ತೇವೆ. ನಾವು ಫಿಲ್ಟರ್ ಮಾಡಲು ಬಯಸುವ ಮೌಲ್ಯಗಳನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುತ್ತೇವೆ (1, 3, 5, ಮತ್ತು 'A') ಮತ್ತು ಬೂಲಿಯನ್ ಮರೆಮಾಚುವಿಕೆಯೊಂದಿಗೆ ಸಂಯೋಜಿಸಲಾದ `.isin()` ಕಾರ್ಯವನ್ನು ಬಳಸಿಕೊಂಡು ಫಿಲ್ಟರ್ ಅನ್ನು ಅನ್ವಯಿಸುತ್ತೇವೆ. ಒಂದು ಸಾಲಿನೊಳಗೆ ಯಾವುದೇ ಮೌಲ್ಯವು ಫಿಲ್ಟರಿಂಗ್ ಮಾನದಂಡಗಳನ್ನು ಪೂರೈಸುತ್ತದೆಯೇ ಎಂದು `ಯಾವುದೇ(ಅಕ್ಷ=1)` ಕಾರ್ಯವು ಪರಿಶೀಲಿಸುತ್ತದೆ. ಅಂತಿಮವಾಗಿ, ನಾವು ಫಿಲ್ಟರ್ ಮಾಡಿದ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ಮುದ್ರಿಸುತ್ತೇವೆ.

.isin() ಕಾರ್ಯ ಮತ್ತು ಬೂಲಿಯನ್ ಮರೆಮಾಚುವಿಕೆ

ನಮ್ಮ .isin() ಪಾಂಡಾಗಳಲ್ಲಿನ ಕಾರ್ಯವು ಪಟ್ಟಿ ಅಥವಾ ಮೌಲ್ಯಗಳ ಗುಂಪಿನ ಆಧಾರದ ಮೇಲೆ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲು ಬಹುಮುಖ ಸಾಧನವಾಗಿದೆ. ಇದು ಮೂಲ ಆಕಾರದ ಅದೇ ಆಕಾರದ ಬೂಲಿಯನ್ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ, ಒದಗಿಸಿದ ಪಟ್ಟಿ ಅಥವಾ ಸೆಟ್‌ನಲ್ಲಿ ಯಾವ ಅಂಶಗಳು ಇರುತ್ತವೆ ಎಂಬುದನ್ನು ಸೂಚಿಸುತ್ತದೆ. ನಮ್ಮ ಸಂದರ್ಭದಲ್ಲಿ, ನಾವು ಫಿಲ್ಟರ್ ಮಾಡಲು ಬಯಸುವ ಮೌಲ್ಯಗಳ ಪಟ್ಟಿಯನ್ನು ನಾವು ರವಾನಿಸುತ್ತೇವೆ.

ಬೂಲಿಯನ್ ಮರೆಮಾಚುವಿಕೆ ಎಂಬುದು ಪಾಂಡಾಗಳಲ್ಲಿ ಡೇಟಾದ ಅಂಶ-ವಾರು ಫಿಲ್ಟರಿಂಗ್‌ಗೆ ಬಳಸುವ ತಂತ್ರವಾಗಿದೆ. ಅದರ ಅಂಶಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲು ಡೇಟಾ ರಚನೆಗೆ ಬೂಲಿಯನ್ ಮುಖವಾಡವನ್ನು (ಸರಿ ಮತ್ತು ತಪ್ಪು ಮೌಲ್ಯಗಳ ಒಂದು ಶ್ರೇಣಿ) ಅನ್ವಯಿಸುವುದನ್ನು ಇದು ಒಳಗೊಂಡಿದೆ. ನಮ್ಮ ಸಮಸ್ಯೆಯ ಸಂದರ್ಭದಲ್ಲಿ, ನಾವು ಬಯಸಿದ ಮೌಲ್ಯಗಳನ್ನು ಹೊಂದಿರುವ ಸಾಲುಗಳನ್ನು ಹಿಂಪಡೆಯಲು .isin() ಕಾರ್ಯದ ಜೊತೆಗೆ ಬೂಲಿಯನ್ ಮರೆಮಾಚುವಿಕೆಯನ್ನು ಬಳಸುತ್ತೇವೆ.

ಪಾಂಡಾಗಳ ಲೈಬ್ರರಿ, ಡೇಟಾಫ್ರೇಮ್ ರಚನೆಗಳು ಮತ್ತು .isin() ಕಾರ್ಯದ ಸ್ಪಷ್ಟ ತಿಳುವಳಿಕೆಯೊಂದಿಗೆ, ನಾವು ಯಾವುದೇ ಪಾಂಡಾಗಳ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಫಿಲ್ಟರ್ ಮಾಡಬಹುದು. ಈ ತಂತ್ರಗಳು ನಮಗೆ ದೊಡ್ಡ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ಮತ್ತು ಅಮೂಲ್ಯವಾದ ಒಳನೋಟಗಳನ್ನು ಸುಲಭವಾಗಿ ಹೊರತೆಗೆಯಲು ಅನುಮತಿಸುತ್ತದೆ, ಪೈಥಾನ್‌ನಲ್ಲಿ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಗಾಗಿ ಪಾಂಡಾಗಳನ್ನು ಗೋ-ಟು ಲೈಬ್ರರಿಯನ್ನಾಗಿ ಮಾಡುತ್ತದೆ.

ಸಂಬಂಧಿತ ಪೋಸ್ಟ್ಗಳು:

ಒಂದು ಕಮೆಂಟನ್ನು ಬಿಡಿ