ಪರಿಹರಿಸಲಾಗಿದೆ: ಪಾಂಡಾಗಳಲ್ಲಿ ಗರಿಷ್ಠ ವಿಚಲನ

ಜನಪ್ರಿಯ ಪೈಥಾನ್ ಲೈಬ್ರರಿ ಪಾಂಡಾಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಮ್ಯಾನಿಪ್ಯುಲೇಷನ್‌ಗೆ ಬಂದಾಗ ಪಾಂಡಾಗಳಲ್ಲಿನ ಗರಿಷ್ಠ ವಿಚಲನವು ಆಸಕ್ತಿದಾಯಕ ವಿಷಯವಾಗಿದೆ. ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಪ್ರಮುಖ ಅಂಶವೆಂದರೆ ಡೇಟಾದಲ್ಲಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಗುರುತಿಸುವುದು, ಗರಿಷ್ಠ ವಿಚಲನವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುವ ಮೂಲಕ ಇದನ್ನು ಮಾಡಬಹುದು. ಈ ಲೇಖನದಲ್ಲಿ, ಪಾಂಡಾಗಳಲ್ಲಿ ಗರಿಷ್ಠ ವಿಚಲನವನ್ನು ಹೇಗೆ ಲೆಕ್ಕಾಚಾರ ಮಾಡುವುದು, ವಿಭಿನ್ನ ವಿಧಾನಗಳನ್ನು ಅನ್ವೇಷಿಸುವುದು ಮತ್ತು ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ಬಳಸಬಹುದಾದ ಕೆಲವು ಸಂಬಂಧಿತ ಲೈಬ್ರರಿಗಳು ಮತ್ತು ಕಾರ್ಯಗಳನ್ನು ಆಳವಾಗಿ ಪರಿಶೀಲಿಸುವುದು ಹೇಗೆ ಎಂದು ನಾವು ಕಲಿಯುತ್ತೇವೆ.

ಗರಿಷ್ಠ ವಿಚಲನವು ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿನ ಮೌಲ್ಯ ಮತ್ತು ಆ ಡೇಟಾಸೆಟ್‌ನ ಸರಾಸರಿ ಅಥವಾ ಮಧ್ಯದ ನಡುವಿನ ಗರಿಷ್ಠ ವ್ಯತ್ಯಾಸವನ್ನು ಸೂಚಿಸುತ್ತದೆ. ಅಂಕಿಅಂಶಗಳಲ್ಲಿ, ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿನ ಡೇಟಾ ಬಿಂದುಗಳ ಪ್ರಸರಣ ಮತ್ತು ವ್ಯತ್ಯಾಸವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ವಿಚಲನವು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಇದು ಹಣಕಾಸಿನ ವಿಶ್ಲೇಷಣೆ, ಸಂಕೇತ ಸಂಸ್ಕರಣೆ ಮತ್ತು ಇತರ ಪರಿಮಾಣಾತ್ಮಕ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಹೆಚ್ಚಾಗಿ ಬಳಸಲಾಗುವ ಪ್ರಮುಖ ಪರಿಕಲ್ಪನೆಯಾಗಿದೆ.

ಸಮಸ್ಯೆಗೆ ಪರಿಹಾರ

ಪಾಂಡಾಗಳಲ್ಲಿ ಗರಿಷ್ಠ ವಿಚಲನವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಲು, ನಾವು ಅಗತ್ಯ ಲೈಬ್ರರಿಗಳನ್ನು ಆಮದು ಮಾಡಿಕೊಳ್ಳುವ ಮೂಲಕ ಮತ್ತು ಮಾದರಿ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸುವ ಮೂಲಕ ಪ್ರಾರಂಭಿಸಬಹುದು. ನಂತರ, ನಾವು ಡೇಟಾದ ಸರಾಸರಿ ಅಥವಾ ಸರಾಸರಿಯನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುತ್ತೇವೆ ಮತ್ತು ಪ್ರತಿ ಡೇಟಾ ಬಿಂದು ಮತ್ತು ಸರಾಸರಿ/ಮಧ್ಯಮಗಳ ನಡುವಿನ ಗರಿಷ್ಠ ಅಂತರವನ್ನು ಕಂಡುಹಿಡಿಯುತ್ತೇವೆ. ಅಂತಿಮವಾಗಿ, ಈ ಸಂಪೂರ್ಣ ವಿಚಲನಗಳಲ್ಲಿ ಹೆಚ್ಚಿನ ಮೌಲ್ಯವನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಾವು max() ಕಾರ್ಯವನ್ನು ಬಳಸುತ್ತೇವೆ.

ಪಾಂಡಾಸ್ ಡೇಟಾಫ್ರೇಮ್‌ನಲ್ಲಿ ಗರಿಷ್ಠ ವಿಚಲನವನ್ನು ಹೇಗೆ ಲೆಕ್ಕಾಚಾರ ಮಾಡುವುದು ಎಂಬುದನ್ನು ಪ್ರದರ್ಶಿಸುವ ಉದಾಹರಣೆ ಕೋಡ್ ಇಲ್ಲಿದೆ:

import pandas as pd

# Sample data
data = {'Value': [5, 7, 11, 18, 23, 25, 29, 35, 40, 50]}
df = pd.DataFrame(data)

# Compute mean and median
mean = df['Value'].mean()
median = df['Value'].median()

# Calculate absolute deviations from mean and median
df['Mean Deviation'] = (df['Value'] - mean).abs()
df['Median Deviation'] = (df['Value'] - median).abs()

# Find max deviation
max_mean_deviation = df['Mean Deviation'].max()
max_median_deviation = df['Median Deviation'].max()

print("Max Deviation from Mean: ", max_mean_deviation)
print("Max Deviation from Median: ", max_median_deviation)

ಹಂತ-ಹಂತದ ವಿವರಣೆ

ಈಗ ಪಾಂಡಾಸ್ ಡೇಟಾಫ್ರೇಮ್‌ನಲ್ಲಿ ಗರಿಷ್ಠ ವಿಚಲನವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುವ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಹಂತ ಹಂತವಾಗಿ ಕೋಡ್ ಮೂಲಕ ಹೋಗೋಣ:

1. ಮೊದಲಿಗೆ, ನಾವು ಪಾಂಡಾಗಳ ಲೈಬ್ರರಿಯನ್ನು ಆಮದು ಮಾಡಿಕೊಳ್ಳುತ್ತೇವೆ ಮತ್ತು 'ಮೌಲ್ಯ' ಹೆಸರಿನ ಒಂದೇ ಕಾಲಮ್‌ನೊಂದಿಗೆ ಮಾದರಿ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸುತ್ತೇವೆ.

2. ನಂತರ ನಾವು ಪಾಂಡಾಗಳು ಒದಗಿಸಿದ ಸರಾಸರಿ () ಮತ್ತು ಮಧ್ಯದ () ಕಾರ್ಯಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಡೇಟಾದ ಸರಾಸರಿ ಮತ್ತು ಸರಾಸರಿಯನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುತ್ತೇವೆ.

3. ಮುಂದೆ, ನಾವು ಆಯಾ ಡೇಟಾ ಪಾಯಿಂಟ್‌ಗಳಿಂದ ಸರಾಸರಿ ಮತ್ತು ಸರಾಸರಿಯನ್ನು ಕಳೆಯುವ ಮೂಲಕ ಪ್ರತಿ ಡೇಟಾ ಬಿಂದುಗಳಿಗೆ ಸಂಪೂರ್ಣ ವಿಚಲನಗಳನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುತ್ತೇವೆ ಮತ್ತು ಫಲಿತಾಂಶದ ವ್ಯತ್ಯಾಸಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತೇವೆ.

4. ಅಂತಿಮವಾಗಿ, ಸಂಪೂರ್ಣ ವಿಚಲನಗಳಲ್ಲಿ ಗರಿಷ್ಠ ಮೌಲ್ಯವನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಾವು max() ಕಾರ್ಯವನ್ನು ಬಳಸುತ್ತೇವೆ.

5. ಔಟ್‌ಪುಟ್ ಡೇಟಾಸೆಟ್‌ನ ಸರಾಸರಿ ಮತ್ತು ಮೀಡಿಯನ್ ಎರಡರಿಂದಲೂ ಗರಿಷ್ಠ ವಿಚಲನವನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ.

ಸಂಬಂಧಿತ ಗ್ರಂಥಾಲಯಗಳು ಮತ್ತು ಕಾರ್ಯಗಳು

  • ಪಾಂಡರು: ಇದು ಈ ಲೇಖನದಲ್ಲಿ ಬಳಸಲಾದ ಪ್ರಾಥಮಿಕ ಲೈಬ್ರರಿಯಾಗಿದೆ ಮತ್ತು ಅದರ ಶಕ್ತಿಯುತ ಡೇಟಾ ಮ್ಯಾನಿಪ್ಯುಲೇಷನ್ ಸಾಮರ್ಥ್ಯಗಳಿಗಾಗಿ ಇದು ವ್ಯಾಪಕವಾಗಿ ಗುರುತಿಸಲ್ಪಟ್ಟಿದೆ. ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ಫಂಕ್ಷನ್‌ಗಳಾದ ಮೀನ್(), ಮೀಡಿಯನ್(), ಮ್ಯಾಕ್ಸ್(), ನಿಮಿಷ(), ಮತ್ತು ಎಬಿಎಸ್() ಪಾಂಡಾಸ್ ಲೈಬ್ರರಿಯ ಭಾಗವಾಗಿದೆ.
  • numPy: ಇದು ಪೈಥಾನ್‌ನಲ್ಲಿನ ಮತ್ತೊಂದು ಜನಪ್ರಿಯ ಸಂಖ್ಯಾತ್ಮಕ ಕಂಪ್ಯೂಟಿಂಗ್ ಲೈಬ್ರರಿಯಾಗಿದ್ದು, ಅರೇಗಳು ಮತ್ತು ಸಂಖ್ಯಾತ್ಮಕ ಕಾರ್ಯಾಚರಣೆಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು ವ್ಯಾಪಕ ಬೆಂಬಲವನ್ನು ನೀಡುತ್ತದೆ. ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ, ಪಾಂಡಾಗಳೊಂದಿಗೆ ಒಂದೇ ರೀತಿಯ ಕಾರ್ಯಗಳನ್ನು ಸಾಧಿಸಲು ಒಬ್ಬರು NumPy ಕಾರ್ಯಗಳನ್ನು ಬಳಸಬಹುದು.

ತೀರ್ಮಾನಕ್ಕೆ ರಲ್ಲಿ

ಪಾಂಡಾಸ್‌ನಲ್ಲಿನ ಗರಿಷ್ಠ ವಿಚಲನವನ್ನು ಗುರುತಿಸುವುದು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ ಪ್ರಮುಖ ಅಂಶವಾಗಿದೆ, ಇದು ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ಪ್ರಸರಣವನ್ನು ಅಳೆಯಲು ನಿಮಗೆ ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ ಮತ್ತು ಈ ಕಾರ್ಯವನ್ನು ನಿರ್ವಹಿಸಲು ನೇರವಾದ ವಿಧಾನವನ್ನು ಈ ಲೇಖನವು ವಿವರಿಸಿದೆ. ಸರಾಸರಿ(), ಮೀಡಿಯನ್(), ಎಬಿಎಸ್(), ಮತ್ತು ಮ್ಯಾಕ್ಸ್() ನಂತಹ ಪಾಂಡಾಸ್ ಫಂಕ್ಷನ್‌ಗಳ ಬಳಕೆಯ ಮೂಲಕ, ಯಾವುದೇ ಡೇಟಾಸೆಟ್‌ಗೆ ಗರಿಷ್ಠ ವಿಚಲನವನ್ನು ಸಮರ್ಥವಾಗಿ ಲೆಕ್ಕಾಚಾರ ಮಾಡಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಇದಲ್ಲದೆ, NumPy ನಂತಹ ಲೈಬ್ರರಿಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಇದೇ ರೀತಿಯ ಕಾರ್ಯಾಚರಣೆಗಳು ಮತ್ತು ಕಾರ್ಯವನ್ನು ಸಾಧಿಸಬಹುದು, ಇದು ಡೆವಲಪರ್‌ಗೆ ಲಭ್ಯವಿರುವ ಡೇಟಾ ಮ್ಯಾನಿಪ್ಯುಲೇಷನ್ ತಂತ್ರಗಳ ವ್ಯಾಪ್ತಿಯನ್ನು ಪೂರಕಗೊಳಿಸುತ್ತದೆ ಮತ್ತು ವಿಸ್ತರಿಸುತ್ತದೆ.

ಸಂಬಂಧಿತ ಪೋಸ್ಟ್ಗಳು:

ಒಂದು ಕಮೆಂಟನ್ನು ಬಿಡಿ