ಪಾಂಡಾಸ್ ಒಂದು ಓಪನ್ ಸೋರ್ಸ್ ಪೈಥಾನ್ ಲೈಬ್ರರಿಯಾಗಿದ್ದು ಅದು ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆ, ಬಳಸಲು ಸುಲಭವಾದ ಡೇಟಾ ರಚನೆಗಳು ಮತ್ತು ಡೇಟಾ ವಿಶ್ಲೇಷಣಾ ಸಾಧನಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಡೇಟಾ ಮ್ಯಾನಿಪ್ಯುಲೇಷನ್ ಮತ್ತು ವಿಶ್ಲೇಷಣೆಗೆ ಬಂದಾಗ ಡೆವಲಪರ್ಗಳು ಮತ್ತು ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳಿಗೆ ಇದು ಒಂದು ಆಯ್ಕೆಯಾಗಿದೆ. ಪಾಂಡಾಗಳು ಒದಗಿಸಿದ ಪ್ರಬಲ ವೈಶಿಷ್ಟ್ಯವೆಂದರೆ ಡೇಟಾಫ್ರೇಮ್ಗಳನ್ನು ರಚಿಸುವುದು ಮತ್ತು ಮಾರ್ಪಡಿಸುವುದು. ಈ ಲೇಖನದಲ್ಲಿ, ಪಾಂಡಾಸ್ ಲೈಬ್ರರಿಯನ್ನು ಬಳಸಿಕೊಂಡು ಡೇಟಾಫ್ರೇಮ್ಗೆ ಅನೇಕ ಕಾಲಮ್ಗಳು ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲದಿದ್ದರೆ ಸೇರಿಸುವ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನಾವು ಅನ್ವೇಷಿಸುತ್ತೇವೆ. ನಾವು ಕೋಡ್ನ ಹಂತ-ಹಂತದ ವಿವರಣೆಯ ಮೂಲಕ ನಡೆಯುತ್ತೇವೆ ಮತ್ತು ಸಂಬಂಧಿತ ಕಾರ್ಯಗಳು, ಲೈಬ್ರರಿಗಳು ಮತ್ತು ನೀವು ದಾರಿಯುದ್ದಕ್ಕೂ ಎದುರಿಸಬಹುದಾದ ಸಮಸ್ಯೆಗಳಿಗೆ ಧುಮುಕುತ್ತೇವೆ.
ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುವಾಗ ಡೇಟಾಫ್ರೇಮ್ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು ಬಹುಮುಖ್ಯವಾಗಿದೆ ಮತ್ತು ಡೇಟಾಫ್ರೇಮ್ಗೆ ಏಕಕಾಲದಲ್ಲಿ ನೀವು ಅನೇಕ ಕಾಲಮ್ಗಳನ್ನು ಸೇರಿಸಬೇಕಾದ ಪರಿಸ್ಥಿತಿಯಲ್ಲಿ ನಿಮ್ಮನ್ನು ನೀವು ಕಂಡುಕೊಳ್ಳಬಹುದು. ಇದು ಟ್ರಿಕಿ ಆಗಿರಬಹುದು, ಆದರೆ ಪಾಂಡಾಸ್ ಲೈಬ್ರರಿಯು ಈ ಕಾರ್ಯವನ್ನು ಸುಗಮ ಮತ್ತು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಮಾಡುತ್ತದೆ. ಮೊದಲಿಗೆ, ಪಾಂಡಾಸ್ ಲೈಬ್ರರಿಯನ್ನು ಆಮದು ಮಾಡಿಕೊಳ್ಳುವ ಮೂಲಕ ಪ್ರಾರಂಭಿಸೋಣ:
import pandas as pd
ಪರಿವಿಡಿ
ಪಾಂಡಾಸ್ ಡೇಟಾಫ್ರೇಮ್ಗೆ ಬಹು ಕಾಲಮ್ಗಳನ್ನು ಸೇರಿಸಲಾಗುತ್ತಿದೆ
ಡೇಟಾಫ್ರೇಮ್ಗೆ ಬಹು ಕಾಲಮ್ಗಳನ್ನು ಸೇರಿಸಲು, ನಾವು DataFrame.assign() ವಿಧಾನವನ್ನು ಬಳಸಬಹುದು. ಈ ವಿಧಾನವು ಡೇಟಾಫ್ರೇಮ್ಗೆ ಒಂದು ಅಥವಾ ಹಲವಾರು ಕಾಲಮ್ಗಳನ್ನು ಏಕಕಾಲದಲ್ಲಿ ಸೇರಿಸಲು ನಮಗೆ ಅನುಮತಿಸುತ್ತದೆ. ಮಾದರಿ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸೋಣ ಮತ್ತು ಅವು ಈಗಾಗಲೇ ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲದಿದ್ದರೆ ಅದಕ್ಕೆ ಬಹು ಕಾಲಮ್ಗಳನ್ನು ಸೇರಿಸೋಣ:
# Create a sample dataframe data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]} df = pd.DataFrame(data) # Add multiple columns if they do not exist new_columns = ['column3', 'column4'] for new_col in new_columns: if new_col not in df.columns: df[new_col] = None
ರಲ್ಲಿ ಮೇಲಿನ ಕೋಡ್ ತುಣುಕು, ನಾವು ಮೊದಲು ಎರಡು ಕಾಲಮ್ಗಳೊಂದಿಗೆ ಮಾದರಿ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸುತ್ತೇವೆ, 'ಕಾಲಮ್1' ಮತ್ತು 'ಕಾಲಮ್2'. ನಂತರ ನಾವು ಡೇಟಾಫ್ರೇಮ್ಗೆ ಸೇರಿಸಲು ಬಯಸುವ ಹೊಸ ಕಾಲಮ್ಗಳ ಪಟ್ಟಿಯನ್ನು ರಚಿಸುತ್ತೇವೆ, 'column3' ಮತ್ತು 'column4'. ಅಂತಿಮವಾಗಿ, ನಾವು ಕಾಲಮ್ಗಳ ಪಟ್ಟಿಯ ಮೂಲಕ ಪುನರಾವರ್ತಿಸುತ್ತೇವೆ ಮತ್ತು ಡೇಟಾಫ್ರೇಮ್ನಲ್ಲಿ ಈಗಾಗಲೇ ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲದಿದ್ದರೆ ಹೊಸ ಕಾಲಮ್ ಅನ್ನು ಸೇರಿಸುತ್ತೇವೆ.
ಹಂತ-ಹಂತದ ವಿವರಣೆ
ಹಂತ ಹಂತವಾಗಿ ಇಲ್ಲಿದೆ ಪ್ರತಿ ಭಾಗದ ವಿವರಣೆ ನಮ್ಮ ಪರಿಹಾರ:
1. ನಾವು ಪಾಂಡಾಗಳ ಲೈಬ್ರರಿಯನ್ನು "ಆಮದು ಪಾಂಡಾಗಳನ್ನು ಪಿಡಿಯಾಗಿ" ಆಮದು ಮಾಡಿಕೊಳ್ಳುವ ಮೂಲಕ ಪ್ರಾರಂಭಿಸುತ್ತೇವೆ.
2. ಮುಂದೆ, ನಾವು ಎರಡು ಕಾಲಮ್ಗಳೊಂದಿಗೆ 'df' ಎಂಬ ಮಾದರಿ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸುತ್ತೇವೆ: 'column1' ಮತ್ತು 'column2'.
3. ಡೇಟಾಫ್ರೇಮ್ಗೆ ನಾವು ಸೇರಿಸಲು ಬಯಸುವ ಹೊಸ ಕಾಲಮ್ಗಳ ಪಟ್ಟಿಯನ್ನು ನಾವು ರಚಿಸುತ್ತೇವೆ - 'column3' ಮತ್ತು 'column4'.
4. ಹೊಸ ಕಾಲಮ್ಗಳ ಪಟ್ಟಿಯ ಮೂಲಕ ಪುನರಾವರ್ತಿಸಲು ನಾವು ಲೂಪ್ ಅನ್ನು ಬಳಸುತ್ತೇವೆ.
5. ಲೂಪ್ನಲ್ಲಿ, 'ಇಲ್ಲ' ಸ್ಥಿತಿಯನ್ನು ಬಳಸಿಕೊಂಡು ಡೇಟಾಫ್ರೇಮ್ನಲ್ಲಿ ಹೊಸ ಕಾಲಮ್ ಈಗಾಗಲೇ ಅಸ್ತಿತ್ವದಲ್ಲಿದೆಯೇ ಎಂದು ನಾವು ಪರಿಶೀಲಿಸುತ್ತೇವೆ. ಹೊಸ ಕಾಲಮ್ ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲದಿದ್ದರೆ, ಯಾವುದೂ ಇಲ್ಲ ಎಂಬ ಡೀಫಾಲ್ಟ್ ಮೌಲ್ಯದೊಂದಿಗೆ ನಾವು ಹೊಸ ಕಾಲಮ್ ಅನ್ನು ಡೇಟಾಫ್ರೇಮ್ಗೆ ಸೇರಿಸುತ್ತೇವೆ.
ಪಾಂಡಾಗಳ ಕಾರ್ಯಗಳು ಮತ್ತು ಗ್ರಂಥಾಲಯಗಳು
ಪಾಂಡಾಗಳು ಡೇಟಾಫ್ರೇಮ್ಗಳ ನಿರ್ವಹಣೆ ಮತ್ತು ಮ್ಯಾನಿಪ್ಯುಲೇಟಿಂಗ್ ಅನ್ನು ಸರಳಗೊಳಿಸುವ ಕಾರ್ಯಗಳು ಮತ್ತು ವಿಧಾನಗಳ ವ್ಯಾಪಕ ಶ್ರೇಣಿಯನ್ನು ನೀಡುತ್ತದೆ. ನಮ್ಮ ಪರಿಹಾರದಲ್ಲಿ, ನಾವು ಈ ಕೆಳಗಿನ ಪ್ರಮುಖ ಅಂಶಗಳನ್ನು ಬಳಸಿದ್ದೇವೆ:
- ಡೇಟಾ ಫ್ರೇಮ್ - ಪಾಂಡಾಗಳಲ್ಲಿ ಪ್ರಾಥಮಿಕ ದತ್ತಾಂಶ ರಚನೆಯಾಗಿ, ಡೇಟಾಫ್ರೇಮ್ ಎರಡು ಆಯಾಮದ, ರೂಪಾಂತರಗೊಳ್ಳುವ, ಲೇಬಲ್ ಮಾಡಲಾದ ಅಕ್ಷಗಳೊಂದಿಗೆ (ಸಾಲುಗಳು ಮತ್ತು ಕಾಲಮ್ಗಳು) ಸಂಭಾವ್ಯವಾಗಿ ವೈವಿಧ್ಯಮಯ ಕೋಷ್ಟಕ ಡೇಟಾವಾಗಿದೆ.
- DataFrame.columns - ಈ ಗುಣಲಕ್ಷಣವು ಡೇಟಾಫ್ರೇಮ್ನ ಕಾಲಮ್ ಲೇಬಲ್ಗಳನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ, ಕಾಲಮ್ ಅಸ್ತಿತ್ವದಲ್ಲಿದೆಯೇ ಅಥವಾ ಇಲ್ಲವೇ ಎಂಬುದನ್ನು ಪ್ರವೇಶಿಸಲು ಮತ್ತು ಪರಿಶೀಲಿಸಲು ನಮಗೆ ಅನುಮತಿಸುತ್ತದೆ.
- pd.DataFrame() - ಇದು ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸಲು ಕನ್ಸ್ಟ್ರಕ್ಟರ್ ಕಾರ್ಯವಾಗಿದೆ. ರಚನೆಯ ಸಮಯದಲ್ಲಿ ಡೇಟಾ ಮತ್ತು ಕಾಲಮ್ ಹೆಸರುಗಳನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಲು ಇದು ನಿಮ್ಮನ್ನು ಅನುಮತಿಸುತ್ತದೆ.
ಈಗ ನೀವು ಹೇಗೆ ಮಾಡಬೇಕೆಂದು ಚೆನ್ನಾಗಿ ಅರ್ಥಮಾಡಿಕೊಂಡಿದ್ದೀರಿ ಬಹು ಕಾಲಮ್ಗಳನ್ನು ಸೇರಿಸಿ ಪಾಂಡಾಸ್ ಡೇಟಾಫ್ರೇಮ್ಗೆ, ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ನಿರ್ವಹಿಸಲು ಮತ್ತು ಕುಶಲತೆಯಿಂದ ನಿರ್ವಹಿಸಲು ಈ ತಂತ್ರವು ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಕುಶಲತೆಗಾಗಿ ಪಾಂಡಾಗಳು ಹಲವಾರು ಇತರ ಪ್ರಬಲ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ನೀಡುತ್ತದೆ ಎಂಬುದನ್ನು ನೆನಪಿಡಿ, ಆದ್ದರಿಂದ ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿ ಪೈಥಾನ್ ಡೆವಲಪರ್ ಆಗಲು ಅವುಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ಮರೆಯದಿರಿ.