இன்றைய உலகில், நேர-தொடர் தரவுகளுடன் பணிபுரிவது ஒரு டெவலப்பருக்கு இன்றியமையாத திறமையாகும். வாராந்திர அல்லது மாதாந்திர தரவு போன்ற ஒரு குறிப்பிட்ட காலத்திற்கு நேர முத்திரையை மாற்றுவது பொதுவான பணிகளில் ஒன்றாகும். தரவுகளின் போக்குகள் மற்றும் வடிவங்களைப் படிப்பது போன்ற பல்வேறு பகுப்பாய்வுகளுக்கு இந்த செயல்பாடு முக்கியமானது. இந்த கட்டுரையில், சக்திவாய்ந்த பைதான் நூலகமான பாண்டாஸைப் பயன்படுத்தி நேர-தொடர் தரவுத்தொகுப்பில் நேர முத்திரையை காலகட்டத்திற்கு மாற்றுவது எப்படி என்பதை ஆராய்வோம். குறியீட்டில் ஆழமாக மூழ்கி, செயல்பாட்டில் உள்ள நூலகங்கள் மற்றும் செயல்பாடுகளை ஆராய்வோம், மேலும் இந்த சிக்கலைத் தீர்ப்பதில் அவற்றின் முக்கியத்துவத்தைப் புரிந்துகொள்வோம்.
பாண்டாஸ் என்பது ஒரு திறந்த மூல தரவு பகுப்பாய்வு மற்றும் கையாளுதல் நூலகம் ஆகும், இது நேர-தொடர் தரவுகளுடன் பணிபுரிய நெகிழ்வான மற்றும் உயர்-செயல்திறன் செயல்பாடுகளை வழங்குகிறது. இது எங்கள் பணியை எளிமையாகவும், துல்லியமாகவும், திறமையாகவும் செய்கிறது.
வாராந்திர அல்லது மாதாந்திர போன்ற ஒரு குறிப்பிட்ட காலத்திற்கு நேர முத்திரைத் தரவை மாற்றுவதற்கான தீர்வு, பாண்டாஸ் நூலகத்தின் மறு மாதிரி முறையைப் பயன்படுத்துகிறது. மறு மாதிரியாக்கம் என்பது ஒரு சக்திவாய்ந்த கருவியாகும், இது நேர முத்திரை தரவு அல்லது நேரத் தொடர் தரவுகளில் தரவுப் புள்ளிகளை மேம்படுத்தவோ அல்லது குறைக்கவோ பயன்படுத்தப்படலாம். இந்த வழக்கில், தேவையான காலங்களை உருவாக்க தரவு புள்ளிகளை நாங்கள் குறைப்போம்.
இப்போது, குறியீட்டின் படிப்படியான விளக்கத்தைப் பார்ப்போம்:
1. தேவையான நூலகங்களை இறக்குமதி செய்யவும்:
import pandas as pd import numpy as np
2. நேர முத்திரை குறியீட்டுடன் மாதிரி டேட்டாஃப்ரேமை உருவாக்கவும்:
date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D') df = pd.DataFrame(date_rng, columns=['date']) df['data'] = np.random.randint(0,100,size=(len(date_rng))) df.set_index('date', inplace=True)
3. நேரத் தொடர் தரவை மறு மாதிரி செய்து, நேர முத்திரைத் தரவை காலங்களாக மாற்றவும்:
df_period = df.resample('W').sum()
4. இதன் விளைவாக வரும் தரவுச்சட்டத்தை அச்சிடுக:
print(df_period)
இறுதி டேட்டாஃப்ரேம் `df_period` ஆனது வாரத்தின் மூலம் திரட்டப்பட்ட அசல் தரவின் கூட்டுத்தொகையைக் கொண்டுள்ளது.
**பயன்படுத்தப்பட்ட நூலகங்கள் மற்றும் செயல்பாடுகளைப் புரிந்துகொள்வது**
பாண்டாஸ் நூலகம்
Pandas என்பது தரவு கையாளுதல் மற்றும் பகுப்பாய்வுக்காக பரவலாகப் பயன்படுத்தப்படும் பைதான் நூலகமாகும். இது தொடர் மற்றும் டேட்டாஃப்ரேம் போன்ற உயர்நிலை தரவு கட்டமைப்புகளை வழங்குகிறது, டெவலப்பர்கள் ஒன்றிணைத்தல், மறுவடிவமைத்தல் மற்றும் சுத்தம் செய்தல் போன்ற செயல்பாடுகளை விரைவாகவும் திறமையாகவும் செய்ய அனுமதிக்கிறது. எங்கள் விஷயத்தில், Pandas நேரமுத்திரை தரவை திறம்பட கையாள உதவுகிறது மற்றும் நேரமுத்திரை தரவை காலகட்டத்திற்கு மாற்ற மறு மாதிரி() போன்ற மதிப்புமிக்க செயல்பாடுகளை வழங்குகிறது.
மறு மாதிரி செயல்பாடு
தி மறு மாதிரி() பாண்டாஸில் உள்ள செயல்பாடு என்பது அதிர்வெண் மாற்றுவதற்கும் நேரத் தொடர் தரவை மறு மாதிரி செய்வதற்கும் வசதியான முறையாகும். தொகை, சராசரி, இடைநிலை, பயன்முறை மற்றும் பிற பயனர் வரையறுக்கப்பட்ட செயல்பாடுகள் உட்பட தரவு ஒருங்கிணைப்பு அல்லது குறைப்புக்கான பல விருப்பங்களை இது வழங்குகிறது. மறு மாதிரி அதிர்வெண்ணை 'W' எனக் குறிப்பிடுவதன் மூலம், எங்கள் நேர முத்திரைத் தரவை வாராந்திர காலத்திற்கு மாற்ற இந்தச் செயல்பாட்டைப் பயன்படுத்துகிறோம். நீங்கள் மாதத்திற்கு 'M', காலாண்டுக்கு 'Q' மற்றும் பலவற்றையும் பயன்படுத்தலாம்.
இப்போது பாண்டாக்களின் செயல்பாடு மற்றும் நேர முத்திரையை காலத் தரவுகளாக மாற்றுவதற்கான மறு மாதிரி செயல்பாடு ஆகியவற்றை ஆராய்ந்துவிட்டோம், நேரத்தை உணர்திறன் கொண்ட தரவை மிகவும் அர்த்தமுள்ள வகையில் எளிதாகக் கையாளலாம். இந்தக் கருவிகளின் உதவியுடன், டெவலப்பர்கள், தரவு ஆய்வாளர்கள் மற்றும் SEO நிபுணர்கள் தங்கள் தரவிலிருந்து தனித்துவமான நுண்ணறிவுகளைத் திறக்க முடியும், மேலும் அவர்கள் சிறந்த முடிவுகளை எடுக்கவும் கணிப்புகளைச் செய்யவும் உதவுகிறது.