ஃபேஷன் மற்றும் புரோகிராமிங் இரண்டு முற்றிலும் வேறுபட்ட உலகங்கள் போல் தோன்றலாம், ஆனால் தரவு பகுப்பாய்வு மற்றும் போக்கு முன்கணிப்புக்கு வரும்போது, அவை அழகாக ஒன்றிணைக்க முடியும். இந்தக் கட்டுரையில், ஃபேஷன் துறையில் தரவு பகுப்பாய்வுக்கான பொதுவான சிக்கலை ஆராய்வோம்: பாண்டாக்களின் தேதிநேரத் தரவிலிருந்து குறிப்பிட்ட நாட்களைத் தவிர்ப்பது. வடிவங்கள், போக்குகள் மற்றும் விற்பனைத் தரவை பகுப்பாய்வு செய்யும் போது இது மிகவும் பயனுள்ளதாக இருக்கும். குறியீட்டின் படிப்படியான விளக்கத்திற்குச் செல்வோம், மேலும் எங்கள் இலக்கை அடைய உதவும் பல்வேறு நூலகங்கள் மற்றும் செயல்பாடுகளைப் பற்றி விவாதிப்போம்.
ஃபேஷனில் பாண்டாக்கள் மற்றும் டேட் டைம்
பாண்டாஸ் ஒரு பிரபலமான பைதான் நூலகம் முதன்மையாக தரவு பகுப்பாய்வு மற்றும் கையாளுதலுக்காக பயன்படுத்தப்படுகிறது. ஃபேஷன் உலகில், போக்குகளை அடையாளம் காணவும், வாடிக்கையாளர் விருப்பங்களை பகுப்பாய்வு செய்யவும் மற்றும் எதிர்கால வடிவங்களை கணிக்கவும் பரந்த அளவிலான தரவுகளை சலிப்பதற்கு இது பயன்படுத்தப்படலாம். பாண்டாஸ் தேதிநேர செயல்பாட்டை ஆதரிக்கிறது, இது தேதிகள் மற்றும் நேரங்களுடன் சிரமமின்றி வேலை செய்ய அனுமதிக்கிறது.
பல சந்தர்ப்பங்களில், எங்கள் தரவுத்தொகுப்பில் இருந்து குறிப்பிட்ட நாட்கள் அல்லது நாட்களின் வரம்புகளைத் தவிர்க்க வேண்டியது அவசியம். எடுத்துக்காட்டாக, கருப்பு வெள்ளி அல்லது சைபர் திங்கள் போன்ற முக்கியமான விற்பனை நாட்களில் கவனம் செலுத்த வார இறுதி நாட்கள் அல்லது விடுமுறை நாட்களை நாங்கள் விலக்க விரும்பலாம்.
சிக்கலைப் புரிந்துகொள்வது
CSV வடிவத்தில் தினசரி விற்பனைத் தரவைக் கொண்ட தரவுத்தொகுப்பு எங்களிடம் உள்ளது என்று வைத்துக்கொள்வோம், வார இறுதி நாட்களைத் தவிர்த்து, தகவலைப் பகுப்பாய்வு செய்ய விரும்புகிறோம். இதை அடைய, நாங்கள் தொடங்குவோம் பாண்டாக்களைப் பயன்படுத்தி தரவுத்தொகுப்பை இறக்குமதி செய்கிறோம், பின்னர் வார இறுதி நாட்களை அகற்ற தரவை கையாளுவோம்.
இங்கே படிப்படியான செயல்முறை:
1. தேவையான நூலகங்களை இறக்குமதி செய்யவும்.
2. தரவுத்தொகுப்பை ஏற்றவும்.
3. தேதி நெடுவரிசையை தேதிநேர வடிவமைப்பிற்கு மாற்றவும் (ஏற்கனவே அந்த வடிவத்தில் இல்லையெனில்).
4. வார இறுதி நாட்களைத் தவிர்த்து டேட்டாஃப்ரேமை வடிகட்டவும்.
5. வடிகட்டப்பட்ட தரவை பகுப்பாய்வு செய்யவும்.
குறிப்பு: ஒரு தனி நெடுவரிசையில் தேதி சேமிக்கப்படும் எந்த தரவுத்தொகுப்பிற்கும் இந்த முறை பயன்படுத்தப்படலாம்.
# Step 1: Import the necessary libraries import pandas as pd from pandas.tseries.offsets import BDay # Step 2: Load the dataset data = pd.read_csv('sales_data.csv') # Step 3: Convert the date column to datetime format data['date'] = pd.to_datetime(data['date']) # Step 4: Filter the dataframe to exclude weekends filtered_data = data[data['date'].dt.dayofweek < 5] # Step 5: Analyze the filtered data print(filtered_data.head())
குறியீட்டை விளக்குதல்
மேலே உள்ள குறியீடு தொகுதியில், இரண்டு அத்தியாவசிய நூலகங்களை இறக்குமதி செய்வதன் மூலம் தொடங்குகிறோம்: pandas.tseries.offsets இலிருந்து pandas மற்றும் BDay (வணிக நாள்). பாண்டாஸ் செயல்பாட்டைப் பயன்படுத்தி தரவுத்தொகுப்பை ஏற்றுகிறோம் படிக்க_சிஎஸ்வி, மற்றும் தேதி நெடுவரிசை தேதிநேர வடிவமைப்பில் இருப்பதை உறுதிப்படுத்தவும்.
தி dt.dayofweek பண்புக்கூறு வாரத்தின் நாளை முழு எண்ணாக வழங்குகிறது (திங்கள்: 0, ஞாயிறு: 6). வார இறுதி நாட்களை வடிகட்ட, வாரத்தின் நாள் மதிப்பு 5க்கும் குறைவான வரிசைகளை மட்டுமே வைத்திருக்கிறோம்.
இறுதியாக, வடிகட்டப்பட்ட தரவைப் பயன்படுத்தி முதல் சில வரிசைகளை அச்சிடுவதன் மூலம் பகுப்பாய்வு செய்கிறோம் தலை() செயல்பாடு.
கூடுதல் செயல்பாடுகள் மற்றும் நூலகங்கள்
பிற வடிகட்டுதல் அளவுகோல்களைச் சேர்க்க அல்லது வெவ்வேறு தேதி வரம்புகளுடன் பணிபுரிய இந்த முறையை மேலும் நீட்டிக்க முடியும். இந்த செயல்முறையை ஆதரிக்கக்கூடிய சில பயனுள்ள நூலகங்கள் மற்றும் செயல்பாடுகள் பின்வருமாறு:
- NumPy: பைத்தானில் உள்ள எண்ணியல் கணினிக்கான நூலகம், இது திறமையான வரிசை கையாளுதல் மற்றும் கணித செயல்பாடுகளுக்குப் பயன்படுத்தப்படலாம்.
- தேதி நேரம்: பைத்தானின் நிலையான நூலகத்தில் உள்ள ஒரு தொகுதி, தேதிகள் மற்றும் நேரங்களுடன் எளிதாக வேலை செய்ய உதவுகிறது.
- தேதி_வரம்பு: வணிக நாட்கள், வாரங்கள் அல்லது மாதங்கள் போன்ற வெவ்வேறு அதிர்வெண் அமைப்புகளின்படி தேதிகளின் வரம்பை உருவாக்க எங்களை அனுமதிக்கும் பாண்டாக்களுக்குள் ஒரு செயல்பாடு.
இந்த கருவிகள் மற்றும் நுட்பங்களை பாண்டாக்கள் மற்றும் டேட் டைம் கையாளுதலுடன் இணைந்து பயன்படுத்துவதன் மூலம், ஃபேஷன் துறையின் குறிப்பிட்ட தேவைகளைப் பூர்த்தி செய்யும் வலுவான தரவு பகுப்பாய்வு பணிப்பாய்வுகளை உருவாக்கலாம், அதாவது போக்குகள், வாடிக்கையாளர் விருப்பத்தேர்வுகள் மற்றும் விற்பனை செயல்திறன் ஆகியவற்றைக் கண்டறிதல்.