தீர்க்கப்பட்டது: பைதான் பாண்டாக்களில் வார்த்தையை எண்ணாக மாற்றுவது எப்படி

இன்றைய உலகில், தரவு கையாளுதல் மற்றும் பகுப்பாய்வு பல்வேறு தொழில்களில் ஒரு முக்கிய பகுதியாக மாறியுள்ளது. தரவுத்தொகுப்புகளில் சொற்களை எண்களாக மாற்றுவது அடிக்கடி நிகழும் ஒரு பணியாகும். பைத்தானின் சக்தி வாய்ந்த நூலகமான பாண்டாக்கள், இந்தப் பணியை எவ்வாறு திறம்படச் செய்யப் பயன்படுத்தலாம் என்பதை இந்தக் கட்டுரை விவாதிக்கும். இந்தச் சிக்கலைத் தீர்ப்பதில் உள்ள படிகள், குறியீடு மற்றும் கருத்துகளை நாங்கள் ஆராய்வோம், நீங்கள் செயல்முறையைப் புரிந்துகொள்வதை உறுதிசெய்து அதை எளிதாகச் செயல்படுத்த முடியும்.

தொடங்குவதற்கு, நாம் தீர்க்க விரும்பும் சிக்கலைப் புரிந்துகொள்வோம். "ஒன்று," "இரண்டு," "மூன்று," போன்ற வார்த்தைகளில் எழுதப்பட்ட எண்களைக் கொண்ட நெடுவரிசையுடன் தரவுத்தொகுப்பு உங்களிடம் இருப்பதாக கற்பனை செய்து பாருங்கள். பைதான் மற்றும் பாண்டாக்களைப் பயன்படுத்தி இந்த வார்த்தை எண்களை அவற்றின் முழு எண்ணாக மாற்றுவதே எங்கள் குறிக்கோள்.

படி 1: தேவையான நூலகங்களை இறக்குமதி செய்தல்
இந்த பணியை நிறைவேற்ற, முதலில் தேவையான நூலகங்களை இறக்குமதி செய்ய வேண்டும். இந்த நிலையில், தரவுகளைக் கையாளுவதற்கும் கையாளுவதற்கும் பாண்டாஸ் நூலகத்தைப் பயன்படுத்துவோம், மேலும் சொற்களை எண்களாக மாற்றுவதற்கு ஊடுருவுவோம்.

import pandas as pd
import inflect

பாண்டாஸ் நூலகம்

பாண்டாஸ் என்பது ஒரு திறந்த மூல தரவு கையாளுதல் மற்றும் பகுப்பாய்வு நூலகம் ஆகும், இது தரவு கட்டமைப்புகள் மற்றும் கட்டமைக்கப்பட்ட தரவை கையாள தேவையான செயல்பாடுகளை வழங்குகிறது. இது பைதான் நிரலாக்க மொழியின் மேல் கட்டமைக்கப்பட்டுள்ளது மற்றும் தரவு முன் செயலாக்கம், சுத்தம் செய்தல் மற்றும் பகுப்பாய்வு செய்வதில் குறிப்பிடத்தக்க பங்கு வகிக்கிறது. பல்வேறு தரவு வகைகள் மற்றும் செயல்பாடுகளை கையாள்வதில் உதவும் தொடர், டேட்டாஃப்ரேம் மற்றும் இன்டெக்ஸ் ஆகியவை அதன் முக்கிய தரவு கட்டமைப்புகளில் சில.

நூலகத்தை ஊடுருவி

inflect என்பது பைதான் நூலகமாகும், இது பன்மைகள் மற்றும் ஒருமை பெயர்ச்சொற்கள், ஆர்டினல்கள் மற்றும் எண்களை வார்த்தைகளாக அல்லது வார்த்தைகளை எண்களாக மாற்ற உதவுகிறது. இந்த கட்டுரையில், வார்த்தைகளை எண்களாக மாற்றும் திறனைப் பற்றி நாம் கவனம் செலுத்துவோம். Inflect ஐப் பயன்படுத்த, பின்வரும் கட்டளையைப் பயன்படுத்தி அதை நிறுவ வேண்டும்:

!pip install inflect

படி 2: ஒரு பாண்டாஸ் டேட்டா ஃப்ரேமை உருவாக்குதல்
இப்போது நாம் தேவையான நூலகங்களை இறக்குமதி செய்துவிட்டோம், எண்களை வார்த்தைகளாகக் கொண்ட ஒரு நெடுவரிசையுடன் ஒரு pandas DataFrame ஐ உருவாக்குவோம். இது விளக்க நோக்கங்களுக்காக எங்கள் மாதிரி தரவுத்தொகுப்பாக செயல்படும்.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

படி 3: வார்த்தைகளை எண்களாக மாற்றுதல்
அடுத்து, வார்த்தைகளில் உள்ள எண்களை அவற்றின் முழு எண்ணாக மாற்ற, inflect நூலகத்தைப் பயன்படுத்துவோம். 'convert_word_to_number' என்ற செயல்பாட்டை உருவாக்குவோம், அது ஒரு வார்த்தையை உள்ளீடாக எடுத்து அதற்குரிய எண்ணை வழங்கும்.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

இந்த குறியீட்டு துணுக்கில், வார்த்தைகளை எண்களாக மாற்ற இன்ஃப்ளெக்ட் என்ஜினைப் பயன்படுத்தும் செயல்பாட்டை நாங்கள் வரையறுக்கிறோம். DataFrame இல் உள்ள 'Numbers_in_words' நெடுவரிசையின் ஒவ்வொரு உறுப்புக்கும் இந்தச் செயல்பாட்டைப் பயன்படுத்த, pandas apply() முறையைப் பயன்படுத்துகிறோம்.

சுருக்கமாக, தரவுத்தொகுப்பில் சொற்களை எண்களாக மாற்ற பைதான், பாண்டாக்கள் மற்றும் ஊடுருவலை எவ்வாறு பயன்படுத்தலாம் என்பதைப் பார்த்தோம். தரவு கையாளுதலுக்கான இன்றியமையாத கருவியாக பாண்டாஸ் செயல்படுகிறது, அதே சமயம் இன்ஃப்ளெக்ட் லைப்ரரி வார்த்தைகள் மற்றும் எண்களை உள்ளடக்கிய செயல்பாடுகளில் உதவுகிறது. இந்தப் படிகளைப் பின்பற்றுவதன் மூலம், உங்கள் தரவுத்தொகுப்பில் உள்ள சொல் எண்களை முழு எண்களாக எளிதாக மாற்றலாம் மற்றும் உங்கள் தரவை மேலும் பகுப்பாய்வு செய்து கையாளலாம். மகிழ்ச்சியான குறியீட்டு!

தொடர்புடைய இடுகைகள்:

ஒரு கருத்துரையை