La xaliyay: pandas waxay safafka ku shaandhaysaa qiyamka wareersan

Dunida falanqaynta xogta, waa wax caadi ah in lala kulmo xog ururin waaweyn oo u baahan wax-is-daba marin iyo habayn xogta. Mid ka mid ah dhibaatooyinka noocaas ah ee badanaa soo baxa waa shaandhaynta safafka ku salaysan qiyamka daahsoon, gaar ahaan marka laga hadlayo xogta qoraalka. Pandas, maktabad caan ah oo Python ah oo loogu talagalay ku takri-falka xogta, ayaa bixisa xal qurux badan oo gacan ka geysta wax ka qabashada arrintan. Maqaalkan, waxaan u dhex geli doonaa sida loo isticmaalo Pandas si loo shaandheeyo safafka iyadoo la adeegsanayo qiyamka daahsoon, sahaminta koodka tallaabo-tallaabo, oo aan uga wada hadalno maktabadaha khuseeya iyo shaqooyinka kaa caawin kara xallinta dhibaatooyinka la midka ah.

Si aan u bilowno wax ka qabashada dhibaatadan, waxaan ka faa'iideysan doonaa Baandooyinka maktabadda oo ay la socdaan fuzzywuzzy maktabad ka caawisa xisaabinta isku ekaanshaha u dhexeeya xargaha kala duwan. The fuzzywuzzy Maktabadu waxay isticmaashaa fogaanta Levenshtein, cabbir isku mid ah oo ku salaysan tirada tafatirka (gelis, tirtirid, ama beddelaad) loo baahan yahay si loogu beddelo hal xadhig oo kale.

Rakibaadda iyo Soo Dejinta Maktabadaha Loo Baahan Yahay

Si aan u bilowno, waxaan u baahan doonaa in aan rakibno oo soo dejino maktabadaha lagama maarmaanka ah. Waxaad isticmaali kartaa pip si aad ugu rakibto Pandas iyo fuzzywuzzy labadaba:

pip install pandas
pip install fuzzywuzzy

Marka la rakibo, soo deji maktabadaha ku jira koodka Python:

import pandas as pd
from fuzzywuzzy import fuzz, process

Shaandhaynta Safafka Ku Salaysan Qiimaha Fuzzy

Hadda oo aanu soo dejinay maktabadihii loo baahnaa, aynu samayno xog khayaali ah oo aynu soo bandhigno sida loo shaandheeyo safafka ku salaysan qiyamka daahsoon. Tusaalahan, xogtayadu waxay ka koobnaan doontaa magacyada dharka iyo qaababka u dhigma.

data = {'Garment': ['T-shirt', 'Polo shirt', 'Jeans', 'Leather jacket', 'Winter coat'],
        'Style': ['Casual', 'Casual', 'Casual', 'Biker', 'Winter']}
df = pd.DataFrame(data)

Anaga oo u malaynayna in aanu rabno in aanu shaandhayno saf ay ku jiraan dhar leh magacyo la mid ah “Shaadhka Tee”, waxa aanu u baahan doonaa in aanu shaqaalaysiino maktabada fuzzywuzzy si aanu tan u fulino.

search_string = "Tee shirt"
threshold = 70

def filter_rows(df, column, search_string, threshold):
    return df[df[column].apply(lambda x: fuzz.token_sort_ratio(x, search_string)) >= threshold]

filtered_df = filter_rows(df, 'Garment', search_string, threshold)

Koodhka sare, waxaanu ku qeexnay hawl safafka filter taas oo qaadata afar qaybood: DataFrame, magaca tiirka, xargaha raadinta, iyo isku midka ahaanshaha. Waxay soo celisaa DataFrame sifaysan oo ku salaysan marinka la cayimay, kaas oo lagu xisaabiyo iyadoo la isticmaalayo fuzz.token_soocidda_habka ka shaqaynta maktabadda fuzzywuzzy.

Fahamka Xeerka Tallaabo-tallaabo

  • Marka hore, waxaan abuurnaa DataFrame loo yaqaan df oo ka kooban xogtayada
  • Marka xigta, waxaanu ku qeexnaa xadhiga raadinta sida "Shaadhka Tee" waxaanan dejineynaa marin la mid ah 70. Waxaad hagaajin kartaa qiimaha marinka iyadoo loo eegayo heerka aad rabto ee isku midka ah.
  • Waxaan markaa abuurnaa hawl la yiraahdo safafka filter, kaas oo shaandheynaya DataFrame ku salaysan fogaanta Levenshtein ee u dhaxaysa xargaha raadinta iyo saf kasta qiimahiisa ee tiirka la cayimay.
  • Ugu dambeyntii, waxaan ugu yeernaa safafka filter shaqada si aan u helno DataFrame-kayada la sifeeyay, filtered_df.

Gebogebadii, Pandas, oo ay weheliso maktabadda fuzzywuzzy, waa aalad aad u fiican oo lagu shaandheeyo safafka ku salaysan qiyamka daahsoon. Fahamka maktabadahan iyo hawlahooda waxay noo ogolaanaysaa inaan si hufan u maamulno xogta oo aan u xallino hawlaha habaynta xogta adag.

Related posts:

Leave a Comment