Pandas je zmogljiva knjižnica Python za analizo podatkov in manipulacijo, ki se pogosto uporablja na različnih področjih, vključno s svetom mode. Z uporabo Pande lahko modni strokovnjaki in razvijalci opazijo trende, vzorce in vpoglede z analizo naborov podatkov, povezanih z modno industrijo. V tem članku se bomo poglobili v zmogljive funkcije Panda, pomeni in vsotain njihove uporabe pri analizi modnih podatkov.
Te funkcije so lahko zelo koristne pri odkrivanju pomembnih informacij o modnih izdelkih, kot so razprodaje, cenovni trendi, ocene izdelkov in drugo. Z izračunom povprečja in vsote različnih atributov lahko pridobimo dragocene vpoglede za sprejemanje premišljenih odločitev o slogu in modnih trendih.
Rešitev problema
Za prikaz uporabe pand pomeni in vsota funkcije, predpostavimo, da imamo nabor podatkov, ki vsebuje podrobnosti o različnih modnih izdelkih, kot so njihov slog, barve, cena in ocena. Ta nabor podatkov bomo uvozili v pandas DataFrame in začeli analizo z uporabo funkcij srednje vrednosti in vsote.
import pandas as pd # Read data from a CSV file and load it into a DataFrame data = pd.read_csv('fashion_items.csv') # Calculate mean and sum of the price column mean_price = data['price'].mean() sum_price = data['price'].sum() print('Mean price:', mean_price) print('Total price:', sum_price)
Razlaga kode po korakih
- Najprej uvozimo knjižnico pand z vzdevkom 'pd'.
- Nato preberemo podatke iz datoteke CSV z imenom 'fashion_items.csv' in jih naložimo v DataFrame z imenom 'data' s funkcijo pd.read_csv. Nabor podatkov vsebuje informacije o različnih modnih izdelkih.
- Nato izračunamo povprečno ceno vseh modnih izdelkov z uporabo funkcije mean(), ki se uporablja za stolpec 'price' DataFrame. Ta vrednost je shranjena v spremenljivki z imenom 'mean_price'.
- Podobno izračunamo skupno ceno vseh modnih izdelkov s klicem funkcije sum() v stolpcu 'price'. Ta vrednost je shranjena v spremenljivki z imenom 'sum_price'.
- Na koncu natisnemo izračunane srednje in skupne cene modnih kosov.
Sorodne knjižnice in funkcije v Pandas
Obstaja množica knjižnic in funkcij, ki dopolnjujejo uporabo pand za analizo podatkov v modni industriji. Nekatere od teh uporabnih funkcij poleg pomeni in vsota vključujejo:
Funkcija Pandas groupby
O groupby funkcija je še posebej uporabna za združevanje podatkov na podlagi določenih stolpcev. Na primer, če želimo analizirati srednjo in skupno ceno modnih izdelkov za vsak slog, ki je prisoten v našem naboru podatkov.
# Group data by style and calculate mean and sum of the price grouped_data = data.groupby('style')['price'].agg(['mean', 'sum']) print(grouped_data)
Funkcija spajanja Pandas
O združiti funkcija nam omogoča združevanje dveh podatkovnih okvirov na podlagi skupnega stolpca. Denimo, da imamo ločen nabor podatkov, ki vsebuje informacije o priljubljenosti vsakega sloga. Z združitvijo obeh podatkovnih ogrodij lahko te informacije pretvorimo v dragocene vpoglede.
# Import data related to style popularity style_popularity_data = pd.read_csv('style_popularity.csv') # Merge the original data and style_popularity_data based on the 'style' column merged_data = pd.merge(data, style_popularity_data, on='style') print(merged_data.head())
Z razumevanjem in izvajanjem teh zmogljivih funkcij znotraj knjižnice Pandas lahko modni strokovnjaki in razvijalci sprejemajo informirane odločitve in z lahkoto analizirajo najnovejše trende in sloge.