Išspręsta: pandos vidurkis ir suma

Pandas yra galinga Python biblioteka, skirta duomenų analizei ir manipuliavimui, plačiai naudojama įvairiose srityse, įskaitant mados pasaulį. Naudodamiesi pandomis, mados ekspertai ir kūrėjai gali pastebėti tendencijas, modelius ir įžvalgas, analizuodami su mados industrija susijusius duomenų rinkinius. Šiame straipsnyje pažvelgsime į galingas Pandos funkcijas, vidutinis ir suma, ir jų taikymas mados duomenų analizėje.

Šios funkcijos gali būti labai naudingos ieškant svarbios informacijos apie mados prekes, pvz., išpardavimus, kainų tendencijas, produktų įvertinimą ir kt. Apskaičiuodami įvairių atributų vidurkį ir sumą, galime gauti vertingų įžvalgų ir priimti pagrįstus sprendimus dėl stiliaus ir mados tendencijų.

Problemos sprendimas

Pademonstruoti pandų naudojimą vidutinis ir suma funkcijomis, tarkime, kad turime duomenų rinkinį, kuriame yra išsami informacija apie įvairius mados gaminius, pvz., jų stilių, spalvas, kainą ir įvertinimą. Importuosime šį duomenų rinkinį į pandas DataFrame ir pradėsime analizę naudodami vidurkio ir sumos funkcijas.

import pandas as pd

# Read data from a CSV file and load it into a DataFrame
data = pd.read_csv('fashion_items.csv')

# Calculate mean and sum of the price column
mean_price = data['price'].mean()
sum_price = data['price'].sum()

print('Mean price:', mean_price)
print('Total price:', sum_price)

Žingsnis po žingsnio kodo paaiškinimas

  • Pirmiausia importuojame pandų biblioteką su slapyvardžiu „pd“.
  • Tada nuskaitome duomenis iš CSV failo, pavadinto „fashion_items.csv“, ir įkeliame juos į „DataFrame“, pavadintą „duomenys“, naudodami funkciją pd.read_csv. Duomenų rinkinyje yra informacijos apie įvairius mados gaminius.
  • Tada apskaičiuojame vidutinę visų mados prekių kainą, naudodami funkciją mean(), taikomą DataFrame stulpeliui „kaina“. Ši reikšmė saugoma kintamajame pavadinimu „mean_price“.
  • Panašiai apskaičiuojame bendrą visų mados prekių kainą, iškviesdami funkciją sum() stulpelyje „kaina“. Ši reikšmė saugoma kintamajame pavadinimu „sum_price“.
  • Galiausiai atspausdiname apskaičiuotas vidutines ir bendras mados prekių kainas.

Susijusios Pandos bibliotekos ir funkcijos

Yra daugybė bibliotekų ir funkcijų, kurios papildo pandų naudojimą duomenų analizei mados industrijoje. Be to, kai kurios iš šių naudingų funkcijų vidutinis ir suma taip pat yra:

Pandos groupby funkcija

Šios Grupuoti pagal funkcija ypač naudinga kaupiant duomenis pagal konkrečius stulpelius. Pavyzdžiui, jei norime išanalizuoti kiekvieno mūsų duomenų rinkinyje esančio stiliaus mados prekių vidutinę ir bendrą kainą.

# Group data by style and calculate mean and sum of the price
grouped_data = data.groupby('style')['price'].agg(['mean', 'sum'])

print(grouped_data)

Pandų sujungimo funkcija

Šios susijungti funkcija leidžia sujungti du duomenų rėmelius pagal bendrą stulpelį. Pavyzdžiui, tarkime, kad turime atskirą duomenų rinkinį, kuriame yra informacija apie kiekvieno stiliaus populiarumą. Sujungę abu duomenų rėmelius, šią informaciją galime paversti vertingomis įžvalgomis.

# Import data related to style popularity
style_popularity_data = pd.read_csv('style_popularity.csv')

# Merge the original data and style_popularity_data based on the 'style' column
merged_data = pd.merge(data, style_popularity_data, on='style')

print(merged_data.head())

Suprasdami ir įgyvendindami šias galingas Pandas bibliotekos funkcijas, mados ekspertai ir kūrėjai gali priimti pagrįstus sprendimus ir lengvai analizuoti naujausias tendencijas bei stilius.

Susijusios naujienos:

Palikite komentarą