A Pandas egy hatékony Python könyvtár adatelemzéshez és -manipulációhoz, amelyet széles körben használnak különböző területeken, beleértve a divat világát is. A Pandák segítségével a divatszakértők és fejlesztők trendeket, mintákat és betekintést fedezhetnek fel a divatiparhoz kapcsolódó adatkészletek elemzésével. Ebben a cikkben a Panda hatékony funkcióival foglalkozunk, jelent és a összeg, és alkalmazásaik a divatadatok elemzésében.
Ezek a funkciók nagyon hasznosak lehetnek a divatcikkekkel kapcsolatos fontos információk, például az eladások, az ártrendek, a termékértékelés és egyebek felfedezésében. A különböző tulajdonságok átlagának és összegének kiszámításával értékes betekintést nyerhetünk a stílus- és divattrendekkel kapcsolatos megalapozott döntések meghozatalához.
A probléma megoldása
A pandák használatának bemutatására jelent és a összeg függvényeket, tegyük fel, hogy van egy adatkészletünk, amely a különböző divatcikkek részleteit tartalmazza, például stílusukat, színeiket, árukat és értékelésüket. Ezt az adatkészletet importáljuk egy pandas DataFrame-be, és megkezdjük az elemzést az átlag és az összeg függvények használatával.
import pandas as pd # Read data from a CSV file and load it into a DataFrame data = pd.read_csv('fashion_items.csv') # Calculate mean and sum of the price column mean_price = data['price'].mean() sum_price = data['price'].sum() print('Mean price:', mean_price) print('Total price:', sum_price)
Lépésről lépésre a kód magyarázata
- Először importáljuk a pandas könyvtárat 'pd' álnévvel.
- Ezután beolvassuk az adatokat egy „fashion_items.csv” nevű CSV-fájlból, és a pd.read_csv függvény segítségével betöltjük egy „data” nevű DataFrame-be. Az adatkészlet különféle divatcikkekről tartalmaz információkat.
- Ezután kiszámítjuk az összes divatcikk átlagárát a DataFrame 'price' oszlopára alkalmazott mean() függvénnyel. Ezt az értéket egy „mean_price” nevű változó tárolja.
- Hasonlóképpen kiszámítjuk az összes divatcikk összárát a „price” oszlopban található sum() függvény meghívásával. Ezt az értéket a „sum_price” nevű változó tárolja.
- Végül kinyomtatjuk a divatcikkek számított átlag- és összárait.
Kapcsolódó könyvtárak és funkciók a Pandasban
Rengeteg könyvtár és funkció létezik, amelyek kiegészítik a pandák használatát adatelemzésre a divatiparban. Ezen kívül néhány hasznos funkció jelent és a összeg következők:
Pandák csoport szerint
A csoportosít funkció különösen hasznos az adatok meghatározott oszlopok alapján történő összesítéséhez. Például, ha elemezni akarjuk a divatcikkek átlag- és összárát az adatkészletünkben szereplő egyes stílusok esetében.
# Group data by style and calculate mean and sum of the price grouped_data = data.groupby('style')['price'].agg(['mean', 'sum']) print(grouped_data)
Pandák egyesítése funkció
A összeolvad A funkció lehetővé teszi, hogy két DataFrame-et kombináljunk egy közös oszlop alapján. Tegyük fel például, hogy van egy külön adatkészletünk, amely információkat tartalmaz az egyes stílusok népszerűségéről. A két DataFrame egyesítésével ezeket az információkat értékes betekintésekké alakíthatjuk át.
# Import data related to style popularity style_popularity_data = pd.read_csv('style_popularity.csv') # Merge the original data and style_popularity_data based on the 'style' column merged_data = pd.merge(data, style_popularity_data, on='style') print(merged_data.head())
A Pandas könyvtárban ezen hatékony funkciók megértésével és megvalósításával a divatszakértők és fejlesztők megalapozott döntéseket hozhatnak, és könnyedén elemezhetik a legújabb trendeket és stílusokat.