Pandas to potężna biblioteka Pythona, szeroko stosowana do manipulacji i analizy danych. Jedną z typowych operacji wykonywanych na danych jest zastępowanie wartości kolumn na podstawie określonych kryteriów, takich jak warunkowanie lub mapowanie na inne wartości. W tym artykule przyjrzymy się, jak skutecznie zastosować tę operację przy użyciu biblioteki Pandas. Niezależnie od tego, czy jesteś naukowcem zajmującym się danymi, programistą czy ekspertem od mody zagłębiającym się w świat trendów w modzie opartych na danych, ta wiedza będzie nieoceniona.
Kluczem do zrozumienia tej operacji jest opanowanie wbudowanych funkcji udostępnianych przez bibliotekę Pandas. W szczególności skupimy się na wykorzystaniu funkcji `replace()`, `map()` i `apply()` do manipulowania wartościami kolumn w oparciu o różne kryteria.
import pandas as pd # Sample data data = {'Fashion_Style': ['Boho', 'Grunge', 'Preppy', 'Vintage', 'Athleisure'], 'Colors': ['Earthy tones', 'Dark shades', 'Bright tones', 'Muted tones', 'Monochrome']} df = pd.DataFrame(data) # Replacing column values df['Colors'] = df['Colors'].replace(['Earthy tones', 'Monochrome'], ['Warm tones', 'Contrast tones']) print(df)
Wyjaśnienie kodu krok po kroku
1. Najpierw importujemy bibliotekę Pandas jako `pd`. Jest to powszechna konwencja, która pozwala nam wywoływać funkcje Pandy za pomocą skrótu `pd`.
2. Następnie tworzymy słownik o nazwie `data` zawierający kolumny 'Fashion_Style' i 'Colors' oraz odpowiadające im wartości.
3. Następnie tworzymy DataFrame o nazwie `df` za pomocą funkcji `pd.DataFrame()` ze słownikiem `data` jako argumentem.
4. Następnie używamy funkcji `replace()` w celu zastąpienia określonych wartości w kolumnie 'Kolory'. W naszym przykładzie zamieniamy „tony ziemi” na „tony ciepłe”, a „tony monochromatyczne” na „tony kontrastu”.
5. Na koniec drukujemy zaktualizowaną ramkę DataFrame `df`, aby sprawdzić wynik.
Pandy Wbudowane funkcje do zastępowania wartości kolumn
Pandas udostępnia kilka wbudowanych funkcji do pracy z wartościami kolumn w DataFrames. Wśród nich zidentyfikowaliśmy `replace()`, `map()` i `apply()` jako szczególnie przydatne, jeśli chodzi o zastępowanie wartości kolumn na podstawie różnych warunków.
zastąpić (): Ta funkcja służy do zastępowania określonych wartości w DataFrame lub Series. Można go zastosować do określonej kolumny lub całej ramki DataFrame i obsługuje wyrażenia regularne do zaawansowanego dopasowywania wzorców.
df['Colors'] = df['Colors'].replace(['Earthy tones', 'Monochrome'], ['Warm tones', 'Contrast tones'])
mapa(): Funkcja `map()` jest podobna do `replace()`, ale stosuje daną funkcję lub słownik do każdego elementu w Serii. Może to być przydatne, gdy trzeba zmapować wartości kolumn na nowe wartości na podstawie określonego zestawu reguł.
color_mapping = {'Earthy tones': 'Warm tones', 'Monochrome': 'Contrast tones'} df['Colors'] = df['Colors'].map(color_mapping)
zastosować(): Funkcja `apply()` jest potężnym narzędziem, które stosuje daną funkcję wzdłuż osi DataFrame. Można go używać na całej ramce DataFrame lub określonych kolumnach, aby uzyskać szeroki zakres przekształceń.
def update_colors(color_value): if color_value == 'Earthy tones': return 'Warm tones' elif color_value == 'Monochrome': return 'Contrast tones' else: return color_value df['Colors'] = df['Colors'].apply(update_colors)
Dysponując tymi funkcjami, możesz teraz zająć się różnymi zadaniami związanymi z manipulacją danymi w Pandach, takimi jak zastępowanie wartości kolumn w DataFrames. Wiedza ta ma zastosowanie nie tylko w dziedzinie nauki o danych i programowaniu, ale także okazuje się przydatna podczas analizy współczesnych stylów mody, identyfikowania pojawiających się trendów i zrozumienia historycznego znaczenia różnych stylów i kolorów.