Pandas — це потужна бібліотека Python, яка широко використовується для обробки та аналізу даних. Однією з поширених операцій, що виконуються з даними, є заміна значень стовпців на основі певних критеріїв, таких як кондиціонування або зіставлення з іншими значеннями. У цій статті ми розглянемо, як ефективно застосувати цю операцію за допомогою бібліотеки Pandas. Незалежно від того, чи є ви фахівцем з даних, програмістом чи експертом у сфері моди, який заглиблюється у світ тенденцій моди, керованих даними, ці знання будуть безцінні.
Ключ до розуміння цієї операції полягає в освоєнні вбудованих функцій, наданих бібліотекою Pandas. Зокрема, ми зосередимося на використанні функцій `replace()`, `map()` і `apply()` для маніпулювання значеннями стовпців на основі різних критеріїв.
import pandas as pd # Sample data data = {'Fashion_Style': ['Boho', 'Grunge', 'Preppy', 'Vintage', 'Athleisure'], 'Colors': ['Earthy tones', 'Dark shades', 'Bright tones', 'Muted tones', 'Monochrome']} df = pd.DataFrame(data) # Replacing column values df['Colors'] = df['Colors'].replace(['Earthy tones', 'Monochrome'], ['Warm tones', 'Contrast tones']) print(df)
Покрокове пояснення коду
1. Спочатку ми імпортуємо бібліотеку Pandas як `pd`. Це загальна угода, і вона дозволяє нам викликати функції Pandas за допомогою скорочення `pd`.
2. Далі ми створюємо словник під назвою `data`, який містить стовпці 'Fashion_Style' і 'Colors', а також їхні відповідні значення.
3. Потім ми створюємо DataFrame під назвою `df`, використовуючи функцію `pd.DataFrame()` зі словником `data` як аргумент.
4. Після цього ми використовуємо функцію `replace()` для заміни певних значень у стовпці 'Кольори'. У нашому прикладі ми замінюємо «землисті тони» на «теплі тони», а «монохромні» — на «контрастні тони».
5. Нарешті, ми друкуємо оновлений DataFrame `df`, щоб перевірити результат.
Вбудовані функції Pandas для заміни значення стовпця
Pandas надає кілька вбудованих функцій для роботи зі значеннями стовпців у DataFrames. Серед них ми визначили `replace()`, `map()` і `apply()` як особливо корисні, коли йдеться про заміну значень стовпців на основі різних умов.
replace (): Ця функція використовується для заміни вказаних значень у DataFrame або Series. Його можна застосувати до окремого стовпця або всього DataFrame, і він підтримує регулярні вирази для розширеного зіставлення шаблонів.
df['Colors'] = df['Colors'].replace(['Earthy tones', 'Monochrome'], ['Warm tones', 'Contrast tones'])
карта (): функція `map()` подібна до `replace()`, але вона застосовує певну функцію або словник до кожного елемента серії. Це може бути корисним, коли вам потрібно зіставити значення стовпця з новими значеннями на основі певного набору правил.
color_mapping = {'Earthy tones': 'Warm tones', 'Monochrome': 'Contrast tones'} df['Colors'] = df['Colors'].map(color_mapping)
застосовувати (): Функція apply() є потужним інструментом, який застосовує задану функцію вздовж осі DataFrame. Його можна використовувати для всього DataFrame або окремих стовпців для досягнення широкого діапазону перетворень.
def update_colors(color_value): if color_value == 'Earthy tones': return 'Warm tones' elif color_value == 'Monochrome': return 'Contrast tones' else: return color_value df['Colors'] = df['Colors'].apply(update_colors)
Маючи ці функції у вашому розпорядженні, ви тепер готові вирішувати різноманітні завдання маніпулювання даними в Pandas, такі як заміна значень стовпців у DataFrames. Ці знання можна застосувати не лише в галузі науки про дані та програмування, але й виявляються корисними під час аналізу сучасних модних стилів, виявлення нових тенденцій і розуміння історичного значення різних стилів і кольорів.