已解决:pandas 替换列值

Pandas 是一个功能强大的 Python 库,广泛用于数据操作和分析。 对数据执行的一种常见操作是根据特定条件替换列值,例如调节或映射到其他值。 在本文中,我们将探讨如何使用 Pandas 库有效地应用此操作。 无论您是数据科学家、程序员,还是深入研究数据驱动的时尚趋势世界的时尚专家,这些知识都将是无价的。

理解这个操作的关键在于掌握Pandas库提供的内置函数。 具体来说,我们将专注于使用 `replace()`、`map()` 和 `apply()` 函数来根据各种条件操作列值。

import pandas as pd

# Sample data
data = {'Fashion_Style': ['Boho', 'Grunge', 'Preppy', 'Vintage', 'Athleisure'],
        'Colors': ['Earthy tones', 'Dark shades', 'Bright tones', 'Muted tones', 'Monochrome']}

df = pd.DataFrame(data)

# Replacing column values
df['Colors'] = df['Colors'].replace(['Earthy tones', 'Monochrome'], ['Warm tones', 'Contrast tones'])

print(df)

代码的逐步解释

1. 首先,我们将 Pandas 库导入为 `pd`。 这是一个常见的约定,它允许我们使用 `pd` 的简写来调用 Pandas 函数。
2. 接下来,我们创建一个名为“data”的字典,其中包含列“Fashion_Style”和“Colors”,以及它们各自的值。
3. 然后,我们使用 `pd.DataFrame()` 函数创建一个名为 `df` 的 DataFrame,并将 `data` 字典作为参数。
4. 之后,我们使用 `replace()` 函数替换“颜色”列中的特定值。 在我们的示例中,我们将“大地色调”替换为“暖色调”,将“单色”替换为“对比色调”。
5. 最后,我们打印更新后的 DataFrame `df` 来检查结果。

用于列值替换的 Pandas 内置函数

Pandas 提供了几个内置函数来处理 DataFrame 中的列值。 其中,我们发现 `replace()`、`map()` 和 `apply()` 在根据各种条件替换列值时特别有用。

代替 ():此函数用于替换 DataFrame 或 Series 中的指定值。 它可以应用于特定的列或整个 DataFrame,并且它支持用于高级模式匹配的正则表达式。

df['Colors'] = df['Colors'].replace(['Earthy tones', 'Monochrome'], ['Warm tones', 'Contrast tones'])

地图(): `map()` 函数类似于 `replace()`,但它将给定的函数或字典应用于系列中的每个元素。 当您需要根据一组特定规则将列值映射到新值时,这会很有用。

color_mapping = {'Earthy tones': 'Warm tones', 'Monochrome': 'Contrast tones'}
df['Colors'] = df['Colors'].map(color_mapping)

应用():`apply()` 函数是一个强大的工具,它可以沿 DataFrame 的轴应用给定的函数。 它可以用于整个 DataFrame 或特定列以实现广泛的转换。

def update_colors(color_value):
    if color_value == 'Earthy tones':
        return 'Warm tones'
    elif color_value == 'Monochrome':
        return 'Contrast tones'
    else:
        return color_value
        
df['Colors'] = df['Colors'].apply(update_colors)

有了这些可供您使用的函数,您现在就可以处理 Pandas 中的各种数据操作任务,例如替换 DataFrame 中的列值。 这些知识不仅适用于数据科学和编程领域,而且在分析现代时尚风格、识别新兴趋势以及理解各种风格和颜色的历史意义时也很有用。

相关文章:

发表评论