Diselesaikan: gunakan dict untuk mengganti panda nilai yang hilang

Dalam dunia manipulasi dan analisis data, menangani nilai yang hilang adalah tugas yang sangat penting. Panda, pustaka Python yang banyak digunakan, memungkinkan kita mengelola data yang hilang secara efisien. Satu pendekatan umum untuk menangani nilai-nilai yang hilang melibatkan penggunaan kamus untuk memetakan dan mengganti nilai-nilai ini. Pada artikel ini, kita akan membahas cara memanfaatkan kemampuan Panda dan Python untuk menggunakan kamus untuk mengganti nilai yang hilang dalam kumpulan data.

Solusi

Solusi utama yang akan kita jelajahi adalah menggunakan isi () berfungsi bersama dengan kamus. Pendekatan ini akan memungkinkan kita mengganti nilai yang hilang dengan nilai yang sesuai dari kamus tertentu.

Penjelasan kode langkah demi langkah

Untuk mengilustrasikan proses ini, anggaplah kita memiliki kumpulan data yang berisi informasi tentang berbagai gaya busana, termasuk garmen, warna, dan konteks sejarah. Dalam beberapa kasus, mungkin ada nilai yang hilang dalam kumpulan data ini.

Pertama, impor pustaka yang diperlukan dan buat sampel DataFrame:

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

Sekarang kita memiliki DataFrame yang mengilustrasikan masalahnya, perhatikan bahwa beberapa nilai hilang (dilambangkan dengan Tidak ada). Untuk mengganti nilai-nilai ini, buat kamus yang berisi pemetaan yang sesuai:

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

Terakhir, gunakan isi () berfungsi untuk mengganti nilai yang hilang menggunakan kamus gabungan:

df_filled = df.fillna(replacement_dict)

Memahami perpustakaan Panda

Panda adalah perpustakaan serbaguna dengan Python yang dirancang untuk manipulasi dan analisis data. Ini menawarkan struktur data yang fleksibel dan kuat seperti Seri dan DataFrame. Struktur ini sangat penting untuk bekerja secara efisien dengan data terstruktur dan tabular.

Panda menyediakan banyak koleksi fungsi, seperti isi (), digunakan untuk menangani data yang hilang. Operasi lain, seperti menggabungkan data, memutar data, dan analisis deret waktu, dapat dilakukan dengan mulus dengan Panda.

Fungsi untuk menangani data yang hilang

Selain isi () fungsi, Panda menawarkan beberapa fungsi dan metode lain untuk menangani data yang hilang, seperti:

  • jatuhkan(): Menghapus baris atau kolom dengan data yang hilang.
  • isna(): Menentukan elemen DataFrame atau Seri mana yang hilang atau nol.
  • bukan(): Tentukan elemen DataFrame atau Seri mana yang tidak hilang atau kosong.
  • menambah(): Isi nilai yang hilang menggunakan interpolasi linier.

Metode ini, bersama dengan isi (), menyediakan rangkaian alat yang lengkap untuk menangani data yang hilang dalam berbagai konteks.

Kesimpulannya, artikel ini telah menunjukkan cara menggunakan dict untuk mengganti nilai yang hilang dalam Pandas DataFrame. Fungsi utama yang kami gunakan, isi (), adalah alat yang ampuh di pustaka Pandas yang memungkinkan kita menangani data yang hilang secara efisien. Dengan memanfaatkan kamus, kami dapat memetakan nilai yang hilang ke pengganti yang sesuai dan memastikan bahwa kumpulan data kami lengkap dan bermakna. Melalui pemahaman yang lebih dalam tentang perpustakaan Pandas dan fungsi yang disertakan, kami dapat bekerja dengan kumpulan data besar secara efektif dan mendapatkan wawasan berharga dari data kami.

Pos terkait:

Tinggalkan Komentar