Diselesaikan: tambahkan beberapa kolom ke bingkai data jika tidak ada panda

Pandas adalah pustaka Python sumber terbuka yang menyediakan struktur data berkinerja tinggi, mudah digunakan, dan alat analisis data. Ini telah menjadi pilihan utama bagi pengembang dan ilmuwan data dalam hal manipulasi dan analisis data. Salah satu fitur canggih yang disediakan oleh Pandas adalah membuat dan memodifikasi kerangka data. Pada artikel ini, kita akan mengeksplorasi proses penambahan beberapa kolom ke kerangka data jika tidak ada, menggunakan perpustakaan panda. Kami akan menjelaskan langkah-demi-langkah kode dan masuk ke fungsi terkait, perpustakaan, dan masalah yang mungkin Anda temui di sepanjang jalan.

Bekerja dengan kerangka data sangat penting saat menangani data, dan seringkali Anda mungkin berada dalam situasi di mana Anda perlu menambahkan beberapa kolom sekaligus ke kerangka data. Ini bisa rumit, tetapi perpustakaan Panda membuat tugas ini lancar dan efisien. Pertama, mari kita mulai dengan mengimpor library Pandas:

import pandas as pd

Menambahkan Beberapa Kolom ke Pandas Dataframe

Untuk menambahkan banyak kolom ke bingkai data, kita bisa menggunakan metode DataFrame.assign() . Metode ini memungkinkan kita untuk menambahkan satu atau beberapa kolom ke kerangka data sekaligus. Mari buat kerangka data sampel dan kemudian tambahkan beberapa kolom ke dalamnya jika belum ada:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

Dalam majalah potongan kode di atas, pertama-tama kita membuat kerangka data sampel dengan dua kolom, 'kolom1' dan 'kolom2'. Kami kemudian membuat daftar kolom baru, 'column3' dan 'column4', yang ingin kami tambahkan ke kerangka data. Terakhir, kami mengulangi daftar kolom dan menambahkan kolom baru jika belum ada dalam kerangka data.

Penjelasan Langkah-demi-Langkah

Berikut adalah langkah-demi-langkah penjelasan masing-masing bagian dari solusi kami:

1. Kita mulai dengan mengimpor library Pandas menggunakan “import pandas as pd”.
2. Selanjutnya, kita membuat contoh dataframe bernama 'df' dengan dua kolom: 'column1' dan 'column2'.
3. Kami membuat daftar kolom baru yang ingin kami tambahkan ke bingkai data – 'column3' dan 'column4'.
4. Kita menggunakan perulangan for untuk mengulangi daftar kolom baru.
5. Di dalam loop, kami memeriksa apakah kolom baru sudah ada di kerangka data menggunakan kondisi 'tidak dalam'. Jika kolom baru tidak ada, kami menambahkan kolom baru ke kerangka data dengan nilai default Tidak ada.

Fungsi dan Pustaka Panda

Panda menawarkan berbagai macam fungsi dan metode yang menyederhanakan penanganan dan manipulasi kerangka data. Dalam solusi kami, kami menggunakan komponen utama berikut:

  • Bingkai Data – Sebagai struktur data utama dalam panda, DataFrame adalah data tabular dua dimensi, dapat diubah, berpotensi heterogen dengan sumbu berlabel (baris dan kolom)
  • DataFrame.kolom – Atribut ini mengembalikan label kolom dari DataFrame, memungkinkan kita untuk mengakses dan memverifikasi apakah ada kolom atau tidak.
  • pd.DataFrame() – Ini adalah fungsi konstruktor untuk membuat kerangka data baru. Ini memungkinkan Anda untuk menentukan data dan nama kolom selama pembuatan.

Sekarang Anda memiliki pemahaman yang lebih baik tentang caranya tambahkan beberapa kolom ke kerangka data Pandas, teknik ini akan membantu Anda mengelola dan memanipulasi data secara efisien. Ingatlah bahwa Panda menawarkan banyak fitur hebat lainnya untuk analisis dan manipulasi data, jadi pastikan untuk menjelajahinya juga untuk menjadi pengembang Python yang lebih efektif.

Pos terkait:

Tinggalkan Komentar