Selesai: tambahkan berbilang lajur pada bingkai data jika panda tidak wujud

Pandas ialah perpustakaan Python sumber terbuka yang menyediakan struktur data berprestasi tinggi, mudah digunakan dan alatan analisis data. Ia telah menjadi pilihan utama untuk pembangun dan saintis data apabila melibatkan manipulasi dan analisis data. Salah satu ciri berkuasa yang disediakan oleh Pandas ialah mencipta dan mengubah suai bingkai data. Dalam artikel ini, kami akan meneroka proses menambah berbilang lajur pada bingkai data jika ia tidak wujud, menggunakan perpustakaan panda. Kami akan menelusuri penjelasan langkah demi langkah tentang kod dan menyelami fungsi berkaitan, perpustakaan dan masalah yang mungkin anda hadapi sepanjang perjalanan.

Bekerja dengan bingkai data adalah penting apabila mengendalikan data, dan selalunya anda mungkin mendapati diri anda berada dalam situasi di mana anda perlu menambah berbilang lajur sekaligus pada bingkai data. Ini boleh menjadi rumit, tetapi perpustakaan Pandas menjadikan tugas ini lancar dan cekap. Mula-mula, mari mulakan dengan mengimport perpustakaan Pandas:

import pandas as pd

Menambah Berbilang Lajur pada Bingkai Data Pandas

Untuk menambah berbilang lajur pada bingkai data, kita boleh menggunakan kaedah DataFrame.assign(). Kaedah ini membolehkan kami menambah satu atau beberapa lajur pada bingkai data sekaligus. Mari buat kerangka data sampel dan kemudian tambahkan berbilang lajur padanya jika ia belum wujud:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

Dalam coretan kod di atas, kami mula-mula mencipta kerangka data sampel dengan dua lajur, 'column1' dan 'column2'. Kami kemudian membuat senarai lajur baharu, 'column3' dan 'column4', yang ingin kami tambahkan pada bingkai data. Akhir sekali, kami mengulangi senarai lajur dan menambah lajur baharu jika ia belum wujud dalam kerangka data.

Penjelasan Langkah demi Langkah

Berikut adalah langkah demi langkah penerangan setiap bahagian penyelesaian kami:

1. Kita mulakan dengan mengimport perpustakaan Pandas menggunakan "import panda sebagai pd".
2. Seterusnya, kami mencipta kerangka data sampel yang dipanggil 'df' dengan dua lajur: 'column1' dan 'column2'.
3. Kami mencipta senarai lajur baharu yang ingin kami tambahkan pada kerangka data – 'column3' dan 'column4'.
4. Kami menggunakan gelung for untuk lelaran melalui senarai lajur baharu.
5. Dalam gelung, kami menyemak sama ada lajur baharu sudah wujud dalam rangka data menggunakan keadaan 'tidak dalam'. Jika lajur baharu tidak wujud, kami menambah lajur baharu pada bingkai data dengan nilai lalai Tiada.

Fungsi dan Perpustakaan Panda

Pandas menawarkan pelbagai fungsi dan kaedah yang memudahkan pengendalian dan memanipulasi bingkai data. Dalam penyelesaian kami, kami menggunakan komponen utama berikut:

  • DataFrame – Sebagai struktur data utama dalam panda, DataFrame ialah data jadual dua dimensi, boleh ubah, berpotensi heterogen dengan paksi berlabel (baris dan lajur)
  • DataFrame.columns – Atribut ini mengembalikan label lajur DataFrame, membolehkan kami mengakses dan mengesahkan sama ada lajur wujud atau tidak.
  • pd.DataFrame() – Ia adalah fungsi pembina untuk mencipta kerangka data baharu. Ia membolehkan anda menentukan data dan nama lajur semasa penciptaan.

Sekarang anda mempunyai pemahaman yang lebih baik tentang bagaimana untuk tambah berbilang lajur kepada kerangka data Pandas, teknik ini akan membantu anda mengurus dan memanipulasi data dengan cekap. Ingat bahawa Pandas menawarkan banyak lagi ciri berkuasa untuk analisis dan manipulasi data, jadi pastikan anda menerokanya juga untuk menjadi pembangun Python yang lebih berkesan.

Related posts:

Tinggalkan komen