Selesai: tambah lajur baharu pada bingkai data panda

Dalam artikel ini, kami akan meneroka proses menambah lajur baharu pada Pandas DataFrame, perpustakaan popular dalam Python untuk manipulasi dan analisis data. Kami akan membincangkan penyelesaian kepada masalah ini, melalui penjelasan langkah demi langkah tentang kod, dan merangkumi beberapa topik dan fungsi yang berkaitan dalam pustaka Pandas. Pandas ialah perpustakaan yang digunakan secara meluas yang menampilkan struktur dan alatan data peringkat tinggi, sesuai untuk analisis data dan tugasan pengendalian yang cekap.

Sebagai permulaan, mari kita anggap kita mempunyai set data dalam bentuk Pandas DataFrame dan kami ingin menambah lajur baharu padanya. Ini adalah keperluan biasa dalam peringkat penyediaan data, selalunya diperlukan untuk kejuruteraan ciri atau untuk menjana maklumat tambahan berdasarkan lajur sedia ada. Mari kita selami bagaimana ini boleh dicapai.

Menambah lajur baharu pada Pandas DataFrame

Kami akan bermula dengan mengimport perpustakaan yang diperlukan dan mencipta sampel DataFrame.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Sekarang, mari tambah lajur baharu 'Negara' pada DataFrame kami dengan nilai lalai, sebut 'AS'.

df['Country'] = 'USA'

Baris kod ringkas ini akan menambah lajur baharu bernama 'Negara' pada DataFrame 'df' kami yang sedia ada dengan nilai 'USA' dalam semua barisnya. DataFrame kami yang dikemas kini akan kelihatan seperti ini:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Penjelasan kod langkah demi langkah

Mari pecahkan kod dan fahami langkah demi langkah.

1. Mula-mula, kami mengimport pustaka Pandas menggunakan alias standard 'pd'. Ini membolehkan kami mengakses fungsi dan kelas Pandas menggunakan awalan 'pd'.

import pandas as pd

2. Seterusnya, kami mencipta kamus 'data' yang mengandungi beberapa sampel data. Setiap kunci dalam kamus mewakili nama lajur dan nilai yang sepadan ialah senarai nilai untuk lajur tersebut.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Kami kemudian menukar kamus ini kepada objek Pandas DataFrame menggunakan fungsi `pd.DataFrame()`.

df = pd.DataFrame(data)

4. Akhir sekali, untuk menambah lajur baharu, kami hanya menggunakan operator tugasan “=” dengan DataFrame, memberikan nama lajur baharu di dalam kurungan segi empat sama dan menentukan nilai lalai. Dalam kes kami, kami menambah lajur 'Negara' dengan nilai lalai 'USA'.

df['Country'] = 'USA'

Perpustakaan Pandas dan fungsi berkaitan

Pandas ialah perpustakaan Python yang berkuasa, terutamanya sesuai untuk pemprosesan data, pembersihan dan tugasan analisis. Ia menyediakan dua struktur data utama: DataFrame and Siri. DataFrame ialah struktur data jadual dua dimensi dengan paksi berlabel (baris dan lajur). Siri A, sebaliknya, ialah tatasusunan berlabel satu dimensi yang mampu menyimpan data dalam apa jua jenis.

Beberapa fungsi Panda biasa yang berkaitan dengan menambah, mengubah suai dan memadam lajur dalam DataFrame adalah seperti berikut:

  • masukkan(): Untuk memasukkan lajur pada kedudukan yang ditentukan.
  • jatuhkan(): Untuk mengalih keluar lajur daripada DataFrame.
  • namakan semula(): Untuk menamakan semula lajur DataFrame.
  • berikan (): Untuk membuat lajur baharu berdasarkan hasil ungkapan.

Jadi, menambah lajur baharu pada Pandas DataFrame adalah mudah dan cekap. Dalam artikel ini, kami telah membincangkan kaedah asas untuk menambah lajur baharu dengan nilai lalai dan memberikan penjelasan terperinci untuk langkah-langkah yang terlibat. Kami juga telah memperkenalkan Panda sebagai perpustakaan manipulasi data yang berkuasa dan membincangkan beberapa fungsi berkaitan untuk mengurus lajur DataFrame. Dengan menguasai teknik ini, anda akan dilengkapi dengan baik untuk mengendalikan pelbagai tugas pemprosesan data dalam Python.

Related posts:

Tinggalkan komen