Selesai: kemas kini sel dalam helaian mengikut nama lajur menggunakan panda

Dalam dunia analisis data, penggunaan hamparan adalah perkara biasa, terutamanya apabila bekerja dengan data berstruktur dalam format kolumnar. Salah satu perpustakaan popular untuk bekerja dengan data hamparan dalam Python ialah Pandas. Pustaka berkuasa ini membolehkan pembangun membaca, memanipulasi dan mengeksport data jadual dengan mudah. Dalam artikel ini, kami akan menumpukan pada masalah khusus: mengemas kini sel dalam helaian mengikut nama lajur menggunakan Panda. Kami akan menyelami penyelesaian, diikuti dengan penjelasan langkah demi langkah tentang kod, dan akhirnya membincangkan konsep dan fungsi yang berkaitan dalam Panda, seperti bekerja dengan indeks dan memilih data. Jadi, mari kita mulakan.

Mengemas kini Sel mengikut Nama Lajur Menggunakan Panda

Untuk mengemas kini sel dalam helaian mengikut nama lajur, kita perlu memasang pustaka Pandas dahulu jika ia belum dipasang menggunakan arahan berikut:

!pip install pandas

Dengan Panda dipasang, mari kita gariskan langkah untuk mengemas kini sel dalam helaian mengikut nama lajur:

1. Muatkan helaian ke dalam objek DataFrame.
2. Akses sel yang ingin kami kemas kini.
3. Ubah suai sel yang dikehendaki dengan memberikan nilai baharu.
4. Simpan objek DataFrame kembali ke helaian.

Berikut ialah coretan kod yang menunjukkan penyelesaian dengan contoh mudah:

import pandas as pd

# Load data from a CSV file into a DataFrame object
df = pd.read_csv('your_spreadsheet.csv')

# Access and update the desired cells - let's update column 'Age' by adding 1 to each value
df['Age'] = df['Age'] + 1

# Save the updated DataFrame back to the CSV file
df.to_csv('your_updated_spreadsheet.csv', index=False)

Memahami Kod

Langkah pertama ialah mengimport pustaka Pandas di bawah alias `pd`. Seterusnya, kita perlu memuatkan data daripada fail CSV ke dalam objek DataFrame menggunakan fungsi `pd.read_csv()`, menyatakan nama fail input ('your_spreadsheet.csv').

Kini datang bahagian utama masalah: mengakses dan mengemas kini sel yang dikehendaki. Dalam contoh ini, kami ingin mengemas kini lajur 'Umur' dengan menambah 1 pada setiap nilai dalam lajur. Kami melakukan ini dengan hanya menambah 1 pada lajur 'Umur', yang diakses menggunakan sintaks `df['Umur']`. Kod ini akan melakukan penambahan mengikut unsur 1 pada setiap item dalam lajur 'Umur'.

Akhir sekali, kami menyimpan DataFrame yang dikemas kini kembali ke fail CSV menggunakan fungsi `df.to_csv()` dengan nama fail output ('your_updated_spreadsheet.csv'). Parameter `index=False` digunakan untuk mengelak daripada menulis nombor baris pada fail output.

Indeks Pandas dan Memilih Data

Panda sangat bergantung pada konsep indeks untuk memilih dan memanipulasi data. Secara lalai, apabila memuatkan data daripada fail, Pandas memberikan a indeks angka ke setiap baris DataFrame, bermula dari 0. Apabila bekerja dengan data dalam Pandas, adalah penting untuk memahami cara yang berbeza untuk memilih dan menapis data berdasarkan nilai indeks atau nama lajur.

Contohnya, untuk memilih baris atau baris tertentu, anda boleh menggunakan pengindeks `iloc`, yang membolehkan anda mengakses baris berdasarkan indeks integernya:

# Select the first row of the DataFrame
first_row = df.iloc[0]

# Select rows 1 to 3 (excluding 3)
rows_1_to_2 = df.iloc[1:3]

Apabila anda perlu mengemas kini sel berdasarkan keadaan tertentu, seperti mengemas kini lajur 'Umur' untuk hanya baris yang lajur lain (cth, 'Bandar') mempunyai nilai tertentu, anda boleh menggunakan pengindeksan boolean:

# Update the 'Age' column by adding 1, only for rows where 'City' is equal to 'New York'
df.loc[df['City'] == 'New York', 'Age'] = df['Age'] + 1

Dalam contoh ini, pengindeks `loc` digunakan untuk memilih baris berdasarkan keadaan boolean, dan kemudian lajur 'Umur' dikemas kini.

Perlu diingat bahawa ini hanyalah puncak gunung ais apabila ia berkaitan dengan data dalam Pandas. Perpustakaan menyediakan pelbagai fungsi dan teknik untuk memanipulasi, menganalisis dan menggambarkan data anda dengan cekap. Memahami asas, seperti mengemas kini sel dalam helaian mengikut nama lajur, menetapkan asas yang kukuh untuk bekerja dengan struktur data dan tugas analisis yang lebih kompleks pada masa hadapan.

Related posts:

Tinggalkan komen