Pandas ialah perpustakaan Python yang digunakan secara meluas untuk manipulasi dan analisis data, dan illoc ialah fungsi penting dalam perpustakaan yang membolehkan pengguna memilih dan memanipulasi data dengan pengindeksan berasaskan integer. Ini amat berguna apabila bekerja dengan set data yang besar. Dalam artikel ini, kita akan meneroka penggunaan panda iloc dalam pelbagai senario dan terangkan cara fungsi berfungsi langkah demi langkah untuk membantu anda memahami kepentingannya dan aplikasi yang berpotensi dalam analisis data.
panda iloc: Penyelesaian kepada Masalah Biasa
Cabaran biasa yang dihadapi oleh penganalisis data ialah cara memilih dan menganalisis bahagian tertentu set data mereka dengan cekap. Objek DataFrame dalam panda menawarkan banyak kaedah yang sangat baik untuk menangani cabaran ini, dan salah satu fungsi yang paling serba boleh dan berkuasa ialah illoc pengindeks. Ia membolehkan pengguna mengakses baris dan lajur DataFrame berdasarkan pengindeksan berasaskan integer.
Mari kita mulakan dengan membincangkan penjelasan langkah demi langkah tentang cara menggunakan iloc dalam senario analisis data praktikal.
Penjelasan Langkah demi Langkah Pandas iloc
Menggunakan panda iloc adalah mudah dan intuitif. Katakan kita mempunyai DataFrame berikut:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Cathy', 'David'], 'Age': [25, 29, 21, 35], 'City': ['New York', 'San Francisco', 'Los Angeles', 'Boston']} df = pd.DataFrame(data)
DataFrame kami mempunyai 4 baris dan 3 lajur. Untuk menggunakan iloc, anda perlu menyediakan indeks untuk baris dan lajur yang ingin anda akses. Berikut adalah beberapa contoh:
1. Mengakses baris dan lajur tertentu:
# Access row 2 (index 1) and column 'Name' (index 0) selected_data = df.iloc[1, 0] print(selected_data) # Output: Bob
2. Mengakses julat baris dan lajur:
# Access rows 1 to 3 (indexes 0 and 1) and columns 'Name' and 'Age' (indexes 0 and 1) selected_data = df.iloc[0:2, 0:2] print(selected_data) # Output: # Name Age # 0 Alice 25 # 1 Bob 29
3. Mengakses baris dan lajur tertentu:
# Access rows 1 and 4 (indexes 0 and 3) and columns 'Name' and 'City' (indexes 0 and 2) selected_data = df.iloc[[0, 3], [0, 2]] print(selected_data) # Output: # Name City # 0 Alice New York # 3 David Boston
Perpustakaan dan Tanggungan
Untuk menggunakan panda iloc, anda perlu memasang pustaka panda, serta mana-mana perpustakaan lain yang bergantung kepada panda, seperti NumPy. Anda boleh memasangnya melalui pip atau conda:
pip install pandas numpy
or
conda install pandas numpy
Setelah perpustakaan dipasang, anda boleh mula menggunakan panda dan iloc dalam persekitaran Python anda seperti yang ditunjukkan dalam contoh di atas.
Fungsi Berkaitan Lain dan Kaedah Pengindeksan
Di samping illoc, panda menyediakan beberapa fungsi dan kaedah pengindeksan lain yang boleh berguna dalam situasi yang berbeza. Beberapa yang utama ialah:
- loc: Pengindeks ini membenarkan pengguna mengakses baris dan lajur berdasarkan pengindeksan berasaskan label, dan bukannya pengindeksan berasaskan integer seperti iloc.
- di: Ia digunakan untuk mengakses satu nilai berdasarkan pengindeksan berasaskan label.
- iat: Sama seperti 'at', tetapi untuk pengindeksan berasaskan integer. Ia digunakan untuk mengakses satu nilai berdasarkan pengindeksan berasaskan integer.
Meneroka fungsi ini dan memahami cara ia boleh digunakan dalam kombinasi dengan iloc akan mengukuhkan keupayaan anda untuk melakukan manipulasi data yang kompleks menggunakan panda.