ในบทความนี้ เราจะสำรวจกระบวนการเพิ่มคอลัมน์ใหม่ใน Pandas DataFrame ซึ่งเป็นไลบรารียอดนิยมใน Python สำหรับการจัดการและวิเคราะห์ข้อมูล เราจะหารือเกี่ยวกับวิธีแก้ปัญหานี้ อธิบายโค้ดทีละขั้นตอน และครอบคลุมหัวข้อและฟังก์ชันที่เกี่ยวข้องบางส่วนในไลบรารี Pandas Pandas เป็นไลบรารีที่ใช้กันอย่างแพร่หลายซึ่งมีโครงสร้างข้อมูลและเครื่องมือระดับสูง สมบูรณ์แบบสำหรับการวิเคราะห์ข้อมูลและจัดการงานอย่างมีประสิทธิภาพ
เริ่มต้นด้วย สมมติว่าเรามีชุดข้อมูลในรูปแบบของ Pandas DataFrame และเราต้องการเพิ่มคอลัมน์ใหม่เข้าไป นี่เป็นข้อกำหนดทั่วไปในขั้นตอนการจัดเตรียมข้อมูล ซึ่งมักจำเป็นสำหรับวิศวกรรมคุณลักษณะหรือเพื่อสร้างข้อมูลเพิ่มเติมตามคอลัมน์ที่มีอยู่ มาดูกันว่าสิ่งนี้จะสำเร็จได้อย่างไร
การเพิ่มคอลัมน์ใหม่ใน Pandas DataFrame
เราจะเริ่มต้นด้วยการนำเข้าไลบรารีที่จำเป็นและสร้าง DataFrame ตัวอย่าง
import pandas as pd data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'], 'Age': [25, 28, 23, 22], 'City': ['NY', 'LA', 'SF', 'Chicago']} df = pd.DataFrame(data)
ตอนนี้ เรามาเพิ่มคอลัมน์ใหม่ 'Country' ให้กับ DataFrame ของเราด้วยค่าเริ่มต้น เช่น 'USA'
df['Country'] = 'USA'
โค้ดง่ายๆ บรรทัดนี้จะเพิ่มคอลัมน์ใหม่ชื่อ 'Country' ให้กับ DataFrame 'df' ที่มีอยู่ของเราโดยมีค่า 'USA' ในทุกแถว DataFrame ที่อัปเดตของเราจะมีลักษณะดังนี้:
Name Age City Country 0 Alex 25 NY USA 1 Tom 28 LA USA 2 Nick 23 SF USA 3 Sam 22 Chicago USA
คำอธิบายรหัสทีละขั้นตอน
มาแบ่งรหัสและทำความเข้าใจทีละขั้นตอน
1. ขั้นแรก เรานำเข้าไลบรารี Pandas โดยใช้นามแฝงมาตรฐาน 'pd' สิ่งนี้ทำให้เราสามารถเข้าถึงฟังก์ชั่นและคลาสของ Pandas โดยใช้คำนำหน้า 'pd'
import pandas as pd
2. ต่อไป เราสร้างพจนานุกรม 'ข้อมูล' ที่มีข้อมูลตัวอย่างบางส่วน แต่ละคีย์ในพจนานุกรมแทนชื่อคอลัมน์ และค่าที่เกี่ยวข้องคือรายการค่าสำหรับคอลัมน์นั้น
data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'], 'Age': [25, 28, 23, 22], 'City': ['NY', 'LA', 'SF', 'Chicago']}
3. จากนั้นเราจะแปลงพจนานุกรมนี้เป็นวัตถุ Pandas DataFrame โดยใช้ฟังก์ชัน `pd.DataFrame()`
df = pd.DataFrame(data)
4. สุดท้าย ในการเพิ่มคอลัมน์ใหม่ เราเพียงแค่ใช้ตัวดำเนินการกำหนด “=” กับ DataFrame โดยระบุชื่อคอลัมน์ใหม่ภายในวงเล็บเหลี่ยมและระบุค่าเริ่มต้น ในกรณีของเรา เราได้เพิ่มคอลัมน์ 'ประเทศ' ด้วยค่าเริ่มต้น 'สหรัฐอเมริกา'
df['Country'] = 'USA'
ห้องสมุด Pandas และฟังก์ชั่นที่เกี่ยวข้อง
Pandas เป็นไลบรารี Python ที่ทรงพลัง เหมาะอย่างยิ่งสำหรับการประมวลผลข้อมูล การล้างข้อมูล และงานวิเคราะห์ มันมีสองโครงสร้างข้อมูลหลัก: ดาต้าเฟรม และ ชุด. DataFrame เป็นโครงสร้างข้อมูลแบบตารางสองมิติที่มีแกนกำกับ (แถวและคอลัมน์) ในทางกลับกัน ซีรีส์คืออาร์เรย์ที่มีป้ายกำกับหนึ่งมิติที่สามารถเก็บข้อมูลประเภทใดก็ได้
ฟังก์ชัน Pandas ทั่วไปบางอย่างที่เกี่ยวข้องกับการเพิ่ม แก้ไข และลบคอลัมน์ใน DataFrame มีดังนี้:
- แทรก(): เพื่อแทรกคอลัมน์ในตำแหน่งที่กำหนด
- หยด(): หากต้องการลบคอลัมน์ออกจาก DataFrame
- เปลี่ยนชื่อ (): หากต้องการเปลี่ยนชื่อคอลัมน์ของ DataFrame
- กำหนด(): เพื่อสร้างคอลัมน์ใหม่ตามผลลัพธ์ของนิพจน์
ดังนั้น การเพิ่มคอลัมน์ใหม่ใน Pandas DataFrame จึงทำได้ง่ายและมีประสิทธิภาพ ในบทความนี้ เราได้กล่าวถึงวิธีการพื้นฐานในการเพิ่มคอลัมน์ใหม่ด้วยค่าเริ่มต้น และให้คำอธิบายโดยละเอียดสำหรับขั้นตอนต่างๆ ที่เกี่ยวข้อง นอกจากนี้ เรายังแนะนำ Pandas ให้เป็นไลบรารีจัดการข้อมูลที่มีประสิทธิภาพ และกล่าวถึงฟังก์ชันที่เกี่ยวข้องสำหรับการจัดการคอลัมน์ DataFrame เมื่อเชี่ยวชาญเทคนิคเหล่านี้ คุณจะมีความพร้อมในการจัดการงานประมวลผลข้อมูลที่หลากหลายใน Python