แก้ไขแล้ว: เพิ่มคอลัมน์ใหม่ใน pandas dataframe

ในบทความนี้ เราจะสำรวจกระบวนการเพิ่มคอลัมน์ใหม่ใน Pandas DataFrame ซึ่งเป็นไลบรารียอดนิยมใน Python สำหรับการจัดการและวิเคราะห์ข้อมูล เราจะหารือเกี่ยวกับวิธีแก้ปัญหานี้ อธิบายโค้ดทีละขั้นตอน และครอบคลุมหัวข้อและฟังก์ชันที่เกี่ยวข้องบางส่วนในไลบรารี Pandas Pandas เป็นไลบรารีที่ใช้กันอย่างแพร่หลายซึ่งมีโครงสร้างข้อมูลและเครื่องมือระดับสูง สมบูรณ์แบบสำหรับการวิเคราะห์ข้อมูลและจัดการงานอย่างมีประสิทธิภาพ

เริ่มต้นด้วย สมมติว่าเรามีชุดข้อมูลในรูปแบบของ Pandas DataFrame และเราต้องการเพิ่มคอลัมน์ใหม่เข้าไป นี่เป็นข้อกำหนดทั่วไปในขั้นตอนการจัดเตรียมข้อมูล ซึ่งมักจำเป็นสำหรับวิศวกรรมคุณลักษณะหรือเพื่อสร้างข้อมูลเพิ่มเติมตามคอลัมน์ที่มีอยู่ มาดูกันว่าสิ่งนี้จะสำเร็จได้อย่างไร

การเพิ่มคอลัมน์ใหม่ใน Pandas DataFrame

เราจะเริ่มต้นด้วยการนำเข้าไลบรารีที่จำเป็นและสร้าง DataFrame ตัวอย่าง

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

ตอนนี้ เรามาเพิ่มคอลัมน์ใหม่ 'Country' ให้กับ DataFrame ของเราด้วยค่าเริ่มต้น เช่น 'USA'

df['Country'] = 'USA'

โค้ดง่ายๆ บรรทัดนี้จะเพิ่มคอลัมน์ใหม่ชื่อ 'Country' ให้กับ DataFrame 'df' ที่มีอยู่ของเราโดยมีค่า 'USA' ในทุกแถว DataFrame ที่อัปเดตของเราจะมีลักษณะดังนี้:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

คำอธิบายรหัสทีละขั้นตอน

มาแบ่งรหัสและทำความเข้าใจทีละขั้นตอน

1. ขั้นแรก เรานำเข้าไลบรารี Pandas โดยใช้นามแฝงมาตรฐาน 'pd' สิ่งนี้ทำให้เราสามารถเข้าถึงฟังก์ชั่นและคลาสของ Pandas โดยใช้คำนำหน้า 'pd'

import pandas as pd

2. ต่อไป เราสร้างพจนานุกรม 'ข้อมูล' ที่มีข้อมูลตัวอย่างบางส่วน แต่ละคีย์ในพจนานุกรมแทนชื่อคอลัมน์ และค่าที่เกี่ยวข้องคือรายการค่าสำหรับคอลัมน์นั้น

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. จากนั้นเราจะแปลงพจนานุกรมนี้เป็นวัตถุ Pandas DataFrame โดยใช้ฟังก์ชัน `pd.DataFrame()`

df = pd.DataFrame(data)

4. สุดท้าย ในการเพิ่มคอลัมน์ใหม่ เราเพียงแค่ใช้ตัวดำเนินการกำหนด “=” กับ DataFrame โดยระบุชื่อคอลัมน์ใหม่ภายในวงเล็บเหลี่ยมและระบุค่าเริ่มต้น ในกรณีของเรา เราได้เพิ่มคอลัมน์ 'ประเทศ' ด้วยค่าเริ่มต้น 'สหรัฐอเมริกา'

df['Country'] = 'USA'

ห้องสมุด Pandas และฟังก์ชั่นที่เกี่ยวข้อง

Pandas เป็นไลบรารี Python ที่ทรงพลัง เหมาะอย่างยิ่งสำหรับการประมวลผลข้อมูล การล้างข้อมูล และงานวิเคราะห์ มันมีสองโครงสร้างข้อมูลหลัก: ดาต้าเฟรม และ ชุด. DataFrame เป็นโครงสร้างข้อมูลแบบตารางสองมิติที่มีแกนกำกับ (แถวและคอลัมน์) ในทางกลับกัน ซีรีส์คืออาร์เรย์ที่มีป้ายกำกับหนึ่งมิติที่สามารถเก็บข้อมูลประเภทใดก็ได้

ฟังก์ชัน Pandas ทั่วไปบางอย่างที่เกี่ยวข้องกับการเพิ่ม แก้ไข และลบคอลัมน์ใน DataFrame มีดังนี้:

  • แทรก(): เพื่อแทรกคอลัมน์ในตำแหน่งที่กำหนด
  • หยด(): หากต้องการลบคอลัมน์ออกจาก DataFrame
  • เปลี่ยนชื่อ (): หากต้องการเปลี่ยนชื่อคอลัมน์ของ DataFrame
  • กำหนด(): เพื่อสร้างคอลัมน์ใหม่ตามผลลัพธ์ของนิพจน์

ดังนั้น การเพิ่มคอลัมน์ใหม่ใน Pandas DataFrame จึงทำได้ง่ายและมีประสิทธิภาพ ในบทความนี้ เราได้กล่าวถึงวิธีการพื้นฐานในการเพิ่มคอลัมน์ใหม่ด้วยค่าเริ่มต้น และให้คำอธิบายโดยละเอียดสำหรับขั้นตอนต่างๆ ที่เกี่ยวข้อง นอกจากนี้ เรายังแนะนำ Pandas ให้เป็นไลบรารีจัดการข้อมูลที่มีประสิทธิภาพ และกล่าวถึงฟังก์ชันที่เกี่ยวข้องสำหรับการจัดการคอลัมน์ DataFrame เมื่อเชี่ยวชาญเทคนิคเหล่านี้ คุณจะมีความพร้อมในการจัดการงานประมวลผลข้อมูลที่หลากหลายใน Python

กระทู้ที่เกี่ยวข้อง:

แสดงความคิดเห็น