แก้ไขแล้ว: เพิ่มหลายคอลัมน์ลงใน dataframe หากไม่มีแพนด้าอยู่

Pandas เป็นไลบรารี Python แบบโอเพ่นซอร์สที่มีโครงสร้างข้อมูลประสิทธิภาพสูง ใช้งานง่าย และเครื่องมือวิเคราะห์ข้อมูล มันกลายเป็นตัวเลือกที่นักพัฒนาและนักวิทยาศาสตร์ข้อมูลต้องการเมื่อพูดถึงการจัดการและวิเคราะห์ข้อมูล หนึ่งในคุณสมบัติอันทรงพลังที่ Pandas มีให้คือการสร้างและแก้ไขดาต้าเฟรม ในบทความนี้ เราจะสำรวจกระบวนการเพิ่มหลายคอลัมน์ใน dataframe หากไม่มีอยู่ โดยใช้ไลบรารี pandas เราจะแนะนำคำอธิบายทีละขั้นตอนของโค้ดและดำดิ่งสู่ฟังก์ชันที่เกี่ยวข้อง ไลบรารี และปัญหาที่คุณอาจพบระหว่างทาง

การทำงานกับ dataframes เป็นสิ่งสำคัญในการจัดการข้อมูล และบ่อยครั้งที่คุณอาจพบว่าตัวเองอยู่ในสถานการณ์ที่คุณจำเป็นต้องเพิ่มหลายคอลัมน์พร้อมกันไปยัง dataframe อาจเป็นเรื่องยุ่งยาก แต่ไลบรารี่ของ Pandas ทำให้งานนี้ราบรื่นและมีประสิทธิภาพ ขั้นแรก เริ่มต้นด้วยการนำเข้าไลบรารี่ของ Pandas:

import pandas as pd

การเพิ่มหลายคอลัมน์ใน Pandas Dataframe

ในการเพิ่มหลายคอลัมน์ลงใน dataframe เราสามารถใช้เมธอด DataFrame.assign() วิธีนี้ช่วยให้เราสามารถเพิ่มหนึ่งหรือหลายคอลัมน์ในดาต้าเฟรมพร้อมกัน มาสร้าง dataframe ตัวอย่างแล้วเพิ่มหลายคอลัมน์เข้าไปถ้ายังไม่มี:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

ตัว Vortex Indicator ได้ถูกนำเสนอลงในนิตยสาร ข้อมูลโค้ดด้านบนก่อนอื่น เราสร้าง dataframe ตัวอย่างที่มีสองคอลัมน์ 'column1' และ 'column2' จากนั้นเราสร้างรายการของคอลัมน์ใหม่ 'column3' และ 'column4' ที่เราต้องการเพิ่มใน dataframe สุดท้าย เราวนซ้ำตามรายการของคอลัมน์และเพิ่มคอลัมน์ใหม่หากยังไม่มีอยู่ในดาต้าเฟรม

คำอธิบายทีละขั้นตอน

นี่คือขั้นตอนทีละขั้นตอน คำอธิบายของแต่ละส่วน จากโซลูชันของเรา:

1. เราเริ่มต้นด้วยการนำเข้าห้องสมุด Pandas โดยใช้ "import pandas as pd"
2. ต่อไป เราสร้าง dataframe ตัวอย่างชื่อ 'df' โดยมีสองคอลัมน์: 'column1' และ 'column2'
3. เราสร้างรายการของคอลัมน์ใหม่ที่เราต้องการเพิ่มใน dataframe – 'column3' และ 'column4'
4. เราใช้ for วนซ้ำรายการคอลัมน์ใหม่
5. ภายในลูป เราตรวจสอบว่าคอลัมน์ใหม่มีอยู่แล้วในดาต้าเฟรมโดยใช้เงื่อนไข 'ไม่อยู่ใน' ถ้าไม่มีคอลัมน์ใหม่ เราจะเพิ่มคอลัมน์ใหม่ไปยัง dataframe ด้วยค่าเริ่มต้นเป็นไม่มี

ฟังก์ชันและไลบรารีของ Pandas

Pandas นำเสนอฟังก์ชันและวิธีการมากมายที่ช่วยให้การจัดการและจัดการดาต้าเฟรมง่ายขึ้น ในโซลูชันของเรา เราใช้ส่วนประกอบหลักดังต่อไปนี้:

  • ดาต้าเฟรม – ในฐานะโครงสร้างข้อมูลหลักในแพนด้า DataFrame เป็นข้อมูลแบบตารางสองมิติ เปลี่ยนแปลงไม่ได้ และอาจแตกต่างกันซึ่งมีแกนกำกับ (แถวและคอลัมน์)
  • DataFrame.columns – คุณลักษณะนี้ส่งคืนป้ายชื่อคอลัมน์ของ DataFrame ทำให้เราสามารถเข้าถึงและตรวจสอบว่ามีคอลัมน์อยู่หรือไม่
  • pd.DataFrame() – เป็นฟังก์ชันคอนสตรัคเตอร์ในการสร้างดาต้าเฟรมใหม่ ช่วยให้คุณสามารถกำหนดข้อมูลและชื่อคอลัมน์ระหว่างการสร้าง

ตอนนี้คุณมีความเข้าใจที่ดีขึ้นเกี่ยวกับวิธีการ เพิ่มหลายคอลัมน์ ไปยังดาต้าเฟรมของ Pandas เทคนิคนี้จะช่วยให้คุณจัดการและจัดการข้อมูลได้อย่างมีประสิทธิภาพ โปรดจำไว้ว่า Pandas นำเสนอคุณสมบัติที่ทรงพลังอื่น ๆ มากมายสำหรับการวิเคราะห์และจัดการข้อมูล ดังนั้นอย่าลืมสำรวจคุณสมบัติเหล่านั้นด้วยเพื่อเป็นผู้พัฒนา Python ที่มีประสิทธิภาพมากขึ้น

กระทู้ที่เกี่ยวข้อง:

แสดงความคิดเห็น