Pandas เป็นไลบรารี Python แบบโอเพ่นซอร์สที่มีโครงสร้างข้อมูลประสิทธิภาพสูง ใช้งานง่าย และเครื่องมือวิเคราะห์ข้อมูล มันกลายเป็นตัวเลือกที่นักพัฒนาและนักวิทยาศาสตร์ข้อมูลต้องการเมื่อพูดถึงการจัดการและวิเคราะห์ข้อมูล หนึ่งในคุณสมบัติอันทรงพลังที่ Pandas มีให้คือการสร้างและแก้ไขดาต้าเฟรม ในบทความนี้ เราจะสำรวจกระบวนการเพิ่มหลายคอลัมน์ใน dataframe หากไม่มีอยู่ โดยใช้ไลบรารี pandas เราจะแนะนำคำอธิบายทีละขั้นตอนของโค้ดและดำดิ่งสู่ฟังก์ชันที่เกี่ยวข้อง ไลบรารี และปัญหาที่คุณอาจพบระหว่างทาง
การทำงานกับ dataframes เป็นสิ่งสำคัญในการจัดการข้อมูล และบ่อยครั้งที่คุณอาจพบว่าตัวเองอยู่ในสถานการณ์ที่คุณจำเป็นต้องเพิ่มหลายคอลัมน์พร้อมกันไปยัง dataframe อาจเป็นเรื่องยุ่งยาก แต่ไลบรารี่ของ Pandas ทำให้งานนี้ราบรื่นและมีประสิทธิภาพ ขั้นแรก เริ่มต้นด้วยการนำเข้าไลบรารี่ของ Pandas:
import pandas as pd
การเพิ่มหลายคอลัมน์ใน Pandas Dataframe
ในการเพิ่มหลายคอลัมน์ลงใน dataframe เราสามารถใช้เมธอด DataFrame.assign() วิธีนี้ช่วยให้เราสามารถเพิ่มหนึ่งหรือหลายคอลัมน์ในดาต้าเฟรมพร้อมกัน มาสร้าง dataframe ตัวอย่างแล้วเพิ่มหลายคอลัมน์เข้าไปถ้ายังไม่มี:
# Create a sample dataframe data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]} df = pd.DataFrame(data) # Add multiple columns if they do not exist new_columns = ['column3', 'column4'] for new_col in new_columns: if new_col not in df.columns: df[new_col] = None
ตัว Vortex Indicator ได้ถูกนำเสนอลงในนิตยสาร ข้อมูลโค้ดด้านบนก่อนอื่น เราสร้าง dataframe ตัวอย่างที่มีสองคอลัมน์ 'column1' และ 'column2' จากนั้นเราสร้างรายการของคอลัมน์ใหม่ 'column3' และ 'column4' ที่เราต้องการเพิ่มใน dataframe สุดท้าย เราวนซ้ำตามรายการของคอลัมน์และเพิ่มคอลัมน์ใหม่หากยังไม่มีอยู่ในดาต้าเฟรม
คำอธิบายทีละขั้นตอน
นี่คือขั้นตอนทีละขั้นตอน คำอธิบายของแต่ละส่วน จากโซลูชันของเรา:
1. เราเริ่มต้นด้วยการนำเข้าห้องสมุด Pandas โดยใช้ "import pandas as pd"
2. ต่อไป เราสร้าง dataframe ตัวอย่างชื่อ 'df' โดยมีสองคอลัมน์: 'column1' และ 'column2'
3. เราสร้างรายการของคอลัมน์ใหม่ที่เราต้องการเพิ่มใน dataframe – 'column3' และ 'column4'
4. เราใช้ for วนซ้ำรายการคอลัมน์ใหม่
5. ภายในลูป เราตรวจสอบว่าคอลัมน์ใหม่มีอยู่แล้วในดาต้าเฟรมโดยใช้เงื่อนไข 'ไม่อยู่ใน' ถ้าไม่มีคอลัมน์ใหม่ เราจะเพิ่มคอลัมน์ใหม่ไปยัง dataframe ด้วยค่าเริ่มต้นเป็นไม่มี
ฟังก์ชันและไลบรารีของ Pandas
Pandas นำเสนอฟังก์ชันและวิธีการมากมายที่ช่วยให้การจัดการและจัดการดาต้าเฟรมง่ายขึ้น ในโซลูชันของเรา เราใช้ส่วนประกอบหลักดังต่อไปนี้:
- ดาต้าเฟรม – ในฐานะโครงสร้างข้อมูลหลักในแพนด้า DataFrame เป็นข้อมูลแบบตารางสองมิติ เปลี่ยนแปลงไม่ได้ และอาจแตกต่างกันซึ่งมีแกนกำกับ (แถวและคอลัมน์)
- DataFrame.columns – คุณลักษณะนี้ส่งคืนป้ายชื่อคอลัมน์ของ DataFrame ทำให้เราสามารถเข้าถึงและตรวจสอบว่ามีคอลัมน์อยู่หรือไม่
- pd.DataFrame() – เป็นฟังก์ชันคอนสตรัคเตอร์ในการสร้างดาต้าเฟรมใหม่ ช่วยให้คุณสามารถกำหนดข้อมูลและชื่อคอลัมน์ระหว่างการสร้าง
ตอนนี้คุณมีความเข้าใจที่ดีขึ้นเกี่ยวกับวิธีการ เพิ่มหลายคอลัมน์ ไปยังดาต้าเฟรมของ Pandas เทคนิคนี้จะช่วยให้คุณจัดการและจัดการข้อมูลได้อย่างมีประสิทธิภาพ โปรดจำไว้ว่า Pandas นำเสนอคุณสมบัติที่ทรงพลังอื่น ๆ มากมายสำหรับการวิเคราะห์และจัดการข้อมูล ดังนั้นอย่าลืมสำรวจคุณสมบัติเหล่านั้นด้วยเพื่อเป็นผู้พัฒนา Python ที่มีประสิทธิภาพมากขึ้น