A Pandas egy erőteljes és sokoldalú Python-könyvtár, amelyet széles körben használnak adatkezelésre és -elemzésre. Az adatokkal való munka során az egyik gyakori követelmény több oszlop beszúrása egy DataFrame-be. Ebben a cikkben megvizsgáljuk, hogyan lehet több oszlopot hozzáadni egy DataFrame-hez a Pandas könyvtár használatával, megvitatjuk a kódot, és mélyebbre merülünk a kapcsolódó funkciókban, könyvtárakban és fogalmakban, amelyek segítségével Pandas szakértővé válhat.
Több oszlop hozzáadása egy Pandas DataFrame-hez
Ha több oszlopot szeretne beszúrni egy DataFrame-be, akkor a concat funkció elérhető a Pandas könyvtárban. Ez a funkció lehetővé teszi több DataFrame kombinálását egymás mellett, akár sorok, akár oszlopok mentén. Új oszlopok beszúrásakor a DataFrame-eket oszlopok mentén kombináljuk. Kezdjük a problémánk megoldásával.
import pandas as pd # Create a sample DataFrame data = { 'A': [1, 2, 3], 'B': [4, 5, 6] } df = pd.DataFrame(data) # Create new columns to be inserted new_columns = { 'C': [7, 8, 9], 'D': [10, 11, 12] } new_df = pd.DataFrame(new_columns) # Insert new columns into the existing DataFrame result = pd.concat([df, new_df], axis=1) print(result)
A kódex lépésről lépésre történő magyarázata
Példánkban lépésről lépésre végigmegyünk a folyamaton, hogy megértsük a kód működését.
1. Először is végrehajtva importáljuk a szükséges könyvtárat, a Pandát import pandák, mint pd. Ez lehetővé teszi számunkra, hogy Pandas függvényeket használjunk a szkriptünkben.
2. Ezután létrehozunk egy minta DataFrame-et df és egy új DataFrame az új oszlopokhoz, new_df.
3. Az új oszlopok (new_df) beillesztéséhez az eredeti DataFrame-ünkbe (df) használjuk a pd.concat funkció. Meghatározásával tengely=1, azt mondjuk a függvénynek, hogy fűzze össze az oszlopokat, és helyezze az új oszlopokat a meglévő DataFrame mellé.
4. Végül kinyomtatjuk az eredményül kapott DataFrame-et, hogy megbizonyosodjunk arról, hogy az új oszlopok megfelelően lettek beszúrva.
Speciális használati esetek és technikák
Míg a concat funkció egy hatékony eszköz több oszlop beszúrására egy DataFrame-be, előfordulhat, hogy olyan forgatókönyvekkel találkozhat, amelyekben speciális célok eléréséhez fejlettebb technikákra van szükség. Ebben a részben megvitatunk néhány további módszert, amelyek segítségével szakértővé válhat a DataFrames Pandas könyvtár használatával történő manipulálásában.
-
Oszlop beszúrása egy adott pozícióba
Azokban az esetekben, amikor egy oszlopot kell beszúrnia a DataFrame egy adott helyére, a helyezze módszer értékes lehetőség. Ez a módszer lehetővé teszi egy oszlop beszúrását egy megadott index elé. Íme egy példa kód:
# Insert column 'E' with values [13, 14, 15] before index 1 (after the first column) df.insert(1, 'E', [13, 14, 15])
-
Más oszlopokból származó oszlopok beszúrása
Néha előfordulhat, hogy új oszlopokat szeretne beszúrni a DataFrame más oszlopaiból. Az új oszlopok létrehozásához számításokat végezhet a meglévő adatokon. Például az „A” és „B” oszlopok szorzatának kiszámításához:
df['F'] = df['A'] * df['B']
Ebben a cikkben bemutattuk, hogyan lehet több oszlopot beszúrni a Pandas DataFrame használatával concat funkciót, megtanulta a kód lépésről lépésre történő magyarázatát, valamint fejlett használati eseteket és technikákat fedezett fel. Ezzel a tudással most már hatékonyan manipulálhatja adatait, és hatékonyabbá teheti adatelemzési feladatait.