Išspręsta: pridėkite kelis stulpelius į duomenų rėmelį, jei pandų nėra

Pandas yra atvirojo kodo Python biblioteka, teikianti didelio našumo, lengvai naudojamas duomenų struktūras ir duomenų analizės įrankius. Tai tapo pagrindiniu kūrėjų ir duomenų mokslininkų pasirinkimu, kai kalbama apie duomenų apdorojimą ir analizę. Viena iš galingų Pandas teikiamų funkcijų yra duomenų rėmelių kūrimas ir keitimas. Šiame straipsnyje mes išnagrinėsime kelių stulpelių įtraukimo į duomenų rėmelį procesą, jei jų nėra, naudojant pandų biblioteką. Žingsnis po žingsnio paaiškinsime kodą ir pasinersime į susijusias funkcijas, bibliotekas ir problemas, su kuriomis galite susidurti.

Darbas su duomenų rėmeliais yra labai svarbus tvarkant duomenis, todėl dažnai galite atsidurti situacijoje, kai prie duomenų rėmelio reikia vienu metu pridėti kelis stulpelius. Tai gali būti sudėtinga, tačiau Pandas biblioteka leidžia atlikti šią užduotį sklandžiai ir efektyviai. Pirmiausia pradėkime importuodami Pandas biblioteką:

import pandas as pd

Kelių stulpelių įtraukimas į Pandas duomenų rėmelį

Norėdami į duomenų rėmelį įtraukti kelis stulpelius, galime naudoti metodą DataFrame.assign(). Šis metodas leidžia į duomenų rėmelį vienu metu pridėti vieną ar kelis stulpelius. Sukurkime duomenų rėmelio pavyzdį ir pridėkime prie jo kelis stulpelius, jei jų dar nėra:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

Lauke kodo fragmentas aukščiau, pirmiausia sukuriame duomenų rėmelio pavyzdį su dviem stulpeliais „stulpelis1“ ir „stulpelis2“. Tada sukuriame sąrašą naujų stulpelių „column3“ ir „column4“, kuriuos norime įtraukti į duomenų rėmelį. Galiausiai pakartojame stulpelių sąrašą ir pridedame naują stulpelį, jei jo dar nėra duomenų rėmelyje.

Žingsnis po žingsnio paaiškinimas

Štai žingsnis po žingsnio kiekvienos dalies paaiškinimas mūsų sprendimas:

1. Pradedame importuodami Pandas biblioteką naudodami "import pandas as pd".
2. Tada sukuriame duomenų rėmelio pavyzdį, vadinamą „df“ su dviem stulpeliais: „column1“ ir „column2“.
3. Sudarome sąrašą naujų stulpelių, kuriuos norime įtraukti į duomenų rėmelį – 'column3' ir 'column4'.
4. Naujų stulpelių sąraše kartoti naudojame for kilpą.
5. Ciklo metu patikriname, ar naujas stulpelis jau yra duomenų rėmelyje, naudodami sąlygą „ne“. Jei naujo stulpelio nėra, naują stulpelį įtraukiame į duomenų rėmelį, kurio numatytoji reikšmė yra Nėra.

Pandos funkcijos ir bibliotekos

Pandas siūlo daugybę funkcijų ir metodų, kurie supaprastina duomenų rėmelių tvarkymą ir manipuliavimą. Savo sprendime naudojome šiuos pagrindinius komponentus:

  • DataFrame – „DataFrame“, kaip pagrindinė pandų duomenų struktūra, yra dvimatis, kintantis, potencialiai nevienalytis lentelės duomenys su pažymėtomis ašimis (eilelėmis ir stulpeliais)
  • DataFrame.columns – Šis atributas grąžina DataFrame stulpelių etiketes, leidžiančias mums pasiekti ir patikrinti, ar stulpelis yra, ar ne.
  • pd.DataFrame() – Tai konstruktoriaus funkcija sukurti naują duomenų rėmelį. Tai leidžia apibrėžti duomenis ir stulpelių pavadinimus kuriant.

Dabar, kai jūs geriau suprantate, kaip tai padaryti pridėti kelis stulpelius į Pandas duomenų rėmelį, ši technika padės efektyviai valdyti duomenis ir jais manipuliuoti. Atminkite, kad „Pandas“ siūlo daugybę kitų galingų duomenų analizės ir manipuliavimo funkcijų, todėl būtinai ištyrinėkite ir jas, kad taptumėte efektyvesniu „Python“ kūrėju.

Susijusios naujienos:

Palikite komentarą