U zgjidh: shtoni një kolonë të re në kornizën e të dhënave të pandas

Në këtë artikull, ne do të shqyrtojmë procesin e shtimit të një kolone të re në një Pandas DataFrame, një bibliotekë popullore në Python për manipulimin dhe analizën e të dhënave. Ne do të diskutojmë zgjidhjen e këtij problemi, do të kalojmë një shpjegim hap pas hapi të kodit dhe do të trajtojmë disa tema dhe funksione të lidhura në bibliotekën e Pandas. Pandas është një bibliotekë e përdorur gjerësisht që përmban struktura dhe mjete të nivelit të lartë të të dhënave, perfekte për analiza efikase të të dhënave dhe trajtimin e detyrave.

Për të filluar, le të supozojmë se kemi një grup të dhënash në formën e një Pandas DataFrame dhe duam të shtojmë një kolonë të re në të. Kjo është një kërkesë e zakonshme në fazën e përgatitjes së të dhënave, shpesh e nevojshme për inxhinierinë e veçorive ose për të gjeneruar informacion shtesë bazuar në kolonat ekzistuese. Le të shqyrtojmë se si mund të arrihet kjo.

Shtimi i një kolone të re në një Pandas DataFrame

Ne do të fillojmë duke importuar bibliotekën e kërkuar dhe duke krijuar një mostër DataFrame.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Tani, le të shtojmë një kolonë të re 'Vendi' në DataFrame tonë me një vlerë të paracaktuar, të themi 'SHBA'.

df['Country'] = 'USA'

Kjo linjë e thjeshtë kodi do të shtojë një kolonë të re të quajtur 'Shteti' në DataFrame ekzistuese 'df' me vlerën 'SHBA' në të gjitha rreshtat e saj. DataFrame jonë e përditësuar do të duket kështu:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Shpjegimi hap pas hapi i kodit

Le të zbërthejmë kodin dhe ta kuptojmë atë hap pas hapi.

1. Së pari, ne importojmë bibliotekën e Pandas duke përdorur pseudonimin standard 'pd'. Kjo na lejon të aksesojmë funksionet dhe klasat e Pandas duke përdorur prefiksin 'pd'.

import pandas as pd

2. Më pas, ne krijojmë një fjalor 'të dhëna' që përmban disa të dhëna mostër. Çdo çelës në fjalor përfaqëson një emër kolone dhe vlera e tij përkatëse është një listë vlerash për atë kolonë.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Më pas e konvertojmë këtë fjalor në një objekt Pandas DataFrame duke përdorur funksionin `pd.DataFrame()`.

df = pd.DataFrame(data)

4. Së fundi, për të shtuar një kolonë të re, ne thjesht përdorim operatorin e caktimit “=” me DataFrame, duke dhënë emrin e kolonës së re brenda kllapave katrore dhe duke specifikuar vlerën e paracaktuar. Në rastin tonë, ne shtuam kolonën "Vendi" me vlerën e paracaktuar "SHBA".

df['Country'] = 'USA'

Biblioteka e pandave dhe funksionet e ngjashme

Pandas është një bibliotekë e fuqishme Python, veçanërisht e përshtatshme për përpunimin e të dhënave, pastrimin dhe detyrat e analizës. Ai siguron dy struktura kryesore të të dhënave: Korniza e të Dhënave Seriale. DataFrame është një strukturë tabelare dydimensionale e të dhënave me boshte të etiketuara (rreshta dhe kolona). Një Seri, nga ana tjetër, është një grup njëdimensional i etiketuar i aftë për të mbajtur të dhëna të çdo lloji.

Disa funksione të zakonshme të Pandas që lidhen me shtimin, modifikimin dhe fshirjen e kolonave në një DataFrame janë si më poshtë:

  • insert(): Për të futur një kolonë në një pozicion të caktuar.
  • drop(): Për të hequr një kolonë nga DataFrame.
  • riemërto (): Për të riemërtuar një kolonë të DataFrame.
  • cakto (): Për të krijuar një kolonë të re bazuar në rezultatin e një shprehjeje.

Pra, shtimi i një kolone të re në një Pandas DataFrame është i thjeshtë dhe efikas. Në këtë artikull, ne kemi mbuluar metodën bazë të shtimit të një kolone të re me një vlerë të paracaktuar dhe kemi dhënë shpjegime të hollësishme për hapat e përfshirë. Ne kemi prezantuar gjithashtu Pandas si një bibliotekë të fuqishme të manipulimit të të dhënave dhe kemi diskutuar disa funksione të lidhura për menaxhimin e kolonave DataFrame. Duke zotëruar këto teknika, do të jeni të pajisur mirë për të trajtuar një gamë të gjerë detyrash të përpunimit të të dhënave në Python.

Mesazhe të ngjashme:

Lini një koment