Išspręsta: pandos užklausos grąžinimo stulpelis

Pandas yra plačiai populiari Python biblioteka, naudojama duomenų analizės ir manipuliavimo srityje. Šiais laikais analizuoti ir dirbti su didžiuliu duomenų kiekiu yra svarbiau nei bet kada anksčiau, o Pandos atlieka esminį vaidmenį teikdamos šiam tikslui reikalingas priemones. Viena iš reikšmingų užduočių, dažnai atliekamų atliekant duomenų analizę, yra galimybė pateikti užklausą konkrečios informacijos ir grąžinti stulpelį pagal tam tikras sąlygas. Šiame straipsnyje aptarsime, kaip gauti tokius rezultatus naudojant galingą Pandas biblioteką, kartu su išsamiu kodo, funkcijų ir reikalingų bibliotekų paaiškinimu.

Būtinos sąlygos: Pandų montavimas

Prieš pasinerdami į sprendimą, jūsų sistemoje turi būti įdiegtos Pandas. Jei dar nesate įdiegę Pandas, galite naudoti šią komandą, kad ją įdiegtumėte naudodami Python paketų tvarkyklę, pip:

pip install pandas

Sėkmingai įdiegę Pandas, importuokite jį į savo Python scenarijų naudodami:

import pandas as pd

Dabar, kai įdiegėme Pandas ir importavome į savo scenarijų, pereikime prie problemos sprendimo.

Problemos sprendimas: duomenų rėmelio užklausa ir stulpelio grąžinimas

Darant prielaidą, kad turime „DataFrame“ ir turime užklausti konkrečios informacijos pagal tam tikras sąlygas, pavyzdžiui, rasti stulpelį „amžius“, kuriame reikšmės yra didesnės už nurodytą skaičių. Mes galime tai pasiekti naudodami Pandas' užklausa () funkcija.

Pirmiausia sukurkime pavyzdinį „DataFrame“ su kai kuriais duomenimis demonstravimo tikslais:

data = {
    "Name": ["Alice", "Bob", "Charlie", "David", "Eve"],
    "Age": [25, 32, 29, 41, 38],
    "City": ["New York", "San Francisco", "Los Angeles", "Chicago", "Miami"]
}

df = pd.DataFrame(data)

Žingsnis po žingsnio paaiškinimas: darbas su Pandas Query funkcija

Dabar, kai sukūrėme „DataFrame“ pavyzdį, išskaidykime užklausos ir reikiamų duomenų grąžinimo veiksmus:

1. Naudokite užklausa () funkcija filtruoti DataFrame pagal pateiktą sąlygą:

   age_filter = df.query('Age > 30')
   

Šios užklausa () funkcija priima eilutę su sąlyga, čia „Age > 30“, kad atitinkamai filtruotų duomenų rėmelį.

2. Jei norite grąžinti tik filtruoto duomenų rėmelio stulpelį „Amžius“, naudokite:

   result = age_filter['Age']
   

3. Galiausiai išspausdinkite rezultatą:

   print(result)
   

Kitos dėmesio vertos panašios funkcijos ir bibliotekos

Be to, užklausa () funkcija, yra ir kitų panašių „Panda“ alternatyvų, tokių kaip loc[] ir iloc[] funkcijas, kurios gali būti naudojamos tam pačiam tikslui filtruoti ir gauti duomenis. Funkcijos pasirinkimas priklauso nuo problemos sudėtingumo ir kodo paprastumo.

Be to, Pandas dažnai derinamas su kitomis bibliotekomis, kad būtų dar labiau pagerintos duomenų analizės galimybės. „NumPy“ yra skaitmeninių operacijų biblioteka, padedanti optimizuoti Pandas veikimą. Lygiagrečiai, matplotlib biblioteka padeda sukurti patrauklias duomenų vizualizacijas, todėl vartotojams lengviau suprasti duomenų šablonus.

Apibendrinant galima pasakyti, kad Pandas biblioteka yra pagrindinė duomenų analizės ir filtravimo priemonė, kartu su kitomis esminėmis bibliotekomis, tokiomis kaip NumPy ir Matplotlib, kad būtų galima naudotis lanksčiais ir efektyviais duomenų tvarkymo būdais.

Susijusios naujienos:

Palikite komentarą