Išspręsta: konvertuokite Pandos laiko žymų stulpelį į datą

Duomenų analizės pasaulyje įprasta susidurti su duomenų rinkiniais, kuriuose yra laiko žymos. Kartais norime supaprastinti ir atsižvelgti tik į datą, kuri gali būti naudinga įvairiems tikslams, pavyzdžiui, tendencijų analizei, prognozavimui ar vizualizavimui. Šiame straipsnyje parodysime, kaip **konvertuoti Pandas laiko žymų stulpelį į datą** naudojant Python, kad būtų lengviau dirbti su duomenimis ir juos suprasti. Supažindinsime su sprendimu, pateiksime nuoseklų kodo paaiškinimą, taip pat įsigilinsime į kai kurias susijusias bibliotekas ir funkcijas, kurios gali būti naudingesnės jūsų duomenų tvarkymo įgūdžiams.

Pandos laiko žymų konvertavimas į datą

Norėdami pradėti, turėsite turėti Pandas įdiegta jūsų Python aplinkoje. Pandas yra galinga biblioteka, teikianti duomenų apdorojimo ir analizės įrankius. Vienas iš svarbiausių Pandas objektų yra DataFrame, kuris leidžia lengvai valdyti ir analizuoti didelius duomenų kiekius naudojant įvairias funkcijas.

Norint pakeisti Pandas laiko žymų stulpelį į datą, reikia naudoti „dt“ priedą ir „datos“ atributą. Tarkime, kad jau turite DataFrame su laiko žymų stulpeliu. Kodas, skirtas konvertuoti, atrodytų taip:

import pandas as pd

# Assuming your DataFrame is named df and the column with timestamps is 'timestamp_col'
df['date_col'] = df['timestamp_col'].dt.date

Aukščiau pateiktas kodo fragmentas sukuria naują stulpelį pavadinimu „date_col“ „DataFrame“ ir jam priskiria „timestamp_col“ datos dalį.

Žingsnis po žingsnio Kodekso paaiškinimas

Dabar išskirkime kodą ir supraskime, ką daro kiekviena jo dalis.

1. Pirmiausia importuojame Pandas biblioteką naudodami įprastą pd slapyvardį:

   import pandas as pd
   

2. Toliau darome prielaidą, kad jau turite „DataFrame“ „df“, kuriame yra stulpelis su laiko žymomis, vadinamomis „timestamp_col“. Norėdami sukurti naują stulpelį su tik šių laiko žymų datos dalimi, naudojame „dt“ priedą, po kurio nurodomas atributas „data“:

   df['date_col'] = df['timestamp_col'].dt.date
   

Priedas „dt“ suteikia prieigą prie „Panda“ serijos datos ir laiko ypatybių, tokių kaip „metai“, „mėnuo“, „diena“ ir „data“. Šiuo atveju naudojome atributą „data“, kuris grąžina laiko žymų datos dalį.

Štai ir viskas! Naudodami šias paprastas kodo eilutes iki šiol sėkmingai konvertavote Pandos laiko žymų stulpelį.

Pandų biblioteka ir jos svarba

Pandas yra atvirojo kodo biblioteka, kuri tapo pagrindine duomenų apdorojimo ir analizės priemone Python. Jis siūlo platų funkcijų spektrą, todėl naudotojai gali išvalyti, transformuoti ir vizualizuoti duomenis vienu įrankiu. Pagrindiniai „Pandas“ objektai yra „DataFrame“ ir „Series“, kurie skirti tvarkyti įvairių tipų duomenis.

„DataFrame“ objektas yra dvimatė lentelė, kurioje gali būti įvairių duomenų tipų stulpelių, pvz., skaičių, eilučių, datų ir kt. Ji suteikia įvairių funkcijų, leidžiančių efektyviai pateikti užklausas, keisti ir analizuoti duomenis.

Kita vertus, serijos objektas yra vienmatis pažymėtas masyvas, galintis apdoroti bet kokio tipo duomenis. Serija iš esmės yra „DataFrame“ stulpelių kūrimo blokai.

Kitos naudingos duomenų manipuliavimo funkcijos „Pandas“.

„Pandas“ ne tik konvertuoja laiko žymes iki šiol, bet ir teikia daug kitų naudingų duomenų apdorojimo funkcijų. Kai kurie iš jų apima:

1. Filtravimas: Kai turite didelį duomenų rinkinį, gali būti scenarijų, kai norite filtruoti duomenis pagal tam tikras sąlygas. „Pandas“ pateikia kelis duomenų filtravimo metodus, pvz., „loc[]“, „iloc[]“ ir „query()“.

2. Grupavimas: Funkcija „groupby()“ leidžia grupuoti ir apibendrinti duomenis pagal vieną ar daugiau stulpelių, taip pat pateikiant efektyvius sprendimus analizuojant ir apibendrinant duomenis.

3. Sujungimas ir prisijungimas: Pandas turi integruotas funkcijas, tokias kaip "merge()" ir "join()", skirtas sujungti ir sujungti kelis DataFrame.

4. Trūkstamų duomenų tvarkymas: Realaus pasaulio duomenų rinkiniuose dažnai trūksta reikšmių, o „Pandas“ pateikia keletą būdų, kaip elgtis su šiais atvejais, pvz., „fillna()“, „dropna()“ ir „interpoliate()“.

Naudodami platų Pandas teikiamų funkcijų spektrą būsite gerai pasirengę atlikti įvairias duomenų tvarkymo užduotis ir atskleisti vertingų įžvalgų iš savo duomenų rinkinių.

Susijusios naujienos:

Palikite komentarą