Løst: pandas Timedelta til postgres i Pandas

I en verden av dataanalyse er håndtering av tidsseriedata et avgjørende aspekt. Et av de mest brukte bibliotekene for dette formålet er **pandas** i programmeringsspråket Python. En vanlig oppgave når man jobber med tidsseriedata er å konvertere tidsforskjellene mellom ulike hendelser til et standardformat. Det er her pandas Timedelta kommer godt med. Men når du arbeider med databaser som PostgreSQL, kan det være litt vanskelig å lagre disse tidsdeltaene. I denne artikkelen vil vi diskutere hvordan du konverterer pandaer Timedelta til et format som kan lagres i PostgreSQL, og henter det samtidig som dens korrekte representasjon opprettholdes.

Løsning på problemet

Løsningen på dette problemet innebærer bruk av pandaer og psycopg2-biblioteker, som er mye brukt til henholdsvis datamanipulering og PostgreSQL-databasebehandling. Psycopg2-biblioteket har støtte for håndtering av tidsdeltaer, ved å bruke datatypen `intervall` i PostgreSQL. Vi vil utnytte denne funksjonen til å lagre pandaene våre Timedelta i PostgreSQL og hente den tilbake i riktig format.

Først, la oss importere de nødvendige bibliotekene og etablere en tilkobling til vår PostgreSQL-database.

import pandas as pd
import psycopg2

conn = psycopg2.connect(database="your_database",
                        user="your_user",
                        password="your_password",
                        host="your_host",
                        port="your_port")

pandaer Timedelta og PostgreSQL Interval

pandas Timedelta er et kraftig verktøy for å uttrykke tidsforskjeller på en konsistent og lesbar måte. Det er enkelt å lage og manipulere timedelta-objekter i pandaer, men når det gjelder å lagre dem i en PostgreSQL-database, må vi konvertere dem til riktig format.

PostgreSQL tilbyr datatypen "intervall" for å lagre tidsintervaller. Denne datatypen kan representere et tidsrom i forskjellige granulariteter, for eksempel dager, timer, minutter og sekunder. For å lagre en pandas Timedelta i en PostgreSQL-database, må vi konvertere den til et PostgreSQL-intervall.

La oss lage en prøvepanda DataFrame med en Timedelta-kolonne:

data = {'event_name': ['start', 'end'],
        'time': [pd.Timestamp('2021-01-01'), pd.Timestamp('2021-01-03')]}
df = pd.DataFrame(data)
df['difference'] = df['time'].diff()
print(df)

La oss nå lage en funksjon for å sette inn disse dataene i vår PostgreSQL-database og konvertere Timedelta-dataene til et PostgreSQL-kompatibelt intervall.

def insert_data(event_name, time, difference, conn):
    query = """
    INSERT INTO timedeltas (event_name, time, difference)
    VALUES (%s, %s, %s)
    """
    with conn.cursor() as cur:
        cur.execute(query, (event_name, time, difference))
    conn.commit()

Ved å bruke denne funksjonen kan vi sette inn våre pandas DataFrame-data i PostgreSQL-databasen:

for _, row in df.iterrows():
    event_name, time, difference = row['event_name'], row['time'], row['difference']
    insert_data(event_name, time, difference, conn)

Henter Timedeltas fra PostgreSQL

Når pandas Timedelta-data er lagret i PostgreSQL som intervaller, kan vi enkelt hente dem og konvertere dem tilbake til pandaer Timedelta mens vi leser dataene.

La oss lage en funksjon for å hente dataene fra vår PostgreSQL-tabell:

def fetch_data(conn):
    query = "SELECT event_name, time, difference FROM timedeltas"
    data = pd.read_sql(query, conn)
    data['difference'] = pd.to_timedelta(data['difference'])
    return data

Med denne funksjonen kan vi hente og skrive ut dataene fra vår PostgreSQL-database:

result = fetch_data(conn)
print(result)

Dataene hentet fra PostgreSQL har nå sine Timedeltas riktig representert som pandaer Timedeltas.

Avslutningsvis er det en enkel prosess å konvertere pandaer Timedelta til et format som passer for PostgreSQL-lagring og hente det i sin opprinnelige form. Ved å utnytte de kraftige pandaene og psycopg2-bibliotekene kan vi enkelt håndtere tidsseriedata og opprettholde dens riktige representasjon, både i vår dataanalyse og i databaselagringen vår.

Løsning på problemet

pandaer Timedelta og PostgreSQL Interval

Henter Timedeltas fra PostgreSQL

Legg igjen en kommentar Avbryt svar