हल: टेबल पांडा से पोस्टग्रेस्क्ल

डेटा विश्लेषण और हेरफेर की दुनिया में, सबसे लोकप्रिय पायथन पुस्तकालयों में से एक है पांडा. यह संरचित डेटा के साथ काम करने के लिए कई प्रकार के शक्तिशाली उपकरण प्रदान करता है, जिससे हेरफेर करना, कल्पना करना और विश्लेषण करना आसान हो जाता है। डेटा विश्लेषक के सामने आने वाले कई कार्यों में से एक डेटा आयात करना है CSV एक में फ़ाइल पोस्टग्रेएसक्यूएल डेटाबेस। इस लेख में, हम चर्चा करेंगे कि दोनों का उपयोग करके इस कार्य को प्रभावी ढंग से और कुशलता से कैसे किया जाए पांडा और मानस २ पुस्तकालय। हम समाधान की व्यापक समझ प्रदान करते हुए इस प्रक्रिया में शामिल विभिन्न कार्यों और पुस्तकालयों का भी पता लगाएंगे।

पांडा और पोस्टग्रेएसक्यूएल का परिचय

पांडा एक शक्तिशाली पायथन पुस्तकालय है जो डेटा विश्लेषण के लिए उपयोग में आसान डेटा संरचना और डेटा हेरफेर फ़ंक्शन प्रदान करता है। बड़े डेटा सेट के साथ काम करते समय या जब आपको जटिल डेटा परिवर्तन करने की आवश्यकता होती है तो यह विशेष रूप से उपयोगी होता है। दूसरी ओर, PostgreSQL, एक स्वतंत्र और ओपन-सोर्स ऑब्जेक्ट-रिलेशनल डेटाबेस मैनेजमेंट सिस्टम (ORDBMS) है, जो एक्स्टेंसिबिलिटी और SQL अनुपालन पर जोर देता है। यह बड़े पैमाने पर, जटिल डेटा प्रबंधन कार्यों के लिए व्यापक रूप से उपयोग किया जाता है।

अब, मान लें कि हमारे पास एक CSV फ़ाइल है जिसमें एक बड़ा डेटासेट है, और हम इसे PostgreSQL डेटाबेस में आयात करना चाहते हैं। इस कार्य को प्राप्त करने का एक सामान्य तरीका psycopg2 लाइब्रेरी के संयोजन में पंडों का उपयोग करना है, जो PostgreSQL डेटाबेस के लिए एक एडेप्टर प्रदान करता है जो हमें पायथन का उपयोग करके इसके साथ संवाद करने की अनुमति देता है।

पांडा: सीएसवी फाइलें पढ़ना

हमारी प्रक्रिया का पहला चरण पांडा का उपयोग करके हमारी CSV फ़ाइल की सामग्री को पढ़ना है।

import pandas as pd

filename = "example.csv"
df = pd.read_csv(filename)

यह कोड का उपयोग करता है pd.read_csv () फ़ंक्शन, जो CSV फ़ाइल पढ़ता है और DataFrame ऑब्जेक्ट देता है। DataFrame ऑब्जेक्ट के साथ, हम आसानी से डेटा में हेरफेर और विश्लेषण कर सकते हैं।

PostgreSQL डेटाबेस से कनेक्ट करना

अगला चरण psycopg2 लाइब्रेरी का उपयोग करके हमारे PostgreSQL डेटाबेस से जुड़ना है। ऐसा करने के लिए, हमें psycopg2 लाइब्रेरी स्थापित करने की आवश्यकता है, जिसे पिप का उपयोग करके किया जा सकता है:

pip install psycopg2

एक बार पुस्तकालय स्थापित हो जाने के बाद, हमें अपने PostgreSQL डेटाबेस से जुड़ने की आवश्यकता है:

import psycopg2

connection = psycopg2.connect(
    dbname="your_database_name",
    user="your_username",
    password="your_password",
    host="your_hostname",
    port="your_port",
)

RSI psycopg2.connect () फ़ंक्शन प्रदान किए गए क्रेडेंशियल्स का उपयोग करके डेटाबेस सर्वर के साथ एक कनेक्शन स्थापित करता है। यदि कनेक्शन सफल होता है, तो फ़ंक्शन एक कनेक्शन ऑब्जेक्ट देता है जिसका उपयोग हम डेटाबेस के साथ इंटरैक्ट करने के लिए करेंगे।

PostgreSQL में टेबल बनाना

अब जब हमारे पास DataFrame ऑब्जेक्ट में हमारा डेटा है और PostgreSQL डेटाबेस से कनेक्शन है, तो हम अपने डेटा को स्टोर करने के लिए डेटाबेस में एक टेबल बना सकते हैं।

cursor = connection.cursor()
create_table_query = '''
CREATE TABLE IF NOT EXISTS example_table (
    column1 data_type,
    column2 data_type,
    ...
)
'''
cursor.execute(create_table_query)
connection.commit()

इस कोड स्निपेट में, हम पहले एक कर्सर ऑब्जेक्ट बनाते हैं कनेक्शन.कर्सर () तरीका। कर्सर का उपयोग डेटाबेस संचालन करने के लिए किया जाता है जैसे टेबल बनाना और डेटा डालना। अगला, हम तालिका बनाने के लिए एक SQL क्वेरी को परिभाषित करते हैं, और इसका उपयोग करके इसे निष्पादित करते हैं कर्सर निष्पादित () तरीका। अंत में, हम डेटाबेस में परिवर्तन करते हैं कनेक्शन.कमिट ().

PostgreSQL डेटाबेस में डेटा सम्मिलित करना

अब जब हमारे पास एक तालिका है, तो हम अपने डेटाफ़्रेम से डेटा को PostgreSQL डेटाबेस में उपयोग करके सम्मिलित कर सकते हैं to_sql () पंडों द्वारा प्रदान की गई विधि।

from sqlalchemy import create_engine

engine = create_engine("postgresql://your_username:your_password@your_hostname:your_port/your_database_name")
df.to_sql("example_table", engine, if_exists="append", index=False)

इस कोड स्निपेट में, हम सबसे पहले एक डेटाबेस इंजन का उपयोग करके बनाते हैं create_engine () SQLAlchemy लाइब्रेरी का कार्य, जिसके लिए हमारे डेटाबेस क्रेडेंशियल्स वाली कनेक्शन स्ट्रिंग की आवश्यकता होती है। फिर, हम उपयोग करते हैं to_sql () हमारे DataFrame से डेटा को PostgreSQL डेटाबेस में "example_table" तालिका में सम्मिलित करने की विधि।

अंत में, यह लेख पांडा और psycopg2 का उपयोग करके CSV फ़ाइल से पोस्टग्रेएसक्यूएल डेटाबेस में डेटा आयात करने के तरीके पर एक व्यापक मार्गदर्शिका प्रदान करता है। पंडों में डेटा हेरफेर की आसानी को PostgreSQL की शक्ति और मापनीयता के साथ जोड़कर, हम एक डेटाबेस में CSV डेटा आयात करने के सामान्य कार्य के लिए एक सहज और कुशल समाधान प्राप्त कर सकते हैं।

संबंधित पोस्ट:

एक टिप्पणी छोड़ दो