Solved: convert any .pdf file into audio dev.to in Python

प्रौद्योगिकी की दुनिया तेजी से विकसित हो रही है, और नवीनतम रुझानों में से एक जो ध्यान आकर्षित कर रहा है वह है .pdf फ़ाइलों को ऑडियो में परिवर्तित करना। यह विभिन्न उद्देश्यों के लिए बेहद उपयोगी हो सकता है, जैसे सीखने की सामग्री, पहुंच, या स्क्रीन की आवश्यकता के बिना किसी पुस्तक या दस्तावेज़ का आनंद लेना। इस लेख में, हम इस समस्या के लिए पायथन समाधान पर गहराई से विचार करेंगे और आपकी .pdf फ़ाइलों को ऑडियो में परिवर्तित करने के लिए एक कार्यात्मक स्क्रिप्ट बनाने के लिए आवश्यक चरणों की व्याख्या करेंगे। इसके अतिरिक्त, हम इस प्रक्रिया में शामिल कुछ प्रमुख पुस्तकालयों और कार्यों पर चर्चा करेंगे। तो चलो शुरू हो जाओ!

पीडीएफ फाइलों को ऑडियो में बदलने के लिए पायथन समाधान

पायथन प्रोग्रामिंग भाषा ढेर सारी लाइब्रेरी और टूल प्रदान करती है जो डेवलपर्स को फ़ाइल रूपांतरण सहित कई प्रकार के कार्य करने में सक्षम बनाती है। ऐसी ही एक लाइब्रेरी है पीपीडीएफ2, जो हमें .pdf फ़ाइलों से टेक्स्ट निकालने की अनुमति देता है। निकाले गए टेक्स्ट को ऑडियो में बदलने के लिए, हम एक अन्य लाइब्रेरी का उपयोग कर सकते हैं जिसे कहा जाता है जीटीटीएस (गूगल टेक्स्ट-टू-स्पीच). यह टेक्स्ट से ऑडियो फ़ाइल उत्पन्न करने के लिए Google के टेक्स्ट-टू-स्पीच एपीआई का उपयोग करता है।

यहां Python का उपयोग करके .pdf फ़ाइल को ऑडियो फ़ाइल में परिवर्तित करने के लिए कोड का चरण-दर-चरण स्पष्टीकरण दिया गया है:

सबसे पहले, अपने टर्मिनल या कमांड प्रॉम्प्ट में निम्नलिखित कमांड निष्पादित करके आवश्यक लाइब्रेरी स्थापित करें:
```
  pip install PyPDF2 gtts
  
```
इसके बाद, इन पंक्तियों को जोड़कर अपनी पायथन स्क्रिप्ट की शुरुआत में आवश्यक लाइब्रेरी आयात करें:
```
  import PyPDF2
  from gtts import gTTS
  
```

.pdf फ़ाइल से टेक्स्ट निकालने के लिए एक फ़ंक्शन बनाएं:

  def extract_text_from_pdf(pdf_path):
      # Initialize the PdfFileReader object
      pdf_file = PyPDF2.PdfFileReader(pdf_path)
      
      # Extract text from each page
      full_text = ""
      for page_num in range(pdf_file.getNumPages()):
          text = pdf_file.getPage(page_num).extractText()
          full_text += text

      return full_text

निकाले गए टेक्स्ट को ऑडियो फ़ाइल में बदलने के लिए एक अन्य फ़ंक्शन बनाएं:

  def text_to_audio(text, output_audio_file):
      # Initialize the gTTS object
      tts = gTTS(text=text, lang='en', slow=False)
      
      # Save the audio file
      tts.save(output_audio_file)

अंत में, अपनी इच्छित .pdf फ़ाइल को ऑडियो में बदलने के लिए फ़ंक्शंस का उपयोग करें:
```
  pdf_file_path = "example.pdf"
  audio_output_file = "output_audio.mp3"

  extracted_text = extract_text_from_pdf(pdf_file_path)
  text_to_audio(extracted_text, audio_output_file)
  
```

अब जब हमने अपनी पायथन लिपि के लिए आवश्यक चरणों को कवर कर लिया है, तो आइए कुछ संबंधित पुस्तकालयों और कार्यों का पता लगाएं।

पायथन में वैकल्पिक पीडीएफ और टेक्स्ट प्रोसेसिंग उपकरण

जबकि हमने अपने उदाहरण में PyPDF2 और gTTS का उपयोग किया है, समान कार्यों के लिए Python पारिस्थितिकी तंत्र में अन्य लाइब्रेरी उपलब्ध हैं:

पीडीएफमाइनर: एक लाइब्रेरी जिसे पीडीएफ फाइलों से जानकारी निकालने के लिए डिज़ाइन किया गया है, जैसे पाठ, चित्र, मेटाडेटा और यहां तक कि फॉर्म डेटा भी। यह PyPDF2 की तुलना में पाठ निष्कर्षण और हेरफेर के लिए उपकरणों का अधिक व्यापक सेट प्रदान करता है।
पाठ: एक लाइब्रेरी जो पीडीएफ और माइक्रोसॉफ्ट ऑफिस फाइलों सहित विभिन्न फ़ाइल स्वरूपों से पाठ निकालना आसान बनाती है। यदि आपको एकाधिक फ़ाइल प्रकारों से टेक्स्ट निकालने की आवश्यकता है तो टेक्स्टट्रैक्ट एक बढ़िया विकल्प हो सकता है।
pyttsx3: पायथन के लिए एक ऑफ़लाइन और क्रॉस-प्लेटफ़ॉर्म टेक्स्ट-टू-स्पीच लाइब्रेरी। जबकि gTTS Google के API पर निर्भर करता है, pyttsx3 आपके सिस्टम के टेक्स्ट-टू-स्पीच इंजन का उपयोग करता है, ऑफ़लाइन कार्यक्षमता और गोपनीयता लाभ प्रदान करता है।

ये विकल्प आपकी विशिष्ट आवश्यकताओं के आधार पर अतिरिक्त सुविधाएँ और विकल्प प्रदान कर सकते हैं। बेझिझक उनका और अधिक अन्वेषण करें और वह चुनें जो आपके प्रोजेक्ट के लिए सबसे उपयुक्त हो।

इस पूरे लेख में, हमने .pdf फ़ाइलों को ऑडियो में बदलने के लिए एक पायथन समाधान प्रस्तुत किया है, एक कार्यात्मक स्क्रिप्ट बनाने के लिए आवश्यक चरणों की व्याख्या की है, और हमारे समाधान से संबंधित विभिन्न पुस्तकालयों और कार्यों पर चर्चा की है। इन दिशानिर्देशों का पालन करके और कोड के पीछे के तर्क को समझकर, आप आसानी से अपने ज्ञान का विस्तार कर सकते हैं और इस समाधान को अन्य फ़ाइल प्रारूपों या विभिन्न उपयोग के मामलों के लिए अनुकूलित कर सकते हैं। हैप्पी कोडिंग!

होम » अजगर » समाधान: किसी भी .pdf फ़ाइल को ऑडियो dev.to में कनवर्ट करें

पीडीएफ फाइलों को ऑडियो में बदलने के लिए पायथन समाधान

पायथन में वैकल्पिक पीडीएफ और टेक्स्ट प्रोसेसिंग उपकरण

एक टिप्पणी छोड़ दो उत्तर रद्द करे