हल: बाउंडिंग बॉक्स

वस्तु का पता लगाना कंप्यूटर विज़न का एक महत्वपूर्ण पहलू है, जहाँ लक्ष्य किसी छवि में वस्तुओं की पहचान करना और उनका पता लगाना है। किसी छवि में ऑब्जेक्ट के स्थान को दर्शाने के तरीकों में से एक बाउंडिंग बॉक्स है। बाउंडिंग बॉक्स एक आयताकार बॉक्स है जिसकी गणना एक सरल तंत्र से की जा सकती है जिसमें बुनियादी गणित न्यूनतमकरण और अधिकतमकरण फ़ंक्शन शामिल है।

इसके अलावा, बॉक्स को दो निर्देशांकों द्वारा दर्शाया जा सकता है, ऊपरी बाएँ कोने का (x, y) और निचले दाएँ कोने का (x, y)। यह जानकारी विभिन्न वास्तविक जीवन के अनुप्रयोगों में, निगरानी से लेकर सेल्फ-ड्राइविंग कार उद्योग तक पेशेवरों की सेवा में महत्वपूर्ण साबित होती है।

समस्या कथन और समाधान

छवि और वस्तु का पता लगाने में हमारे सामने मुख्य समस्या यह है कि किसी छवि में किसी वस्तु के स्थान की सटीक पहचान कैसे की जाए। समाधान एक बाउंडिंग बॉक्स का उपयोग करना है, जिसकी गणना एक सरल तंत्र का उपयोग करके की जा सकती है जिसमें विभिन्न पायथन पुस्तकालय शामिल हैं।

अजगर इस कार्य के लिए एक उत्कृष्ट विकल्प है क्योंकि इसमें समृद्ध पुस्तकालय और उपकरण हैं जो प्रक्रिया को सरल बनाते हैं, इसे कुशल और सीधा बनाते हैं। आमतौर पर दो मुख्य पुस्तकालयों का उपयोग किया जाता है - OpenCV और Matplotlib।

एक OpenCV और Matplotlib दृष्टिकोण

OpenCV का मतलब ओपन सोर्स कंप्यूटर विज़न लाइब्रेरी है और इसमें कई सैकड़ों कंप्यूटर विज़न एल्गोरिदम शामिल हैं। दूसरी ओर, मैटप्लॉटलिब, पायथन प्रोग्रामिंग भाषा और इसके संख्यात्मक गणित एक्सटेंशन NumPy के लिए एक प्लॉटिंग लाइब्रेरी है। यह पायथन से डेटा और कई प्रारूपों में प्रकाशन-गुणवत्ता वाले आंकड़ों को देखने का एक बहुत ही त्वरित तरीका प्रदान करता है।

import cv2
import matplotlib.pyplot as plt

# read image
image = cv2.imread('input.jpg')

# our bounding box coordinates
box = (x1, y1, x2, y2) 

# Draw rectangle (bounding box)
cv2.rectangle(image, (box[0], box[1]), (box[2], box[3]), (0, 255, 0), 2)

# Display the image with bounding box
plt.imshow(image)
plt.show()

एक छवि को cv2 से imread विधि का उपयोग करके लोड किया जाता है, और फिर cv2.rectangel फ़ंक्शन का उपयोग करके एक बाउंडिंग बॉक्स तैयार किया जाता है जो छवि और 'बॉक्स' द्वारा दर्शाए गए दो निर्देशांक लेता है। अंतिम दो पैरामीटर क्रमशः रंग और मोटाई हैं। यह कोड आपकी छवि में वस्तुओं को पूरी तरह से एक बॉक्स से बंधा हुआ दिखाएगा।

बाउंडिंग बॉक्स का उपयोग

निष्कर्ष में, बाउंडिंग बॉक्स कंप्यूटर विज़न कार्यों में महत्वपूर्ण भूमिका निभाते हैं, जिसमें ऑब्जेक्ट डिटेक्शन, कंप्यूटर विज़न और इमेज प्रोसेसिंग शामिल हैं। वे छवियों के भीतर वस्तुओं और मेटाडेटा जानकारी का पता लगाने के लिए एक प्रभावी और कुशल समाधान प्रदान करते हैं। पायथन में बाउंडिंग बॉक्स को सटीक रूप से लागू करना सीखना सॉफ्टवेयर विकास, मशीन लर्निंग, या एआई करियर-वार में शामिल किसी भी व्यक्ति को अत्यधिक लाभान्वित कर सकता है। यह न केवल सुरक्षा और निगरानी में उपयोगी है, बल्कि यह चेहरे की पहचान और पहचान, पैदल यात्री का पता लगाने और सेल्फ-ड्राइविंग कारों में उन्नत ड्राइवर सहायता प्रणाली (एडीएएस) जैसे अनुप्रयोगों में भी काफी सहायता करता है।

संबंधित पोस्ट:

टिप्पणी करें