वस्तु का पता लगाना कंप्यूटर विज़न का एक महत्वपूर्ण पहलू है, जहाँ लक्ष्य किसी छवि में वस्तुओं की पहचान करना और उनका पता लगाना है। किसी छवि में ऑब्जेक्ट के स्थान को दर्शाने के तरीकों में से एक बाउंडिंग बॉक्स है। बाउंडिंग बॉक्स एक आयताकार बॉक्स है जिसकी गणना एक सरल तंत्र से की जा सकती है जिसमें बुनियादी गणित न्यूनतमकरण और अधिकतमकरण फ़ंक्शन शामिल है।
इसके अलावा, बॉक्स को दो निर्देशांकों द्वारा दर्शाया जा सकता है, ऊपरी बाएँ कोने का (x, y) और निचले दाएँ कोने का (x, y)। यह जानकारी विभिन्न वास्तविक जीवन के अनुप्रयोगों में, निगरानी से लेकर सेल्फ-ड्राइविंग कार उद्योग तक पेशेवरों की सेवा में महत्वपूर्ण साबित होती है।
समस्या कथन और समाधान
छवि और वस्तु का पता लगाने में हमारे सामने मुख्य समस्या यह है कि किसी छवि में किसी वस्तु के स्थान की सटीक पहचान कैसे की जाए। समाधान एक बाउंडिंग बॉक्स का उपयोग करना है, जिसकी गणना एक सरल तंत्र का उपयोग करके की जा सकती है जिसमें विभिन्न पायथन पुस्तकालय शामिल हैं।
अजगर इस कार्य के लिए एक उत्कृष्ट विकल्प है क्योंकि इसमें समृद्ध पुस्तकालय और उपकरण हैं जो प्रक्रिया को सरल बनाते हैं, इसे कुशल और सीधा बनाते हैं। आमतौर पर दो मुख्य पुस्तकालयों का उपयोग किया जाता है - OpenCV और Matplotlib।
एक OpenCV और Matplotlib दृष्टिकोण
OpenCV का मतलब ओपन सोर्स कंप्यूटर विज़न लाइब्रेरी है और इसमें कई सैकड़ों कंप्यूटर विज़न एल्गोरिदम शामिल हैं। दूसरी ओर, मैटप्लॉटलिब, पायथन प्रोग्रामिंग भाषा और इसके संख्यात्मक गणित एक्सटेंशन NumPy के लिए एक प्लॉटिंग लाइब्रेरी है। यह पायथन से डेटा और कई प्रारूपों में प्रकाशन-गुणवत्ता वाले आंकड़ों को देखने का एक बहुत ही त्वरित तरीका प्रदान करता है।
import cv2 import matplotlib.pyplot as plt # read image image = cv2.imread('input.jpg') # our bounding box coordinates box = (x1, y1, x2, y2) # Draw rectangle (bounding box) cv2.rectangle(image, (box[0], box[1]), (box[2], box[3]), (0, 255, 0), 2) # Display the image with bounding box plt.imshow(image) plt.show()
एक छवि को cv2 से imread विधि का उपयोग करके लोड किया जाता है, और फिर cv2.rectangel फ़ंक्शन का उपयोग करके एक बाउंडिंग बॉक्स तैयार किया जाता है जो छवि और 'बॉक्स' द्वारा दर्शाए गए दो निर्देशांक लेता है। अंतिम दो पैरामीटर क्रमशः रंग और मोटाई हैं। यह कोड आपकी छवि में वस्तुओं को पूरी तरह से एक बॉक्स से बंधा हुआ दिखाएगा।
बाउंडिंग बॉक्स का उपयोग
निष्कर्ष में, बाउंडिंग बॉक्स कंप्यूटर विज़न कार्यों में महत्वपूर्ण भूमिका निभाते हैं, जिसमें ऑब्जेक्ट डिटेक्शन, कंप्यूटर विज़न और इमेज प्रोसेसिंग शामिल हैं। वे छवियों के भीतर वस्तुओं और मेटाडेटा जानकारी का पता लगाने के लिए एक प्रभावी और कुशल समाधान प्रदान करते हैं। पायथन में बाउंडिंग बॉक्स को सटीक रूप से लागू करना सीखना सॉफ्टवेयर विकास, मशीन लर्निंग, या एआई करियर-वार में शामिल किसी भी व्यक्ति को अत्यधिक लाभान्वित कर सकता है। यह न केवल सुरक्षा और निगरानी में उपयोगी है, बल्कि यह चेहरे की पहचान और पहचान, पैदल यात्री का पता लगाने और सेल्फ-ड्राइविंग कारों में उन्नत ड्राइवर सहायता प्रणाली (एडीएएस) जैसे अनुप्रयोगों में भी काफी सहायता करता है।