छवि प्रसंस्करण पाइपलाइन को कॉन्फ़िगर करने के विकल्प, जो अनुमान से पहले संचालित होते हैं।
टास्क लाइब्रेरी विज़न एपीआई रुचि के क्षेत्र में इनपुट छवि पर छवि प्रीप्रोसेसिंग करता है, ताकि यह मॉडल आवश्यकताओं (उदाहरण के लिए सीधे 224x224 आरजीबी) को फिट कर सके और संबंधित इनपुट टेंसर को पॉप्युलेट कर सके। यह (इस क्रम में) द्वारा किया जाता है:
- फ़्रेम बफ़र को रुचि के क्षेत्र में क्रॉप करना (जो, ज्यादातर मामलों में, संपूर्ण इनपुट छवि को कवर करता है),
- मॉडल इनपुट टेंसर के आयामों के अनुसार इसका आकार बदलना (बिलिनियर इंटरपोलेशन, पहलू-अनुपात *नहीं* संरक्षित) के साथ,
- इसे इनपुट टेंसर के कलरस्पेस में परिवर्तित करना (यानी आरजीबी, जो अभी के लिए एकमात्र समर्थित कलरस्पेस है),
- इसे इसके
ImageProcessingOptions.Orientation
के अनुसार घुमाना ताकि अनुमान एक "सीधी" छवि पर लगाया जा सके।
महत्वपूर्ण: सबसे पहले होने वाली क्रॉपिंग के परिणामस्वरूप, ब्याज का प्रदान किया गया क्षेत्र संदर्भ निर्देशांक प्रणाली के अनियंत्रित फ्रेम में व्यक्त किया जाता है, अर्थात [0, TensorImage.getWidth()) x [0, TensorImage.getHeight())
में, जो हैं किसी भी अभिविन्यास को लागू करने से पहले अंतर्निहित छवि डेटा के आयाम। यदि क्षेत्र इन सीमाओं से बाहर है, तो अनुमान विधि, जैसे ImageClassifier.classify(MlImage)
त्रुटि लौटाएगी।
नेस्टेड क्लासेस
कक्षा | ImageProcessingOptions.बिल्डर | ImageProcessingOptions के लिए बिल्डर। | |
enum | ImageProcessingOptions.ओरिएंटेशन | ओरिएंटेशन प्रकार जो EXIF विनिर्देशन का अनुसरण करता है। |
सार्वजनिक निर्माता
सार्वजनिक तरीके
स्थिर ImageProcessingOptions.Builder | बिल्डर () |
सार ImageProcessingOptions.Orientation | |
सार रेक्ट | getRoi () |