इस पेज का अनुवाद Cloud Translation API से किया गया है.
Switch to English

Flic

  • विवरण :

कागज से: हमने लोकप्रिय हॉलीवुड फिल्मों से स्वचालित रूप से 5003 छवि डेटासेट एकत्र किए। छवियों को 30 फिल्मों के हर दसवें फ्रेम पर एक अत्याधुनिक व्यक्ति डिटेक्टर चलाकर प्राप्त किया गया था। उच्च आत्मविश्वास (लगभग 20K उम्मीदवारों) के साथ पाए गए लोगों को तब ग्राउंडट्रूथथैब्लिंग प्राप्त करने के लिए क्राउडसोर्सिंग मार्केटप्लेस अमेज़ॅन मैकेनिकल तुर्क में भेजा गया था। प्रत्येक छवि 10 ऊपरी जोड़ों को लेबल करने के लिए $ 0.01 प्रत्येक के लिए पांच तुर्क द्वारा एनोटेट किया गया था। मध्य-प्रति-पांच लेबलिंग को प्रत्येक छवि में लिया गया था ताकि वे बाहरी रूप से एनोटेशन से मजबूत हो सकें। अंत में, छवियों को हमारे द्वारा मैन्युअल रूप से अस्वीकार कर दिया गया था यदि व्यक्ति को रोक दिया गया था या गंभीर रूप से गैर-ललाट था। हमने परीक्षण के लिए डेटा का 20% (1016 चित्र) अलग रखा।

विभाजित करें उदाहरण
'test' 1,016
'train' 3987
  • विशेषताएं :
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / छोटा (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • विन्यास विवरण : CVPR13 MODEC कागज में प्रयुक्त 5003 उदाहरणों का उपयोग करता है।

  • डाउनलोड का आकार : 286.35 MiB

  • विज़ुअलाइज़ेशन ( tfds.show_examples ):

दृश्य

Flic / पूर्ण

  • विन्यास विवरण : 20928 उदाहरणों का उपयोग करता है, FLIC का एक सुपरसेट जिसमें अधिक कठिन उदाहरण हैं।

  • डाउनलोड का आकार : 1.10 GiB

  • विज़ुअलाइज़ेशन ( tfds.show_examples ):

दृश्य