ফ্লিক

কাগজ থেকে: আমরা জনপ্রিয় হলিউড চলচ্চিত্র থেকে স্বয়ংক্রিয়ভাবে একটি 5003 ইমেজ ডেটাসেট সংগ্রহ করেছি। 30টি চলচ্চিত্রের প্রতি দশম ফ্রেমে একটি অত্যাধুনিক ব্যক্তি আবিষ্কারক চালিয়ে ছবিগুলি প্রাপ্ত করা হয়েছে। উচ্চ আত্মবিশ্বাসের সাথে শনাক্ত করা লোকদের (প্রায় 20 হাজার প্রার্থী) তারপর ক্রাউডসোর্সিং মার্কেটপ্লেস অ্যামাজন মেকানিক্যাল তুর্কে গ্রাউন্ডট্রুথলেবেলিং পাওয়ার জন্য পাঠানো হয়েছিল। 10টি উপরের বডি জয়েন্টগুলি লেবেল করার জন্য প্রতিটি চিত্রকে পাঁচটি তুর্কার প্রতিটি $0.01 দিয়ে টীকা করেছে৷ আউটলিয়ার টীকাটিকে শক্তিশালী করার জন্য প্রতিটি ছবিতে পাঁচটির মধ্যমা লেবেলিং নেওয়া হয়েছিল৷ অবশেষে, যদি ব্যক্তিটি আবদ্ধ বা গুরুতরভাবে নন-ফ্রন্টাল হয় তবে ছবিগুলি আমাদের দ্বারা ম্যানুয়ালি প্রত্যাখ্যান করা হয়েছিল। আমরা পরীক্ষার জন্য ডেটার 20% (1016 ছবি) আলাদা করে রেখেছি।

বিভক্ত উদাহরণ
'test' 1,016
'train' ৩,৯৮৭
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
currframe টেনসর float64
ইমেজ ছবি (480, 720, 3) uint8
সিনেমার নাম পাঠ্য স্ট্রিং
poselet_hit_idx ক্রম (টেনসর) (কোনটিই নয়,) uint16
টরসোবক্স বিবক্স ফিচার (৪,) float32
xcoords ক্রম (টেনসর) (কোনটিই নয়,) float64
ycoords ক্রম (টেনসর) (কোনটিই নয়,) float64
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • উদ্ধৃতি :

@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (ডিফল্ট কনফিগারেশন)

  • কনফিগার বিবরণ : CVPR13 MODEC কাগজে ব্যবহৃত 5003টি উদাহরণ ব্যবহার করে।

  • ডাউনলোড সাইজ : 286.35 MiB

  • চিত্র ( tfds.show_examples ):

ভিজ্যুয়ালাইজেশন

flic/পূর্ণ

  • কনফিগার বর্ণনা : 20928 উদাহরণ ব্যবহার করে, FLIC-এর একটি সুপারসেট যা আরও কঠিন উদাহরণ নিয়ে গঠিত।

  • ডাউনলোড আকার : 1.10 GiB

  • চিত্র ( tfds.show_examples ):

ভিজ্যুয়ালাইজেশন