- توضیحات :
مجموعه داده برای اولین بار در مقاله "اشیا 3D سه بعدی استنفورد" مقاله Disentangling by Subspace Diffusion شرح داده شد . داده ها از 100000 رندر تشکیل شده است که هر یک از اشیای بانی و اژدها از مخزن اسکن سه بعدی استنفورد تهیه شده است . ممکن است در آینده اشیای بیشتری اضافه شود ، اما فقط از اسم حیوان دست اموز و اژدها در مقاله استفاده شده است. هر شی با نورپردازی نمونه ای یکنواخت از یک نقطه در 2 کره ، و یک چرخش سه بعدی نمونه برداری یکنواخت ارائه می شود. حالت های نهفته واقعی به عنوان آرایه های NumPy همراه با تصاویر ارائه می شوند. نور به عنوان یک بردار 3 با هنجار واحد داده می شود ، در حالی که چرخش هم به صورت کواترنیوم و هم به صورت ماتریس متعامد 3x3 ارائه می شود.
شباهت های زیادی بین S3O4D و مجموعه داده های معیار ML موجود مانند NORB ، صندلی های 3D ، اشکال 3D و بسیاری دیگر وجود دارد ، که همچنین شامل رندر مجموعه ای از اشیا در حالت های مختلف ژست و نور است. با این حال ، هیچ یک از این مجموعه های داده موجود ، منیفول کامل چرخش ها را به صورت سه بعدی شامل نمی شوند - بیشتر آنها فقط شامل زیرمجموعه ای از تغییرات ارتفاع و آزیموت هستند. از تصاویر S3O4D به طور یکنواخت و به طور مستقل از فضای کامل چرخش ها و نورپردازی ها نمونه برداری می شود ، به این معنی که مجموعه داده شامل اشیایی است که به صورت وارونه هستند و از پشت یا زیر روشن می شوند. ما معتقدیم که این باعث می شود S3O4D به طور منحصر به فرد برای تحقیق در مورد مدل های تولیدی که فضای نهان دارای توپولوژی غیر پیش پا افتاده است ، و همچنین برای روش های کلی یادگیری منیفولد که انحنای منیفولد مهم است ، مناسب باشد.
کد منبع :
tfds.image.s3o4d.S3o4d
نسخه ها :
-
1.0.0
(پیش فرض): نسخه اولیه.
-
اندازه
911.68 MiB
:911.68 MiB
اندازه مجموعه داده :
1.01 GiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'bunny_test' | 20،000 |
'bunny_train' | 80،000 |
'dragon_test' | 20،000 |
'dragon_train' | 80،000 |
- ویژگی ها :
FeaturesDict({
'illumination': Tensor(shape=(3,), dtype=tf.float32),
'image': Image(shape=(256, 256, 3), dtype=tf.uint8),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'pose_mat': Tensor(shape=(3, 3), dtype=tf.float32),
'pose_quat': Tensor(shape=(4,), dtype=tf.float32),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):None
نقل قول :
@article{pfau2020disentangling,
title={Disentangling by Subspace Diffusion},
author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
S{\'e}bastian},
journal={Advances in Neural Information Processing Systems (NeurIPS)},
year={2020}
}
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):