s3o4d

תיאור :

מערך הנתונים המתואר לראשונה בסעיף "אובייקטים תלת מימדיים של סטנפורד" במאמר Disentangling by Subspace Diffusion . הנתונים מורכבים מ-100,000 עיבודים של כל אחד מהאובייקטים של באני ודרקון ממאגר הסריקה התלת-ממדית של סטנפורד . ייתכן שעוד חפצים יתווספו בעתיד, אבל רק הארנב והדרקון משמשים בנייר. כל אובייקט מוצג עם תאורה מדוגמת אחידה מנקודה על 2-הכדור, וסיבוב תלת מימדי מדוגם אחיד. המצבים הסמויים האמיתיים מסופקים כמערכי NumPy יחד עם התמונות. התאורה ניתנת כ-3 וקטור עם נורמה יחידה, בעוד שהסיבוב מסופק הן כקווטרניון והן כמטריצה אורתוגונלית 3x3.

יש קווי דמיון רבים בין S3O4D לבין מערכי נתונים קיימים של ML benchmark כמו NORB , 3D Chairs , 3D Shapes ורבים אחרים, הכוללים גם עיבודים של קבוצה של אובייקטים בתנאי תנוחה והארה שונים. עם זאת, אף אחד ממערכי הנתונים הקיימים הללו לא כולל את מגוון הסיבובים המלא בתלת-ממד - רובם כוללים רק תת-קבוצה של שינויים בגובה ובאזימוט. תמונות S3O4D נדגמות באופן אחיד ובלתי תלוי מהמרחב המלא של סיבובים והארות, כלומר מערך הנתונים מכיל אובייקטים הפוכים ומוארים מאחור או מתחת. אנו מאמינים שזה הופך את S3O4D למתאים באופן ייחודי למחקר על מודלים גנרטיביים שבהם למרחב הסמוי יש טופולוגיה לא טריוויאלית, כמו גם לשיטות למידה מגוונות כלליות שבהן העקמומיות של הסעפת חשובה.

תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/deepmind/deepmind-research/tree/master/geomancer#stanford-3d-objects-for-disentangling-s3o4d
קוד מקור : tfds.datasets.s3o4d.Builder
גרסאות :
- 1.0.0 (ברירת מחדל): שחרור ראשוני.
גודל הורדה : 911.68 MiB
גודל מערך נתונים : 1.01 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :

לְפַצֵל	דוגמאות
`'bunny_test'`	20,000
`'bunny_train'`	80,000
`'dragon_test'`	20,000
`'dragon_train'`	80,000

מבנה תכונה :

FeaturesDict({
    'illumination': Tensor(shape=(3,), dtype=float32),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'pose_mat': Tensor(shape=(3, 3), dtype=float32),
    'pose_quat': Tensor(shape=(4,), dtype=float32),
})

תיעוד תכונה :

תכונה	מעמד	צוּרָה	Dtype
	FeaturesDict
תְאוּרָה	מוֹתֵחַ	(3,)	לצוף32
תמונה	תמונה	(256, 256, 3)	uint8
תווית	ClassLabel		int64
מחצלת_פוזה	מוֹתֵחַ	(3, 3)	לצוף32
pose_quat	מוֹתֵחַ	(4,)	לצוף32

מפתחות בפיקוח (ראה as_supervised doc ): None
איור ( tfds.show_examples ):

רְאִיָה

דוגמאות ( tfds.as_dataframe ):

ציטוט :

@article{pfau2020disentangling,
  title={Disentangling by Subspace Diffusion},
  author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
  S{\'e}bastian},
  journal={Advances in Neural Information Processing Systems (NeurIPS)},
  year={2020}
}

s3o4d קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

s3o4d