dmlab

מערך הנתונים Dmlab מכיל מסגרות שנצפו על ידי הסוכן הפועל בסביבת מעבדת DeepMind, המתוארות על ידי המרחק בין הסוכן לאובייקטים שונים הנמצאים בסביבה. המטרה היא להעריך את יכולתו של מודל ויזואלי לחשוב על מרחקים מהקלט החזותי בסביבות תלת מימד. מערך הנתונים של Dmlab מורכב מתמונות צבע 360x480 בשש מחלקות. השיעורים הם {קרוב, רחוק, רחוק מאוד} x {פרס חיובי, תגמול שלילי} בהתאמה.

לְפַצֵל דוגמאות
'test' 22,735
'train' 65,550
'validation' 22,628
  • מאפיינים:
FeaturesDict({
    'filename': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(360, 480, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
})

רְאִיָה

  • ציטוט:
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }