dmlab

Zbiór danych Dmlab zawiera klatki obserwowane przez agenta działającego w środowisku DeepMind Lab, które są opatrzone adnotacją odległości między agentem a różnymi obiektami obecnymi w środowisku. Celem jest ocena zdolności modelu wizualnego do wnioskowania o odległościach od wejścia wizualnego w środowiskach 3D. Zestaw danych Dmlab składa się z kolorowych obrazów 360x480 w 6 klasach. Klasy to odpowiednio {blisko, daleko, bardzo daleko} x {nagroda dodatnia, nagroda ujemna}.

Rozdzielać Przykłady
'test' 22735
'train' 65550
'validation' 22628
  • Struktura funkcji :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
Nazwa pliku Tekst strunowy
obraz Obraz (360, 480, 3) uint8
etykieta Etykieta klasy int64

Wyobrażanie sobie

  • Cytat :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }