pintar

Keterangan :

CLEVR adalah kumpulan data diagnostik yang menguji berbagai kemampuan penalaran visual. Ini mengandung bias minimal dan memiliki penjelasan rinci yang menjelaskan jenis alasan yang dibutuhkan setiap pertanyaan.

Dokumentasi Tambahan : Jelajahi Makalah Dengan Kode
Beranda : https://cs.stanford.edu/people/jcjohns/clevr/
Kode sumber : tfds.datasets.clevr.Builder
Versi :
- 3.0.0 : Tidak ada catatan rilis.
- 3.1.0 (default): Tambahkan teks pertanyaan/jawaban.
Ukuran unduhan : 17.72 GiB
Ukuran kumpulan data : 17.75 GiB
Cache otomatis ( dokumentasi ): Tidak
Perpecahan :

Membelah	Contoh
`'test'`	15.000
`'train'`	70.000
`'validation'`	15.000

Struktur fitur :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        '3d_coords': Tensor(shape=(3,), dtype=float32),
        'color': ClassLabel(shape=(), dtype=int64, num_classes=8),
        'material': ClassLabel(shape=(), dtype=int64, num_classes=2),
        'pixel_coords': Tensor(shape=(3,), dtype=float32),
        'rotation': float32,
        'shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'size': ClassLabel(shape=(), dtype=int64, num_classes=2),
    }),
    'question_answer': Sequence({
        'answer': Text(shape=(), dtype=string),
        'question': Text(shape=(), dtype=string),
    }),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Tipe D
	FiturDict
nama file	Teks		rangkaian
gambar	Gambar	(Tidak ada, Tidak ada, 3)	uint8
objek	Urutan
objek/3d_coords	Tensor	(3,)	float32
benda/warna	Label Kelas		int64
benda/bahan	Label Kelas		int64
objek/pixel_coords	Tensor	(3,)	float32
benda/rotasi	Tensor		float32
benda/bentuk	Label Kelas		int64
benda/ukuran	Label Kelas		int64
pertanyaan_jawaban	Urutan
pertanyaan_jawaban/jawaban	Teks		rangkaian
pertanyaan_jawaban/pertanyaan	Teks		rangkaian

Kunci yang diawasi (Lihat dokumen as_supervised ): None
Gambar ( tfds.show_examples ):

Visualisasi

Contoh ( tfds.as_dataframe ):

Kutipan :

@inproceedings{johnson2017clevr,
  title={ {CLEVR}: A diagnostic dataset for compositional language and elementary visual reasoning},
  author={Johnson, Justin and Hariharan, Bharath and van der Maaten, Laurens and Fei-Fei, Li and Lawrence Zitnick, C and Girshick, Ross},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  year={2017}
}

pintar Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

pintar