konseptual_12m

Referensi:

Gunakan perintah berikut untuk memuat dataset ini di TFDS:

ds = tfds.load('huggingface:conceptual_12m')
  • Deskripsi :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
  • Lisensi : Kumpulan data dapat digunakan secara bebas untuk tujuan apa pun, meskipun pengakuan dari Google LLC ("Google") sebagai sumber data akan dihargai. Kumpulan data diberikan "SEBAGAIMANA ADANYA" tanpa jaminan apa pun, tersurat maupun tersirat. Google melepaskan semua tanggung jawab atas segala kerusakan, langsung atau tidak langsung, yang diakibatkan oleh penggunaan kumpulan data.

  • Versi : 0.0.0

  • Perpecahan :

Membelah Contoh
'train' 12423374
  • Fitur :
{
    "image_url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "caption": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}