koncepcyjne_12m

Bibliografia:

Użyj następującego polecenia, aby załadować ten zestaw danych w TFDS:

ds = tfds.load('huggingface:conceptual_12m')
  • Opis :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
  • Licencja : zestaw danych może być swobodnie używany w dowolnym celu, chociaż mile widziane byłoby uznanie Google LLC („Google”) jako źródła danych. Zestaw danych jest dostarczany „TAK JAK JEST” bez żadnych gwarancji, wyraźnych ani dorozumianych. Google zrzeka się wszelkiej odpowiedzialności za jakiekolwiek szkody, bezpośrednie lub pośrednie, wynikające z korzystania ze zbioru danych.

  • Wersja : 0.0.0

  • Dzieli :

Rozdzielać Przykłady
'train' 12423374
  • Cechy :
{
    "image_url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "caption": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}