conceptuel_12m

Références:

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:conceptual_12m')
  • Descriptif :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
  • Licence : L'ensemble de données peut être librement utilisé à toutes fins, bien que la reconnaissance de Google LLC ("Google") en tant que source de données soit appréciée. L'ensemble de données est fourni "TEL QUEL" sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.

  • Version : 0.0.0

  • Fractionnements :

Diviser Exemples
'train' 12423374
  • Caractéristiques :
{
    "image_url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "caption": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}