kavramsal_12m

Referanslar:

Bu veri kümesini TFDS'ye yüklemek için aşağıdaki komutu kullanın:

ds = tfds.load('huggingface:conceptual_12m')
  • Açıklama :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
  • Lisans : Veri kaynağı olarak Google LLC'nin ("Google") kabul edilmesi memnuniyetle karşılansa da, veri kümesi herhangi bir amaç için ücretsiz olarak kullanılabilir. Veri seti, açık veya zımni hiçbir garanti olmaksızın "OLDUĞU GİBİ" sağlanır. Google, veri kümesinin kullanımından kaynaklanan doğrudan veya dolaylı her türlü zarardan sorumlu değildir.

  • Sürüm : 0.0.0

  • Bölmeler :

Bölmek Örnekler
'train' 12423374
  • Özellikler :
{
    "image_url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "caption": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}