

다음 명령을 사용하여 TFDS에서 이 데이터세트를 로드합니다.

ds = tfds.load('huggingface:conceptual_12m')
  • 설명 :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
  • 라이선스 : 데이터 소스가 Google LLC("Google")임을 인정하더라도 데이터 세트는 어떤 목적으로든 자유롭게 사용할 수 있습니다. 데이터 세트는 명시적 또는 묵시적 보증 없이 "있는 그대로" 제공됩니다. Google은 데이터세트 사용으로 인해 발생하는 직간접적인 손해에 대해 모든 책임을 지지 않습니다.

  • 버전 : 0.0.0

  • 분할 :

'train' 12423374
  • 특징 :
    "image_url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "caption": {
        "dtype": "string",
        "id": null,
        "_type": "Value"